当前位置：自学咖网 > 技术教程 > Pyhton常见问题 > python入门——爬取整个网页源码

hmoban Pyhton常见问题 2023-10-10

python入门——爬取整个网页源码

一、源码

使用request库爬取整个网页

 1 import requests
 2 # encoding:utf-8  #默认格式utf-8
 3 
 4 def get_html(url): #爬取源码函数
 5     headers = {
 6         "User-Agent": "Mozilla/5.0(Macintosh; Intel Mac OS X 10_11_4)
 7         AppleWebKit/537.36(KHTML, like Gecko) Chrome/52 .0.2743. 116 Safari/537.36"
 8 
 9     }  # 模拟浏览器访问
10     response = requests.get(url, headers=headers)  # 请求访问网站
11     response.encoding = response.apparent_encoding #设置字符编码格式
12     html = response.text  # 获取网页源码
13     return html  # 返回网页源码
14 
15 r = get_html("https://www.baidu.com/")
16 print(r) #打印网页源码

hmoban主题是根据ripro二开的主题，极致后台体验，无插件，集成会员系统
自学咖网 » python入门——爬取整个网页源码

hmoban 普通

分享到：

相关推荐

mysql怎么实现分表

mysql分表的方法： 1、做mysql集群，例如：利用mysql cluster ，mysql proxy，mysql replication，drdb等等有人会问mysql集群，根分表有什么关系吗？虽然它不是实际意...

Pyhton常见问题 2023-11-09
102

python怎样去除制表符

python去除制表符的方法：首先利用split()函数通过指定分隔符对字符串进行切片；然后利用join()函数将切片后的元素以指定的字符连接生成一个新的字符串。具体方法如：【print(''.joi...

Pyhton常见问题 2023-10-31
119

Python怎么判断是哪一天

python判断是哪一天的方法1:先判断是否是闰年，然后再利用求和，得出某一天是第几天 # 方法1:low版 def func1(year, month, day): ...

Pyhton常见问题 2023-11-03
114

怎么在jupyter中打开py文件

问题描述：文件夹下有xx.py格式的python文件，想要在Jupyter Notebook中运行该文件。解决办法：方法1：利用 %run xx.py 直接运行得出结果。方法2：利用 %load ...

Pyhton常见问题 2023-11-15
105

学python编程语言能找什么工作

Python 作为一种功能强大的编程语言，因其简单易学而受到很多开发者的青睐。那么，Python 的应用领域有哪些呢？概括起来，Python 的应用领域主要有如下几个。 Web应用开发 Python 经常被用于 Web...

Pyhton常见问题 2023-11-20
116

python环境变量配置不了怎么解决

要使用python语言，就需要有一个python的运行和开发环境。学习一门语言，环境的搭建很重要，如果环境配置有问题，那么所有的代码运行起来都会有bug，所以，要先配置好环境变量。在 Windows 系统上安装 Pyt...

Pyhton常见问题 2023-12-01
122

自学咖网