手抄报 安全手抄报 手抄报内容 手抄报图片 英语手抄报 清明节手抄报 节约用水手抄报

python爬虫基础操作

时间:2024-10-12 10:49:35

1、首先,打开python编辑器新建立一个程序,将新建立的python程序命名为python爬虫,这样第一步就完成了。

python爬虫基础操作

2、下一步,引入python的内置库request这个是内置的·爬虫库,不需要下载,可以直接引用,也是最基础的爬虫库。

python爬虫基础操作

3、还要运用到的一个库是python的第三方库,这个需要下载,主要是解析获取的代码,并使代码以规则的形式显示。

python爬虫基础操作

4、下面介绍一下python第三方库BeautifulSoup的安装方法,主要运用CMD命令来安装,在命令中pip install+第三方库的名字就可以了,系统接收到命令后会自行搜集数据并安装。

python爬虫基础操作

5、正确引入两个库后,先定义一个接收网址的字符,然后运用get()指令爬取你想爬取的网页代码,截取你想要显示的区域,运用text[]指令,然后在运用BeautifulSoup库进行解析是获取的代码成规则排列显示在输出框中。

python爬虫基础操作
python爬虫基础操作

6、下面附上代码与最终显示的效果,与大家共勉。

python爬虫基础操作
© 手抄报圈