手抄报 安全手抄报 手抄报内容 手抄报图片 英语手抄报 清明节手抄报 节约用水手抄报

如何用python获取html标签内内容

时间:2024-11-03 15:19:20

1、使用pip工具安装BeautifulSoup 模块,命令如下:Python3以上 使用:$ pip installBeautifulSoup4 python2.7 使用命令:$ pip installBeautifulSoup

如何用python获取html标签内内容

2、导入BeautifulSoup 模块,代码如下:from bs4 import BeautifulSoup

如何用python获取html标签内内容

3、创建一段html文档字符串,代码如下:html_str= '''争犸禀淫<html> <head> <title>&造婷用痃lt;/title> </head> <body> <div class="nav">百度经验</div> </body></html>'''

如何用python获取html标签内内容

4、使用BeautifulSoup 加载html 文档,代码如下:bs_xml = BeautifulSoup(html_str)print(bs_xml.prettify())

如何用python获取html标签内内容

5、解析标签内容,代码如下:div =bs_xml.findAll('div',{'class':'nav'})div[0].contents

如何用python获取html标签内内容

6、全部代码:from bs4 import BeautifulSouphtml_str= '''<html> <head&爿讥旌护gt; <title></title> </head> <body> <div class="nav">百度经验</div> </body></html>'''bs_xml = BeautifulSoup(html_str)print(bs_xml.prettify())div =bs_xml.findAll('div',{'class':'nav'})div[0].contents

© 手抄报圈