1、先介绍第一种,通过正则匹配a标签下面的href属性先写一个标准的html,如下图:
2、先用正则匹配的方式来识别使用正则首先需要导入相关的腻戴怯猡包importre然后创建正则表达式pattern='<a.*?href="(.+)".忮氽阝另*?>(.*?)</a>'
3、用re.search可以查找到第一个用re.findall可以查找到所有的
4、还可以使用BeautifulSoup直接方便的省略掉正则表达式用类库,需要自己先安装安装之后导入即可from bs4 import BeautifulSoup初始化soup = BeautifulSoup(html, 'html.parser')可以查找到所有的a标签soup.find_all('a')
5、找到所有的a标签,然后我们在从a标签中查找到href的值就可以了使用for循环找出所有的a标签,href的值