手抄报 安全手抄报 手抄报内容 手抄报图片 英语手抄报 清明节手抄报 节约用水手抄报

利用浏览器插件抓取海量信息

时间:2024-10-12 01:43:51

1、第一步,要有chrome流程器,安装web scraper插件。插件可以到chrome拓展中找,也可以下载后拖入到拓展页面安装。

利用浏览器插件抓取海量信息

2、在要抓取的页面,按F12,进入开发者模式,选择web scrape选项卡

利用浏览器插件抓取海量信息

3、新建一个抓取

利用浏览器插件抓取海量信息

4、填写抓取名字,抓取页面的链接地址

利用浏览器插件抓取海量信息

5、点击add new 衡痕贤伎selector ,开始创建抓取的页面内容。selector id填写英文,type根据要抓取的类型选,如果要抓取文眺螗熨膣本则选择text.在selector那点击select,在页面里点选要抓取的元素,待所有要抓取的元素变红,点击done selecting。勾选Multiple,点击save selector,几个选择器就选择完毕。

利用浏览器插件抓取海量信息

6、点击Sitemapscrape01,选择scrape,设置时间后,就可以自动抓取

利用浏览器插件抓取海量信息

7、抓取完成后,可选择保存到表格中,点击下载。

利用浏览器插件抓取海量信息
© 手抄报圈