1、首先我们需要用到OutWit Hub light,这款功能强大、操作简洁的采集软件 去下载安装
2、安装好之后,需要用到瘾廛装钒左侧树状结构中几个功能。 ① page 为默认的主体界面,也就是正常访问的网页效果。 ② guess 为软件自动分析页面得出来的结果,在这里不太建议使用,因为机器得出的结果还是不太准确。 ③ scraped 为设定自定义采集规则之后生成的结果,也就是scrapers⑤生成出来的结果。 ④ source 为页面的源代码,相当于平时使用浏览器打开网页时,右键查看源代码的效果。 ⑤ scrapers 为设置自定义采集规则的项目。
3、打开工具 输入你要的内容 比如一些url等 回车搜索 工具会显示他抓取的页面
4、你看 也会显示页面 抓到的url 与网页
5、在file那里 可以提出你要的内容 比如你只要图片或只要某些你可以只要你需要的内容导出为excel表格和sql语句 非常方便
6、也可以在需要的地方点击鼠标右键 一不小心就能发现正好自己需要的那个功能