1、步骤一:采集结果预览

2、步骤二:新建采集任务1、复制网页
3、新建智能模式采集任务您可以在软件上直接新建采集任务,也可以通过导入规则来创建任务。

4、步骤三:配置采集规则1、设置提取数据字段软件自动识别出字段后,我们可以右击字目愿硅囫段进行相关设置,包括修改字段名称、增减字段、处理数据等。

5、字段设置效果如下:

6、使用深入采集功能提取详情页数据由于我们需要采集更多的电子书信息,所以我们需要右击“小说链接 ”使用深入采集功能,跳转到详情页进行采集。

7、字段设置效果如下:

8、设置分页按钮软件能够自动识别出豆瓣下一页的数据,但是在任务采集过程中有时候会出现页面加载不出来的情况,我们可以在原先分页设置的基础上加一个瀑布流分页(滚动加载)的按钮,设置效果如下:

9、步骤四:设置并启动采集任务

10、步骤五:导出并查看数据
