1、搜索想要采集的二手车网站,进入买车列表页;打开简数数据采集平台网页,登录进入控制台(没账号自己注册),点击创建采集任务,输入相关信息;
2、下一步,点击列表提取器进入列表页选择采集的链接;这里是可视化操作,不懂代码也可以操作;先点击‘重置当前字段配置’,再去点击车链接,选择两个时系统会自动识别类似链接,完成后记得点击保存;PS:绿色框的代表该处为已选择内容;
3、下一步,同理进入详情页提金泫险缋取器,查看各字段内容是否需要修改;这里也是可视化操作,分别修改title和content字段等对应的内容,选择的内容会以绿色框表示,完成后记得点击保存,详情看图片;完成全部设置后,点击启动运行,等待采集完成;PS:1. 该例子首次出现的不是车辆详情页,通过点击“典型详情页网址”栏出现下拉链接列表,从中选择正确的详情页来配置;2. title,content等字段可以勾选上“采集结果不得为空”,来过滤掉非详情页的采集;3. 该例子修改了tag字段,修改为price字段,添加pic字段;
4、创建发布目标(以发布到织梦DEDE为例)在采集任务管理页面,找到“发布目标管理”==》点击按钮“+织梦DEDE”;在“设就女蒿鸳置对应字段”页面设置必填和需要对应的字段,注意系统优先使用“值来源1”;PS:各CMS系统要先安装对应的简数插件,下载织梦发布插件可在简数采集官网==》帮助中心==》数据与发布导出==》发布到织梦DEDE ;
5、切换至“结果数据&发布“栏,在数据列表选中一条或多条数据,点击上面的“数据发布”按钮,选择刚刚配置的发布目标织梦DEDE,待发布完成;到这采集就完成,十分简单,方便,快捷;PS:这里以发布到织梦测试站为例;简数数据采集网有配置好的模板,欢迎大家食用;