1、第一步:采集网址规则的起始网址填ciku5的热词库网址:
2、 第二步:查找商品推广列表页真是地址。登陆阿里妈妈单品推广页,输入蔡龇呶挞关键词,搜索推广商品列表,同时使用Fiddler工具捕获Web会话,如磨营稼刻果排序不符合你的要求,可以再点击列表顶端有箭头的字段重新排序并重新捕获会话。依次点击上图中几个有箭头拍的地方,如果右侧下方出现商品信息等相关数据则说明红色框内的地址即是列表真实地址,如果右侧下方内容出现乱码,请先点击右侧中间那个红色箭头处提示语。红色框内真是地址格式:http://HOST + GET(注意:GET尾部的“HTTP/1.1”不需要填写)。在真实地址中包含这段:“q=%E7%94%B7%E8%A3%85&toPage=1&sort”,实际使用时把“q=”之后至“&”前面,替换成ciku5的热词库关键词,在火车头软件中用“[参数]”标记,用“[参数1]”引用。按理说到这一步就应该能够采集到阿里妈妈单品推广的列表页了,但是测试采集却什么也采集不到,这是因为阿里妈妈需要登陆才能采集的。
3、 第三步:填写网页登陆信息。先点击“浏览器登陆获取”,在弹出的窗口输入HOST地址,然后登陆淘宝账号,在cookie信息列表下选择pub开头的阿里妈妈网址,点击确定返回,然后点击保存。注意:cookie信息有时效性,过一定时间没有任何操作就会失效,失效后需重复上述操作。现在点击“测试网址采集”就可以采集到商品推过列表页网址了。
4、第四步:获取单品推广链接页真实地址同样使用Fiddler工具捕获Web会话,从浏览器中打开单品推广页面,点击“立即推广”会弹出一个对话框,填写好推广单元和渠道等信息点击确定的同时用Fiddler工具捕获Web会话。然后从中找出真实地址,方法同前。 在多级网址处再添加一级网址,参数如图,“脚本规则”处填写内容,从第二步中获取到的网址在浏览器中打开的源码找,实际链接就是刚才Fiddler工具捕获的推广页真实地址,注意把关键词替换成参数引用。
5、第五步:获取商品推广链接在火车头采集器中填写采集内容规则,左侧添加内容标签“推广链接”,开始标签填写“"eliteUrl":"”,结束标签填写“"”,然后测试保存。大功告成!