手抄报 安全手抄报 手抄报内容 手抄报图片 英语手抄报 清明节手抄报 节约用水手抄报

Scrapy基础使用实例

时间:2024-10-24 22:44:10

1、root用户使用XShell连上CentOS7机器,已经新建了scrapy工程,tree命令显示当前目录结构。tree

Scrapy基础使用实例

2、进入spider文件夹,新建文件coderSpider.pycd mySpider/mySpider/mySpider/spiders/vi coderSpider.py

Scrapy基础使用实例

3、在coderSpider.py中编写代码如下:#!/usr/bin/python#罕铞泱殳coding:utf8足毂忍珩import scrapyclass coderSpider(scrapy.Spider): name = 'coder' #爬虫名 allowed_domains = ['http://www.coder1024.site/'] #允许的域名 start_urls = ['http://www.coder1024.site'] # 开始爬地址 def parse(self,response): with open('coder.html','w') as f: f.write(response.body)

Scrapy基础使用实例

4、ESC退出编辑模式,保存退出:wq

Scrapy基础使用实例

5、运行命令scrapy crawl coder

Scrapy基础使用实例

6、运行完成后,爬虫关闭,再spider文件夹,生成coder.html文件

Scrapy基础使用实例
Scrapy基础使用实例
© 手抄报圈