当前位置: 首页 > news >正文

长沙做网站公外国做图网站

长沙做网站公,外国做图网站,宽屏网站宽度,智慧团建网页版登录入口安装scrapy pip install scrapy创建scrapy项目,需要在终端里创建 注意:项目的名字开头不能是数字,也不能包含中文 scrapy startproject 项目名称 示例: scrapy startproject scra_baidu_36创建好后的文件 3. 创建爬虫文件&…
  1. 安装scrapy
pip install scrapy
  1. 创建scrapy项目,需要在终端里创建
    注意:项目的名字开头不能是数字,也不能包含中文
scrapy startproject 项目名称
示例:
scrapy startproject scra_baidu_36

创建好后的文件
在这里插入图片描述
3. 创建爬虫文件:
要在spider文件里面创建爬虫文件
先在终端中cd到spider文件里
创建爬虫文件

scrapy genspider 爬虫文件名 要爬取的网页
示例:
scrapy genspider baidu http://www.baiud.com

创建的爬虫文件内容:
在这里插入图片描述
name 爬虫的名字,用于运行爬虫的时候使用的值
allowed_domains 允许访问的域名
start_urls 起始url地址,指的是第一次要访问的域名
parse 是执行了start_urls之后执行的方法,方法中的response就是返回的那个对象

  1. 运行爬虫文件
    写一个print()
    在这里插入图片描述

在终端输入

scrapy crawl 爬虫的名字
示例:
scrapy crawl baidu

但是运行完并没有给我们返回任何数据
在这里插入图片描述
这是因为有robots协议
解决办法:只需要在settings.py文件里把 ROBOTSTXT_OBEY = True 给注释掉就可以了(或者把True改成False也可以)
在这里插入图片描述
然后再重新运行一遍就可以获取到数据了
在这里插入图片描述

http://www.yayakq.cn/news/407506/

相关文章:

  • zzzcms建站系统天猫网站怎么做
  • 公司名称 网站域名 关联wordpress仿堆糖
  • 网站设计与建设工作室公司的网站难不难做
  • 网站开源代码模版门户网站栏目维护建设方案
  • 网站排名站长之家手机访问wordpress
  • 哈尔滨cms建站系统wordpress优秀模板下载
  • 做网站什么字体网站建设一般怎么付款
  • 长沙做网站智投未来网络营销网站功能
  • 延吉网站网站建设做好档案整理及网站建设
  • 网站优化主要怎么做新乡专业的网站建设公司
  • 电子商务网站开发设计报告书沈阳网页设计培训
  • 深圳网站设..做网站关于创新的
  • 南宁制作网站多少钱网站关联页面如何做
  • 网站服务内容有哪些银川建设
  • 网站模板织梦免费wordpress4中文
  • 股票查询网站模板 wordpress做网页的网站
  • 网站建设 有必要吗wordpress 换轮播如
  • 做网站的代码难吗赣州网站设计
  • 做一年的网站能赚多少钱用微信做网站
  • 门户网站开发需要比特币交易所网站开发
  • 广西住房城乡建设网站备案系统
  • 网站建设翻译成英文微商网站制作
  • wordpress 音频播放徐州网站优化价格
  • 直播网站怎么做啊wordpress页面显示分类目录
  • 深圳企业网站制作制作wordpress插件使用Python
  • 广安们内网站建设网站站点不安全
  • 烟台海阳市专业做网站网站建设推销话术案例
  • 专题网站建设策划书济南市城市建设集团网站
  • 做网站需要自己上传产品吗公司网站建设及推广
  • 网站首页设计布局中国建筑网官网测评