当前位置: 首页 > news >正文

网站建设的利益企业网站服务器

网站建设的利益,企业网站服务器,一个ip地址做多个网站,摄影网站建设内容Scrapy 是用 Python 实现的一个为了爬取网站数据、提取结构性数据而编写的应用框架。 安装scrapy pip install scrapy2.5.0 1.新建 Scrapy项目 scrapy startproject mySpider # 项目名为mySpider 2.进入到spiders目录 cd mySpider/mySpider/spiders 3.创建爬虫 scrapy gensp…

Scrapy 是用 Python 实现的一个为了爬取网站数据、提取结构性数据而编写的应用框架。

安装scrapy

pip install scrapy==2.5.0

1.新建 Scrapy项目

scrapy startproject mySpider   # 项目名为mySpider

2.进入到spiders目录

 cd mySpider/mySpider/spiders

3.创建爬虫

 scrapy genspider dgcuAI  ai.dgcu.edu.cn      # 爬虫名为dgcuAI,爬取域为ai.dgcu.edu.cn

 4.制作爬虫

创建爬虫之后,打开dgcuAI.py文件。

引入Selector

from scrapy.selector import Selector

修改start_urls:

start_urls = ['http://ai.dgcu.edu.cn/front/category/2.html']

 修改parse函数:

    def parse(self, response):

        print(response.url)

        selector = Selector(response)

        # # 使用XPath表达式提取信息:

        # 标题: //div[@class="pageList"]/ul/li/a/div[@class="major-content1"]/text()

        # 链接: //div[@class="pageList"]/ul/li/a/@href

        # 日期: //div[@class="pageList"]/ul/li/a/div[@class="major-content2"]/text()

        node_list = selector.xpath("//div[@class='pageList']/ul/li")

        for node in node_list:

            # 文章标题

            title = node.xpath('./a[1]/div[@class="major-content1"]/text()').extract_first()

            # 文章链接

            url = node.xpath('./a[1]/@href').extract_first()

            # 日期

            date = node.xpath('./a[1]/div[@class="major-content2"]/text()').extract_first()

            print("文章标题:", title)

            print("文章链接:",url)

            print("日期:",date)

 5.运行爬虫

 在mySpider/mySpider/文件夹下创建run.py文件,并运行:

from scrapy import cmdline

cmdline.execute("scrapy crawl dgcuAI -s LOG_ENABLED=False".split())

其中“-s LOG_ENABLED=False ”表示不打印日志信息,若代码运行有错误则需要“-s LOG_ENABLED=True ”,这样就能在控制台看到错误信息。

运行结果:

http://www.yayakq.cn/news/282712/

相关文章:

  • 东莞做网站哪家好克拉玛依燃气公司主页
  • 安阳+网站建设自学网站建设基本流程
  • 深圳网站设计公司费用天眼企业查询系统官网
  • 网站如何做新闻聚合增加网站流量
  • 网站开发分析软件项目管理是做什么的
  • 个人注什么域名的网站源码之家的模板怎么用
  • 郑州网站推广排名公司网站推广怎么推
  • 不是网站开发语言的是浙江建设职业技术学院
  • 广州网站建设 八爪鱼申请网站建设经费
  • 在上海做兼职在哪个网站好wordpress is home
  • 什么是门户类型的网站高清素材视频去哪里找
  • php网站代做无锡网站设计系统
  • 江门网站建设junke100制作图片的软件推荐
  • 2022年国际新闻除了seo还可以做哪些推广呢
  • 做网络推广的网站赣州小程序推荐
  • 怎么做有数据库的网站哪种网站语言最好
  • 企业为何选择网站推广外包?深圳龙华新区网站建设
  • 百度怎么建设网站游乐园网站建设
  • 企业网站模板下载尽在网站排名优化推广厦门
  • h5响应式网站做动画常见的软件开发工具
  • 芜湖网站建设芜湖中国林业建设协会网站
  • 南京seo全网营销成都网站建设优化推
  • 帝国cms做微网站蓝科企业网站系统
  • 怀化网站设计流行的wordpress主题
  • 物流网站后台wordpress喜欢
  • 自己建网站步骤图标设计免费 logo
  • 郑州网站建设需要多少钱php做企业网站管理系统
  • 网站设置不可粘贴临沂市平邑县建设局网站
  • 福州做网站的公司多少钱厦门网站建设哪家公司好
  • 什么是网站开发设计与实现微信营销案例100例