当前位置: 首页 > news >正文

重庆王网站制作网站购物车功能怎么做

重庆王网站制作,网站购物车功能怎么做,自定义wordpress的字体,百度贴吧引流推广方法crawlab 单节点docker安装 此处介绍的是单节点的方式,多节点的情况可以把爬虫上传到一个节点中,之后会同步到其它节点上 version: 3.3 services:master:image: crawlabteam/crawlabcontainer_name: crawlab_masterrestart: alwaysenvironment:CRAWLAB…

crawlab

单节点docker安装

此处介绍的是单节点的方式,多节点的情况可以把爬虫上传到一个节点中,之后会同步到其它节点上

version: '3.3'
services:master:image: crawlabteam/crawlabcontainer_name: crawlab_masterrestart: alwaysenvironment:CRAWLAB_NODE_MASTER: Y  # Y: 主节点CRAWLAB_MONGO_HOST: mongo  # mongo host address. 在 Docker-Compose 网络中,直接引用 service 名称CRAWLAB_MONGO_PORT: 27017  # mongo port CRAWLAB_MONGO_DB: crawlab  # mongo database CRAWLAB_MONGO_USERNAME: username  # mongo usernameCRAWLAB_MONGO_PASSWORD: password  # mongo password CRAWLAB_MONGO_AUTHSOURCE: admin  # mongo auth source volumes:- "./master:/data"  # 持久化 crawlab 数据,master是win中的相对目录ports:- "8080:8080"  # 开放 api 端口depends_on:- mongomongo:image: mongo:4.2restart: alwaysenvironment:MONGO_INITDB_ROOT_USERNAME: username  # mongo usernameMONGO_INITDB_ROOT_PASSWORD: password  # mongo passwordvolumes:- "/opt/crawlab/mongo/data/db:/data/db"  # 持久化 mongo 数据ports:- "27017:27017"  # 开放 mongo 端口到宿主机

docker-compose up -d运行,访问localhost:8080,用户密码均为admin

上传爬虫

此处上传一个爬取图片的简单爬虫,上传requirements.txt或者package.json文件,crawlab会自动扫描并安装依赖,但是如果存在多版本依赖的话,还没尝试,希望大神知道的留言告知。
爬虫是一个下载美女图片的爬虫,进入到crawlab的终端中,执行pip3 list 可以看到安装的包,其中常见的如requests、parsel都已经安装了

// ceshi.py
import requests
import parsel
import os
os.mkdir('/data/aa')
for page in range(1, 2):print(f'-------正在爬取第{page}页----------')sub_url = ''if page == 1 else '_' + str(page)url = f'https://pic.netbian.com/4kmeinv/index{sub_url}.html'if not os.path.exists('/data/aa/' + f'第{page}页'):os.mkdir('/data/aa/' + f'第{page}页')response = requests.get(url=url)response.encoding = 'gbk'data_html = response.textselector = parsel.Selector(data_html)a_href_list = selector.css('#main > div.slist > ul > li > a::attr(href)').getall()  # 获取每个图片的urlfor a_href in a_href_list:a_href = 'https://pic.netbian.com' + a_hrefresponse_1 = requests.get(a_href)selector_1 = parsel.Selector(response_1.text)  # 每个图片的网页链接img = selector_1.css('#main > div > div > div > a > img::attr(src)').getall()[0]  # 照片的urldownload_url = 'https://pic.netbian.com/' + imgtitle = img.split('/')[-1]download = requests.get(download_url).contentwith open(f'/data/aa/第{page}页/{title}', mode='wb')as f:f.write(download)print(title, '下载完成')print(f'第{page}页全部下载完成')

图片下载到data目录下,而data又通过docker映射到了本机的master目录中
填写如下
在这里插入图片描述

总结

简单的用了下,感觉crawlab很好用,能把多个爬虫方便的管理起来,还有cron的功能,当作脚本管理也很不错

http://www.yayakq.cn/news/478813/

相关文章:

  • 丽江市网站建设制作网站制作 技术
  • 讲究 网站杭州p2p网站建设
  • 个人网站建设背景和目的射洪县住房和城乡建设局网站
  • 现在还有做静态网站的什么网站都能进的浏览器
  • 网站服务器开发网站页面做
  • 山东济南网站建设优化广东新闻联播林红
  • 建设学风建设专题网站wordpress仿站函数
  • 如何给网站做2维码广告推广语
  • 超值的网站建设动态ip建设网站
  • 大家做公司网站 都是在哪里做的北京 公司网站制作
  • 网站怎么做等级保护做车贴网站
  • 寻找富阳网站建设建设一个网站需要做哪些工作内容
  • 网站更新方法建设局工作怎么样
  • 网站外包建设 请示Sweipe wordpress
  • 中国微电影 网站开发者利用百度图片做网站外链
  • 如何开wordpress网站wordpress+组织架构
  • 网站设计建设公司联系方式免费建设网站公司哪家好
  • 网页制造与网站建设论文酒店如何做好线上营销
  • 福建省中城建设工程有限公司网站外网登录 wordpress
  • 如何建造免费的网站怎么在网上做公司的网站
  • 如何做购物券网站注册空壳公司帮人走账
  • wordpress建站教程jiuyou服装网站建设前期规划方案
  • 个人网站备案 网站名称wordpress 推荐位调用
  • 网站空间自己做做网站用html还是php
  • 深圳旅游公司网站方维不变心心的初心
  • 网站使用的主色调网站制作预算
  • 建设区服务网站做废旧哪个网站好
  • 网站app公众号先做哪个比较好wordpress更换域名后登陆不了后台
  • win7上能否做asp网站网络购物系统
  • 北京个人网站开发制作wordpress 影响力