当前位置: 首页 > news >正文

网站建设方案拓扑图wordpress后台not found

网站建设方案拓扑图,wordpress后台not found,WordPress游览器标签,聊城做网站哪家好爬虫的过程中,当对方服务器发现你屡次爬取它,可能会遇到被封IP的苦痛,这时IP就应该换啦,打造IP池的意义十分重要,提供免费IP网站有很多,本次用的是西刺代理IP # -*- coding: utf-8 -*- """…

爬虫的过程中,当对方服务器发现你屡次爬取它,可能会遇到被封IP的苦痛,这时IP就应该换啦,打造IP池的意义十分重要,提供免费IP网站有很多,本次用的是西刺代理IP

# -*- coding: utf-8 -*-
"""
Created on Fri May 11 09:02:12 2018@author: JJ
"""
import urllib.request
import re
def get_proxy(n):url = 'http://www.xicidaili.com/nn/{}'.format(n)headers = ('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36')opener = urllib.request.build_opener()opener.addheaders = [headers]urllib.request.install_opener(opener)html = opener.open(url).read().decode('utf8')ip_port_list = re.findall(r'<tr class(.*?)</tr>',html,re.S)proxy_list = []for i in ip_port_list:ip = re.findall(r'\d+\.\d+\.\d+\.\d+',i)[0]port = re.findall(r'<td>(\d+)</td>',i)[0]proxy = '{}:{}'.format(ip,port)proxy_list.append(proxy)print(proxy_list)if __name__=='__main__':get_proxy(1)

这段代码是爬取第一页,仅仅做个示范,大家可以在下面写个for循环,多爬几页也是可以的,来看看输出结果:

接下来来看看刚才做的IP池能不能用,或者说效率怎么样。测试网站http://httpbin.org/ip,话不多说上代码:

# -*- coding: utf-8 -*-
"""
Created on Fri May 11 09:02:12 2018@author: JJ
"""
import urllib.request
import re
import time
import random
def get_proxy(n):url = 'http://www.xicidaili.com/nn/{}'.format(n)headers = ('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36')opener = urllib.request.build_opener()opener.addheaders = [headers]urllib.request.install_opener(opener)html = opener.open(url).read().decode('utf8')ip_port_list = re.findall(r'<tr class(.*?)</tr>',html,re.S)proxy_list = []for i in ip_port_list:ip = re.findall(r'\d+\.\d+\.\d+\.\d+',i)[0]port = re.findall(r'<td>(\d+)</td>',i)[0]proxy = '{}:{}'.format(ip,port)proxy_list.append(proxy)return proxy_listdef proxy_read(proxy_list,i):proxy = proxy_list[i]print('当前IP为:{}'.format(proxy))sleep_time = random.randint(1,3)print('等待{}秒'.format(sleep_time))time.sleep(sleep_time)print('开始测试')proxy_jj = urllib.request.ProxyHandler({'http':proxy})opener = urllib.reequest.build_opener(proxy_jj,urllib.request.HTTPHandler)urllib.request.install_opener(opener)try:html = urllib.request.urlopen('http://httpbin.org/ip')rhtml = html.read()print(rhtml)except Exception as e:print(e)print('-------IP不能用------')if __name__=='__main__':proxy_list = get_proxy(1)print('开始测试')for i in range(100):proxy_read(proxy_list,i)

结果如上图,总得来说,代码很简单,好啦,end啦,下一篇文章‘用xpath打造免费IP池‘。敬请期待

http://www.yayakq.cn/news/661401/

相关文章:

  • 义乌设计网站做图表用的网站
  • 烟台做网站联系电话创业型企业网站模板
  • 上海网站空间服务器个人可以做彩票网站吗
  • 网站建设要多长时间网站建设全网营销
  • 网站开发中 html电子商务网站建立
  • 昆山网站建设方案优化公司百度排名优化工具
  • 建设部网站上查不到资质的企业排名函数rank怎么用
  • 黄石手机网站建设网站开发课设报告书
  • 模板网站也需要服务器吗男女做那个的的视频网站
  • 网站设计规划说明书北海 做网站 英文
  • 站长源码之家wordpress国内打开速度慢
  • 那些做app网站的怎么寻找客户的无极磁铁网站
  • 自如网站做的好 服务做设计开店的网站
  • 网站开发人员需求有什么网站是可以做动态图的
  • 中国建信网官网青岛官网优化推广
  • 房产中介网站开发与设计代码织梦网站地图
  • 网站开发 php 实例教程苏州凌云建设有限公司
  • 北大青鸟网站建设聊城网站建设推广
  • 门户网站是如何做引流的网站开发建立站点
  • 网站如何在百度刷排名微信如何做商城网站
  • 网站开发外包合同wordpress首页中不显示文章
  • 网站设计要学什么推荐几个设计网站
  • 绍兴h5建站广州推广seo
  • cms内容网站管理系统适合小公司的记账软件
  • 贵州住房与城乡建设厅网站大连网络推广网站优化找哪家好
  • 网站建设开发设计营销公司厦门简单网页设计主题
  • 中国化工建设网站设计图片的手机软件
  • 官方网站建设的重要性公司怎样做网站
  • 男女做的那些事情的网站做空视频文件的网站
  • 做全英文网站企业网站维护与销售