当前位置: 首页 > news >正文

漂亮的flash网站微信微网站开发

漂亮的flash网站,微信微网站开发,上海外贸公司注册流程及条件,wordpress 速度爬虫的过程中,当对方服务器发现你屡次爬取它,可能会遇到被封IP的苦痛,这时IP就应该换啦,打造IP池的意义十分重要,提供免费IP网站有很多,本次用的是西刺代理IP # -*- coding: utf-8 -*- """…

爬虫的过程中,当对方服务器发现你屡次爬取它,可能会遇到被封IP的苦痛,这时IP就应该换啦,打造IP池的意义十分重要,提供免费IP网站有很多,本次用的是西刺代理IP

# -*- coding: utf-8 -*-
"""
Created on Fri May 11 09:02:12 2018@author: JJ
"""
import urllib.request
import re
def get_proxy(n):url = 'http://www.xicidaili.com/nn/{}'.format(n)headers = ('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36')opener = urllib.request.build_opener()opener.addheaders = [headers]urllib.request.install_opener(opener)html = opener.open(url).read().decode('utf8')ip_port_list = re.findall(r'<tr class(.*?)</tr>',html,re.S)proxy_list = []for i in ip_port_list:ip = re.findall(r'\d+\.\d+\.\d+\.\d+',i)[0]port = re.findall(r'<td>(\d+)</td>',i)[0]proxy = '{}:{}'.format(ip,port)proxy_list.append(proxy)print(proxy_list)if __name__=='__main__':get_proxy(1)

这段代码是爬取第一页,仅仅做个示范,大家可以在下面写个for循环,多爬几页也是可以的,来看看输出结果:

接下来来看看刚才做的IP池能不能用,或者说效率怎么样。测试网站http://httpbin.org/ip,话不多说上代码:

# -*- coding: utf-8 -*-
"""
Created on Fri May 11 09:02:12 2018@author: JJ
"""
import urllib.request
import re
import time
import random
def get_proxy(n):url = 'http://www.xicidaili.com/nn/{}'.format(n)headers = ('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36')opener = urllib.request.build_opener()opener.addheaders = [headers]urllib.request.install_opener(opener)html = opener.open(url).read().decode('utf8')ip_port_list = re.findall(r'<tr class(.*?)</tr>',html,re.S)proxy_list = []for i in ip_port_list:ip = re.findall(r'\d+\.\d+\.\d+\.\d+',i)[0]port = re.findall(r'<td>(\d+)</td>',i)[0]proxy = '{}:{}'.format(ip,port)proxy_list.append(proxy)return proxy_listdef proxy_read(proxy_list,i):proxy = proxy_list[i]print('当前IP为:{}'.format(proxy))sleep_time = random.randint(1,3)print('等待{}秒'.format(sleep_time))time.sleep(sleep_time)print('开始测试')proxy_jj = urllib.request.ProxyHandler({'http':proxy})opener = urllib.reequest.build_opener(proxy_jj,urllib.request.HTTPHandler)urllib.request.install_opener(opener)try:html = urllib.request.urlopen('http://httpbin.org/ip')rhtml = html.read()print(rhtml)except Exception as e:print(e)print('-------IP不能用------')if __name__=='__main__':proxy_list = get_proxy(1)print('开始测试')for i in range(100):proxy_read(proxy_list,i)

结果如上图,总得来说,代码很简单,好啦,end啦,下一篇文章‘用xpath打造免费IP池‘。敬请期待

http://www.yayakq.cn/news/958794/

相关文章:

  • 影视网站搭建哪个系统好古腾堡布局的网站
  • 网站推广与品牌建设佛山建设外贸网站公司吗
  • 网站qq临时会话买外链网站
  • 网站设计开发软件网页美化工具赣州带你飞网络科技有限公司
  • 企业微网站怎么建设wordpress建设网站的方法
  • wap手机商城网站源码wordpress国旗
  • vue企业门户网站模板个人网站建站系统
  • 广州建网站辽宁省住房和城乡建设厅网站进不去
  • 温州网站制作哪家好二级建造师兼职网
  • 找人做企业网站注意啥山东省建设厅网站 - 百度
  • 邯郸手机网站开发价格有做喜糖的网站吗
  • 视频网站开发视频dede 网站目录
  • 厦门公司做网站网络教育做的好的网站
  • 网站制作手机网站网站建设的难点在哪里
  • 规划设计 网站 网站结构佛山广告设计公司排名
  • 珠海网站建设的公司排名江西做网站
  • 网站收录量低怎么做职业生涯规划大赛报名
  • 营销型网站分为哪几种网站备案的规划方案
  • 网页制作免费网站百度网页版电脑版入口
  • 淄博著名网站开发方法优化大师怎么删除学生
  • 长春seo公司长春网站设计郑州市官网
  • 食用油 网站 模板简述电子商务网站的开发流程
  • 网站后端性能优化措施韩国企业网站设计
  • 新余 网站建设公司辽宁网站建设
  • 四川住房和城乡建设部网站官网电商网站建设基础教案
  • 网站群管理系统哪个好营销型网站什么意思
  • 湛江专业的免费建站深圳十大装修公司
  • 昆山网站建设kshuituowordpress弹性搜索
  • 网站建设常用视频格式企业为什么做网站 图片
  • 龙岩人自己的网站温州微信网站定制