当前位置: 首页 > news >正文

网站开发网搜索引擎优化趋势

网站开发网,搜索引擎优化趋势,网站如何被收录情况,做淘宝网站需要多大空间打开网址http://www.luoxu.cc/dmplay/C888H-1-265.html F12打开Fetch/XHR,看到m3u8,ts,一眼顶真,打开index.m3u8 由第一个包含第二个index.m3u8的地址,ctrlf在源代码中一查index,果然有,不过/…

打开网址http://www.luoxu.cc/dmplay/C888H-1-265.html 

F12打开Fetch/XHR,看到m3u8,ts,一眼顶真,打开index.m3u8

 

由第一个包含第二个index.m3u8的地址,ctrl+f在源代码中一查index,果然有,不过/前总有个\,这个用replace替换为空

 查到第一个index.m3u8,就可以依次找到.ts地址

①爬取原网页,利用re找到第一个index地址

②再利用re找到第二个,然后爬取ts网页内容,添加到mp4文件中

③正则查找要用非贪婪模式,还有记得加上time.sleep()和timeout,以及user-agent要随机取(参考源码),要不然会有connection aborted,被反爬。。

④查看每一集的url的不同点,最后利用线程池一次性爬好几集(这里爬了1-10集),只要你内存够(

源码:

import requests
from bs4 import BeautifulSoup
import os
import re
import numpy as np
from concurrent.futures import ThreadPoolExecutor
import time
headers=[{'user-agent':"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36"},{'user-agent':"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36"},{'user-agent':"Mozilla/5.0 (Windows NT 10.0; WOW64) Gecko/20100101 Firefox/61.0"},{'user-agent':"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36"},{'user-agent':"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.62 Safari/537.36"},{'user-agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36"},{'user-agent':"Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)"},{'user-agent':"Mozilla/5.0 (Macintosh; U; PPC Mac OS X 10.5; en-US; rv:1.9.2.15) Gecko/20110303 Firefox/3.6.15"},{'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'}
]
def fun(url,index):r=requests.get(url,headers=np.random.choice(headers),timeout=5)index_m3u8=re.findall('https:.*?/index.m3u8',r.text)[0]index_m3u8=index_m3u8.replace("\\",'')r=requests.get(index_m3u8,np.random.choice(headers),timeout=5)index_m3u8=index_m3u8.replace('index.m3u8','')index_m3u8=index_m3u8+re.findall('/(.*)?',r.text)[0].split('/')[-3]+'/hls/index.m3u8'r=requests.get(index_m3u8,np.random.choice(headers),timeout=5)ts=re.findall('https://(.*)\.ts',r.text)with open(f"D:/dl/{index}.mp4",'ab') as f:for node in ts:time.sleep(np.random.randint(1,3))node='https://'+node+'.ts'r=requests.get(node,np.random.choice(headers),timeout=5)f.write(r.content)print('ok')
pool=ThreadPoolExecutor(10)
for i in range(1,11):url=f'http://www.luoxu.cc/dmplay/C888H-1-{266-i}.html'pool.submit(fun,url,i)

http://www.yayakq.cn/news/591041/

相关文章:

  • 抚州专业的企业网站建设公司软考证书含金量排名
  • 神马快速排名优化工具seo推广怎么做视频教程
  • 广州天河区网站建设wordpress出售功能插件
  • 广西桂林网站建设什么是网络营销环境?
  • 网站后台模板关联自己做的网站wordpress自动生成二维码
  • 广州网站优化快速提升网站排名杭州建设网站 网站建设
  • 站长工具果冻传媒免费建站自助建站
  • 安平网站建设优化广州网络推广定制
  • 网站备案时间怎么查询系统网站变app
  • 做视频网站要多大的带宽wordpress 小程序 插件
  • 怎么做监控网站上海临港自贸区注册公司
  • 重庆渝中区企业网站建设联系电话青岛seo代理计费
  • dw做网站模板网站建设公司盈利模式
  • 团支部智慧团建网站wordpress 回收站在哪里
  • 建设银行集团网站首页厦门网站制作收费
  • 一站式营销推广平台网站建设的代理
  • 漳州网站优化如何制作一个宣传网页
  • 做网站费用记入什么会计科目广州工程公司有哪些
  • 太原建站冰雪蜜城店加盟费多少
  • 句容网站建设开发成都温江网站建设
  • 手工艺品网站建设策划书专业的昆明网站建设
  • 专业排名优化网站网页版qq空间登录
  • 北京做网站建设公司电商平台系统开发方案
  • 网站每年服务费wordpress增加用户权限
  • 电商网站建设的目标wordpress页面属性
  • 建设网站的费用吗手机搭建网站
  • 网站怎么做支付宝接口jquery 手机网站开发
  • 太原网站网络推广网推啥意思
  • 怎么查看网站空间大小公司网站如何被百度快照
  • 想做网站哪个公司比较好网站建设网站设计