当前位置: 首页 > news >正文

新乡网站seo优化深圳网站制作工具

新乡网站seo优化,深圳网站制作工具,大连建设集团招聘信息网站,电脑网页怎么下载视频晚上休息,想弄两部好看的电影看看, 找了半天没找到想看的, 想到之前有个人爬知乎的用户数据,突发奇想, 没事把BT天堂的电影信息爬下来,下次阔以直接查数据库。 只能说闲的蛋疼,哈哈&#xf…

晚上休息,想弄两部好看的电影看看,

找了半天没找到想看的睡觉

想到之前有个人爬知乎的用户数据,突发奇想大笑

没事把BT天堂的电影信息爬下来,下次阔以直接查数据库。安静闭嘴

只能说闲的蛋疼得意,哈哈,还能码下代码  ^_^


1.抓取网站html源码

<span style="font-size:24px;">$url = "www.bttiantang.cc";
$html = shell_exec("curl $url");</span>

2.获取总页数,电影总数(正则匹配)

<span style="font-size:24px;">preg_match("/<span class=\"pageinfo\">.*?<\/span>/", $html, $pageCount);
preg_match_all("/\d{1,10000}/",$pageCount[0],$pageCount);</span>


3.抓取电影信息(正则匹配信息)

<span style="font-size:24px;">preg_match("/\d{4}\/\d{2}\/\d{2}/" , $pageInfo[0][$i], $updateTime);preg_match("/<font color=\"#FF6600\">(.*?)<i>/" , $pageInfo[0][$i], $movieName);preg_match("/<strong>(\d{1})<\/strong>/" , $pageInfo[0][$i], $movieScore_int);preg_match("/<em class=\"fm\">(\d{1})<\/em>/" , $pageInfo[0][$i], $movieScore_decimal);preg_match("/href=\"(.*?)\"/" , $pageInfo[0][$i], $movieUrl);preg_match("/<p class=\"des\">(.*?)<\/p>/" , $pageInfo[0][$i], $actor);</span>

4.插入数据库,大功告成


总体来说,php抓取的速度还是蛮快的,4min不到,采集2w多条信息。

start:01:22:54

end:01:26:11






附数据库截图:




附源码:

<?php$url = "www.bttiantang.cc";
$html = shell_exec("curl $url");preg_match("/<span class=\"pageinfo\">.*?<\/span>/", $html, $pageCount);
preg_match_all("/\d{1,10000}/",$pageCount[0],$pageCount);$pageSize = intval($pageCount[0][0]);
$movieCount = $pageCount[0][1];$conn = mysql_connect('***','***','');
mysql_select_db('***',$conn);
mysql_query('set names utf8',$conn);for($j=1;$j<=$pageSize;$j++){$movieHtml = shell_exec("curl $url?PageNo=$j");preg_match_all("/<div class=\"item cl\">.*?<\/div>/s", $movieHtml, $pageInfo);for($i=0;$i<count($pageInfo[0]);$i++){preg_match("/\d{4}\/\d{2}\/\d{2}/" , $pageInfo[0][$i], $updateTime);/******clear ad*****/if(empty($updateTime))continue;/*******************/$updateTime = str_replace('/','-',$updateTime[0]);preg_match("/<font color=\"#FF6600\">(.*?)<i>/" , $pageInfo[0][$i], $movieName);/*****same conditions*****/if(empty($movieName))preg_match("/<b>(.*?)<i>/" , $pageInfo[0][$i], $movieName);if(empty($movieName))preg_match("/<b>(.*?)<\/b>/" , $pageInfo[0][$i], $movieName);/************************/$movieName = $movieName[1];preg_match("/<strong>(\d{1})<\/strong>/" , $pageInfo[0][$i], $movieScore_int);$movieScore_int = $movieScore_int[1];preg_match("/<em class=\"fm\">(\d{1})<\/em>/" , $pageInfo[0][$i], $movieScore_decimal);$movieScore_decimal = $movieScore_decimal[1];$movieScore = floatval($movieScore_int.'.'.$movieScore_decimal);preg_match("/href=\"(.*?)\"/" , $pageInfo[0][$i], $movieUrl);$movieUrl = $movieUrl[1];preg_match("/<p class=\"des\">(.*?)<\/p>/" , $pageInfo[0][$i], $actor);$movieActor = str_replace("<em>",'',str_replace("</em>",'',$actor[1]));mysql_unbuffered_query("insert into movie (name,actor,url,update_ts,score) values ('$movieName','$movieActor','$movieUrl',<span style="white-space:pre">	</span>'$updateTime','$movieScore')");}}?>


本电影信息属于从BT天堂抓取,并未涉及机密信息,因此本人不承担任何法律责任!

若有相关电影信息涉及您的版权或知识产权或其他利益,请告知,确认后会尽快删除。



http://www.yayakq.cn/news/536950/

相关文章:

  • 商城网站策划方案wordpress显示icp备案
  • 网站被封怎么濮阳大濮网联系电话
  • 常见网站漏洞企业展示型网站怎么建
  • 用php做网站不用框架惠州专门做网站
  • 专业网站设计网站网站开发为什么采取ssh框架
  • 电子商务网站建设规划说明书盐城网站建设与网页制作
  • nike网站建设方案做纺织的用什么网站
  • 建设商城网站费用婚礼效果图网站
  • 企业网站源码 asp版式设计模板网站
  • 网站开发吗和APP软件一样吗wordpress建立店铺
  • 龙岩网站建设方案书做网站用不用云服务器
  • 在线编辑ppt的网站重庆市工程建设信息网证书查询
  • 手机定制网站贵州网站推广优化
  • c 2015 做网站网站新建设请示
  • 做土特产的网站苏州设计网页网站好
  • 广告案例网站推广普通话手抄报简单又好看内容
  • 做网站简单需要什么软件昆明网络公司开发
  • 怎么样进行网站建设怎么做公众号小程序
  • 中国工程建设管理协会网站html5 门户网站模版
  • 关于文明网站建设存在的问题用群晖建wordpress
  • 云南百度智能建站网站开发如何修改字体
  • 付费做网站关键词优化是怎么做的呀html5网站报价明细
  • 高端网站定制的方法企业it外包服务公司
  • 做相册的网站(网易关键字优化工具
  • 苏州网站建设费用好123设为主页官网网址大全
  • 服装网站建设项目实施报告范文网站建设的切片是什么
  • 网站建设的流程电子商务一般网站是用什么框架做的
  • 专业的建设网站服务公司wordpress好用的文件管理
  • 网站建设网上书店求有题目做的学习网站
  • 做网站带吗北京包装设计公司