当前位置: 首页 > news >正文

网站开发的经验技巧网站建设项目进度计划书

网站开发的经验技巧,网站建设项目进度计划书,驻马店公司做网站,建设网站分几个步骤在做PHP采集内容时,用过querylist采集组件,但是这个插件采集页面内容时,都必须要写个采集选择器。这样比较麻烦,每个文章页面都必须指定一条采集规则 。就开始着手找一个插件可以能自动识别任意文章url正文内容并采集的&#xff0…

在做PHP采集内容时,用过querylist采集组件,但是这个插件采集页面内容时,都必须要写个采集选择器。这样比较麻烦,每个文章页面都必须指定一条采集规则 。就开始着手找一个插件可以能自动识别任意文章url正文内容并采集的,发现有一个插件,是采集内容标签给每个标签拆开后打分来分析出正文内容的,下面给大家展示实现的过程及代码。

先看截图:
在这里插入图片描述
采集代码:

try{$ql = QueryList::get($url);}catch(RequestException $e){//print_r($e->getRequest());return json(['status'=>false,'msg'=>'Http Error:服务器错误,url不存在']);die;}//queryData 方法等同于  query()->getData()->all()//$query = $ql->rules($rules)->queryData();$title_rule = json_decode(htmlspecialchars_decode($title_rule),true);$content_rule = json_decode(htmlspecialchars_decode($content_rule),true);if($thumb_rule)$thumb_rule = json_decode(htmlspecialchars_decode($thumb_rule),true);$photos_range = htmlspecialchars_decode($photos_range);if(is_array($content_rule)&&is_array($title_rule)){$rules = ['title' => $title_rule,'seo_title' => ['title','text'],'keywords' => ['meta[name=keywords]','content'],'description' => ['meta[name=description]','content'],'content' => $content_rule,'thumb' => $thumb_rule];if(empty($thumb_rule))unset($rules['thumb']);}else{$rules = ['title' => ['h1','text'],'seo_title' => ['title','text'],'keywords' => ['meta[name=keywords]','content'],'description' => ['meta[name=description]','content'],'content' => [$content_rule,'html','-a -ul -li -.group-post-list'],'thumb' => [$thumb_rule,'src']];}$query =  $ql->rules($rules)->queryData();

这些写对于每个页面都要定好规则,比较麻烦有没有一种组件可以任意网址自动识别采集正文内容的,
先看效果
在这里插入图片描述
只需要输入一个文章的网站,自动识别正文内容并采集
主要用的一个插件readability,git地址: https://github.com/andreskrey/readability.php
代码:

$html = file_get_contents($url);
$readability = new Readability(new Configuration());
$readability->parse($html);$data['title'] = $readability->getTitle();
$data['seo_title'] = $readability->getTitle();
http://www.yayakq.cn/news/874415/

相关文章:

  • 襄阳网站建设楚翼网络周口seo优化
  • 网站建设代理网站wordpress图片关联文章
  • 快设计网站官网广州最新今天的消息
  • 邢台做网站的公司有那个企业营销型网站的内容
  • 网站 主营业务注册公司费用是多少
  • 苏州工业园区建设主管部门网站一般vs做的网站的总体框架
  • 网站地址怎么申请注册电器网站建设策划书
  • 网站建设捌金手指下拉二五网络公共关系
  • 建设网站都需要哪些内容南昌seo网站管理
  • 买个网站域名多少钱一年浏览器网站大全免费
  • 济南网站建设与维护庆阳定制网站
  • 重庆市建设工程造价管理站做网站编程要学什么
  • 网站建设中要尽量使用图片wordpress文章详情展示不了
  • 中山品牌网站建设报价建筑网78
  • 微信的网站经纪公司排名
  • 网站建设哪家公司好网站建设江西省住房和城乡建设厅网站首页
  • 建设直播网站软件石家庄建设工程信息网站
  • 山东省建设管理局网站吴中区两学一做网站
  • 广州网站建设哪家公司好农业网站建设方案
  • 网站建设会计分录怎么做网站备案人什么意思
  • 北京网站建设最便宜的公司哪家好做网站先付款
  • 重庆承越网站制作公司国航网站建设
  • 做的网站访问不了医院网站HTML5
  • 网上书店网站建设设计的收获html5后台网站模板
  • 濮阳团购网站建设构建企业网站
  • 网站安全制度体系的建设情况知乎关键词优化软件
  • 沈阳网站app制作新闻cms静态网站模板下载
  • 湖南网站定制做网站需要注意的
  • 网站建设进度表下载重庆九龙坡区网站建设
  • 建站工具cms网站域名到期后不续费会怎样