当前位置: 首页 > news >正文

东莞网站建设 光龙泰安口碑好的网站建设

东莞网站建设 光龙,泰安口碑好的网站建设,dw做网站导航条,电商货源在哪里找目录 一、爬虫的定义 二、获取数据 (1)基于Get方式的请求(无参) (2)基于Get方式请求(有参) (3)基于Post方式的请求(无参) &…

目录

一、爬虫的定义

二、获取数据

(1)基于Get方式的请求(无参)

(2)基于Get方式请求(有参)

(3)基于Post方式的请求(无参)

(4)基于Post方式的请求(有参)


一、爬虫的定义

爬虫指的是一种自动化程序,能够模拟人类在互联网上的浏览行为,自动从互联网上抓取、预处理并保存所需要的信息。


爬虫运行的过程一般是先制定规则(如指定要抓取的网址、要抓取的信息的类型等),紧接着获取该网址的HTML源代码,根据规则对源代码进行解析和抽取,最后进行处理和保存。

爬虫在实际应用中广泛使用,如搜索引擎、大数据分析、交易数据采集等领域,都需要用到爬虫技术来实现信息的定向采集和处理

关于爬虫,我们基本上可以分为两步,第一是获取数据,第二是解析数据;

二、获取数据

(1)基于Get方式的请求(无参)

public static void main(String[] args) throws IOException {CloseableHttpClient httpClient = HttpClients.createDefault();HttpGet httpGet=new HttpGet("https://www.lanqiao.cn/");//发送http中的get请求HttpEntity entity=null;CloseableHttpResponse response=null;//判断是否得到正确的数据try {response= httpClient.execute(httpGet);if(response.getStatusLine().getStatusCode()==200){//获取响应数据entity=response.getEntity();//获取的数据输出其实是个对象System.out.println(entity);//将响应数据以html源码形式展示String html = EntityUtils.toString(entity, "UTF-8");System.out.println(html);}}catch (Exception e){e.printStackTrace();}finally {try{if(response!=null)response.close();//响应成功后关闭if(httpClient!=null)httpClient.close();}catch(Exception e){e.printStackTrace();}}}

(2)基于Get方式请求(有参)

public static void main(String[] args) throws IOException {CloseableHttpClient httpClient = HttpClients.createDefault();HttpGet httpGet=new HttpGet("https://www.lanqiao.cn/");//发送http中的get请求HttpEntity entity=null;CloseableHttpResponse response=null;//判断是否得到正确的数据try {response= httpClient.execute(httpGet);if(response.getStatusLine().getStatusCode()==200){//获取响应数据entity=response.getEntity();//获取的数据输出其实是个对象System.out.println(entity);//将响应数据以html源码形式展示String html = EntityUtils.toString(entity, "UTF-8");System.out.println(html);}}catch (Exception e){e.printStackTrace();}finally {try{if(response!=null)response.close();//响应成功后关闭if(httpClient!=null)httpClient.close();}catch(Exception e){e.printStackTrace();}}}

(3)基于Post方式的请求(无参)

public class HtppClientDemo1 {public static void main(String[] args) throws IOException {CloseableHttpClient httpClient=HttpClients.createDefault();//创建post请求HttpPost httpPost=new HttpPost("https://www.lanqiao.cn/");HttpEntity entity=null;CloseableHttpResponse response=null;try{response=httpClient.execute(httpPost);if(response.getStatusLine().getStatusCode()==200){//获取响应数据entity=response.getEntity();System.out.println(entity);//网页源代码String html=EntityUtils.toString(entity,"UTF-8");System.out.println(html);}}catch(Exception e){e.printStackTrace();}finally {try{if(response!=null)response.close();if(httpClient!=null)httpClient.close();}catch (Exception e){e.printStackTrace();}}}

(4)基于Post方式的请求(有参)

public static void main(String[] args) {CloseableHttpClient httpClient = HttpClients.createDefault();//创建post请求HttpPost httpPost = new HttpPost("https://www.lanqiao.cn/");HttpEntity entity = null;CloseableHttpResponse response = null;try {//设置参数BasicNameValuePair basicNameValuePair=new BasicNameValuePair("progid","20");//装入集合List<BasicNameValuePair> list=new ArrayList<>();list.add(basicNameValuePair);//开始进行参数请求,进行网络请求UrlEncodedFormEntity urlEncodedFormEntity=new UrlEncodedFormEntity(list,"UTF-8");httpPost.setEntity(urlEncodedFormEntity);//请求参数结束response = httpClient.execute(httpPost);if (response.getStatusLine().getStatusCode() == 200) {//获取响应数据entity = response.getEntity();System.out.println(entity);//网页源代码String html = EntityUtils.toString(entity, "UTF-8");System.out.println(html);}} catch (Exception e) {e.printStackTrace();} finally {try {if (response != null) response.close();if (httpClient != null) httpClient.close();} catch (Exception e) {e.printStackTrace();}}}

http://www.yayakq.cn/news/535792/

相关文章:

  • 网站开发公司有什么福利郑州关键词seo
  • 一级a做爰全过程网站wordpress编辑页面打不开
  • 网站运营建设的目标给公司做网站软件
  • 电脑做h5比较好的网站开建筑公司需要什么条件
  • 集团网站建设策划方案制作网站免费
  • 网站下方一般放什么原因网站开发 书籍
  • 做生存曲线网站网站端网站开发
  • 西安建筑公司网站建设微信视频号小店
  • 国外游戏商城网站欣赏怎么黑进网站后台
  • 沈阳市做网站电话建设网站二级子页打不开
  • 百度一直不收录网站优化大师免费版下载
  • 怎么把电脑网站做服务器吗wordpress二开前端
  • 机械网站优化学校类网站建设的分析
  • 长沙营销型网站制开公司怎么注册
  • 电子商务网站建设如何如何做织梦手机网站
  • 如何查询自己的网站是否被收录郏县网站制作公司
  • 新建网站如何调试移动网站建设信息
  • 做网站公司找哪家中小型企业网站建设企业
  • 搜索引擎作弊网站有哪些ui培训的课程
  • 临沂 企业网站建设wordpress评论首页显示第一
  • 网站建设氺首选金手指14wordpress图片切换
  • 景区网站建设案例宁波产品网站设计模板
  • 转行做网站公众平台网站价格
  • 网站建设-应酷软件开发模型有几种各有什么特点
  • 怎么在濮阳网站做宣传图书馆网站建设背景
  • 网站打开慢原因宁波seo在线优化公司
  • 快三免费直播app安徽seo人员
  • 怎么做淘宝客的网站wordpress h标签
  • 广东网站建设发信息2345浏览器打开网址
  • 在工商局网站如果做注销公告软文广告怎么写