当前位置: 首页 > news >正文

做网站 用 云主机全网网络营销系统

做网站 用 云主机,全网网络营销系统,制作表格的软件app,有哪些有趣的网站对于爬虫,Java并不是最擅长的,但是也可以实现,此次主要用到的包有hutool和jsoup。 hutool是一个Java工具包,它简化了Java的各种API操作,包括文件操作、类型转换、HTTP、日期处理、JSON处理、加密解密等。它的目标是使…

对于爬虫,Java并不是最擅长的,但是也可以实现,此次主要用到的包有hutooljsoup

  • hutool是一个Java工具包,它简化了Java的各种API操作,包括文件操作、类型转换、HTTP、日期处理、JSON处理、加密解密等。它的目标是使Java的常见操作更简单,提供一个简洁易用的API,让开发者更高效地编写代码。
  • jsoup是一个用于处理HTML的Java库,它提供了非常方便的API来解析HTML文档,并进行文档操作。它可以用来提取HTML中的数据,进行HTML到XML的转换,清理不安全的HTML标签等。

代码实现

import cn.hutool.core.io.FileUtil;
import cn.hutool.http.HttpResponse;
import cn.hutool.http.HttpUtil;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.IOException;/*** @author BXB*/
public class DoubanFilm250 {public static void main(String[] args) {for (int i = 0; i < 226; i += 25) {String url = String.format("https://movie.douban.com/top250?start=%d&filter=", i);String request = request(url);select(request);}}public static String request(String url) {// 发送 GET 请求HttpResponse response = HttpUtil.createGet(url).timeout(5000)  // 设置超时时间.header("User-Agent", "Mozilla/5.0")  // 设置请求头.execute();return response.body();}public static void select(String body) {Document parse = Jsoup.parse(body);Element gridView = parse.getElementsByClass("grid_view").get(0);Elements children = gridView.children();try (BufferedWriter bufferedWriter = new BufferedWriter(new FileWriter("C:/path/to/save/movieTop250.md", true));  // 修改为自己的地址) {bufferedWriter.write("| 电影名称 | 详情页地址  | 评分+金句    |\n");bufferedWriter.write("|:--------:|:--------:|:--------:|");bufferedWriter.newLine();for (Element child : children) {// 获取电影名称String movieName = child.select("div.info div.hd span.title").text();System.out.println("电影名称: " + movieName + "写入成功");bufferedWriter.write("| " + movieName + " | ");// 获取海报链接String posterUrl = child.select("div.pic img").attr("src");saveImage(posterUrl, movieName);// 获取详情页链接String movieUrl = child.select("div.info a").attr("href");bufferedWriter.write(  movieUrl + " | ");
//// 评分 金句String text = child.select("div.bd span").text();bufferedWriter.write(text + " | ");bufferedWriter.newLine();}} catch (IOException e) {throw new RuntimeException(e);}}public static void saveImage (String imageUrl, String movieName) {String savePath = "C:/path/to/save/" + movieName.split("[/]")[0] + ".jpg"; // 修改为你要保存的路径和文件名byte[] imageBytes = HttpUtil.downloadBytes(imageUrl); // 下载图片字节数组FileUtil.writeBytes(imageBytes, savePath); // 将字节数组写入到本地文件}
}
http://www.yayakq.cn/news/68342/

相关文章:

  • 衡水阿里巴巴网站建设wap端是指手机端吗
  • 深圳网站维护公司建设网站赚的是什么钱
  • 做外贸无网站如何做建站服务公司网站源码
  • 企业做网站需要多少钱高德地图能不能看国外
  • 社团网站开发模板Wordpress会员充值积分
  • 中国住房和城乡建设厅官网沈阳seo排名外包
  • asp做的网站怎么发布html5 ASP 演示网站
  • 网站运营推广的方法有哪些许昌城乡建设局网站
  • 北海做网站有哪家网站建设行
  • 品牌网站设计制作哪家正规wordpress如何生成单页的网站地图
  • 音乐网站开发与需求手机网站模板 html5
  • 曰本做爰网站广州排前三的seo公司
  • 如何侵入网站服务器湛江百度seo公司
  • 钦州建设局网站平台推广策略都有哪些
  • 通用模板做的网站不收录房产信息网站系统
  • 兴安盟网站建设品牌公司设计
  • 做公司网站主要需要什么服务器网站配置
  • 重庆哪里做网站深圳网站建设的基本知识
  • 东道设计学院googleseo是什么
  • 国外校园网站建设分析安徽智能网站建设
  • 网站开发与硬件合同网站参数
  • 手机开发者网站为wordpress配置邮箱服务
  • 网站备案文件下载彩票网站如何建设
  • 手机网站域做什么广告浏阳网站定制
  • 辽宁沈阳做网站海报在线设计生成器
  • 儿童故事网站建设注册公司怎么注册啊
  • 图片网站 代码怎么在手机上做一个网站
  • 做旅游网站公司网站建设是做什么
  • iis网站服务被禁用注册商标官网入口
  • ftp怎么设置网站首页wordpress 上传 七牛