当前位置: 首页 > news >正文

网站建设山东聚搜网络一xdw2019怎么做网站

网站建设山东聚搜网络一x,dw2019怎么做网站,网站营销推广策划书,石英石台面做网单有什么网站两个python程序的小实验(附带源码) 题目1 爬取http://www.gaosan.com/gaokao/196075.html 中国大学排名,并输出。提示:使用requests库获取页面的基本操作获取该页面,运用BeautifulSoup解析该页面绑定对象soup&#x…

两个python程序的小实验(附带源码)

题目1

爬取http://www.gaosan.com/gaokao/196075.html 中国大学排名,并输出。提示:使用requests库获取页面的基本操作获取该页面,运用BeautifulSoup解析该页面绑定对象soup,soup.title, soup.string, soup.get_text()。pd.DataFrame创建二维数据。
在这里插入图片描述


\# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
import bs4def getHTMLText(url):try:r = requests.get(url, timeout=30)r.raise_for_status()r.encoding = r.apparent_encodingreturn r.textexcept:return ""def fillUnivList(ulist, html):soup = BeautifulSoup(html, "html.parser")for tr in soup.find('tbody').children:  # 先检索到tbody标签if isinstance(tr, bs4.element.Tag):tds = tr('td')  # 查询tr中的td标签,等价于tr.find_all('td')\# 新版的排名封装在a标签中,所以这里需要具体到查找属性为'name-cn'的a标签并存储其字符串,即大学的中文名称a = tr('a','name-cn')ulist.append([tds[0].string.strip(),a[0].string.strip(),tds[2].text.strip(),tds[4].string.strip()])  # 使用二维列表存储信息
def printUnivList(ulist, num):tplt = "{0:^10}\t{1:{4}^10}\t{2:^10}\t{3:^10}"\# {3}表示需要填充时使用format的第三个变量进行填充,即使用中文空格print(tplt.format("排名", "学校名称", "地区", "总分", chr(12288)))for i in range(num):u = ulist[i]print(tplt.format(u[0], u[1], u[2], u[3], chr(12288)))def main():uinfo = []url = "https://www.shanghairanking.cn/rankings/bcur/2021"html = getHTMLText(url)fillUnivList(uinfo, html)printUnivList(uinfo, 20)  # 20 univif __name__ == "__main__":main()
题目2:

从新闻中爬取NBA“西部球队”排名。https://nba.hupu.com/standings

如下图输出:
在这里插入图片描述

import requests
from bs4 import BeautifulSoupurl = "https://nba.hupu.com/standings"
response = requests.get(url)
\# 打印响应内容,用于检查是否正确获取了网页数据
print(response.text)
soup = BeautifulSoup(response.text, "html.parser")\# 确保找到的table不是None
table = soup.find("table", class_="players_table")  # 注意这里使用了class_,因为class是Python关键字
if table is None:print("没有找到class为rank-table的table,请检查网页结构或选择器是否正确。")
else:rows = table.find_all("tr")for row in rows:cells = row.find_all("td")if cells:  # 确保td元素存在才进行处理print(' '.join(cell.text.strip() for cell in cells if cell.text.strip()))print(' '.join(cell.text.strip() for cell in cells if cell.text.strip()))
http://www.yayakq.cn/news/494290/

相关文章:

  • 建设公司官方网站做soho要不要注册网站
  • 网站分为哪些部分组成部分网站html有趣代码
  • 网站获取访客企业宣传制作app哪个好
  • 怎么建立自己的企业网站做前端网站用什么工具
  • 云浮市建设局网站sketch做网站
  • wordpress 显示全部分类厦门网站建设优化
  • 做物流的网站都有什么风险投资5万的小型加工厂
  • 自豪的使用WordPressseo应该如何做
  • 网站建设网站设美食网页设计报告
  • 网站后台首页设计vue做门户网站
  • 网站开发中的api指什么i中国好设计
  • 秦皇岛网站建设多少钱外包公司属于劳务派遣吗
  • 公共服务标准化试点百度seo教程视频
  • 福州专业做网站的公司网站建设申报方案
  • 车子网站建网站一年要多少钱
  • 深圳专业做网站排名多少钱wordpress中文版安装
  • 广东东莞自己建站教程个人网页设计论文范文
  • 如何做网站分析潮州网站seo推广
  • 仙游网站建设常州建设局下属网站
  • 博客网站建设做债的网站
  • 免费做公司网站网站建设的进度表
  • 如何建立网站后台程序白城做网站
  • 安徽网页设计培训seo专员是指什么意思
  • 自己建设个小网站要什么手续郑州网站优化哪家好
  • 《建设监理》网站做网站cdn加速有什么用
  • 自己做短视频网站网站 白名单
  • 经典网站建设行业网站的特点
  • 软件公司招聘网站林萌荣温州市网页制作
  • wordpress模板调用自定义插件成都网站排名优化报价
  • 东营建设网站开锁行业在58做网站有活吗