当前位置: 首页 > news >正文

win10系统可以做网站搭建站长seo综合查询工具

win10系统可以做网站搭建,站长seo综合查询工具,中国机械加工最多的地方,江苏网站备案万方数据库爬虫简单开发(自用)(一) 使用Python爬虫实现万方数据库论文的搜索并获取信息1.获取url2.输入关键词3.使用BeautifulSoup解析4.获取文章标题信息 使用Python爬虫实现万方数据库论文的搜索并获取信息 后续会逐步探索更新…

万方数据库爬虫简单开发(自用)(一)

  • 使用Python爬虫实现万方数据库论文的搜索并获取信息
    • 1.获取url
    • 2.输入关键词
    • 3.使用BeautifulSoup解析
    • 4.获取文章标题信息

使用Python爬虫实现万方数据库论文的搜索并获取信息

后续会逐步探索更新万方,谷歌学术的爬虫写法

1.获取url

driver = webdriver.Chrome() #加载驱动
driver.get('https://www.wanfangdata.com.cn/')

2.输入关键词

wait = WebDriverWait(driver, 10) 
search_box = wait.until(EC.presence_of_element_located((By.ID, 'search-input'))) #等待搜索框加载完成

注意这里的EC是导入的包起的别名

from selenium.webdriver.support import expected_conditions as EC

在这里插入图片描述
先获取搜索框的id,在搜索框上右键->selectorsHub->copy id.selectorsHub是一个很好用的edge浏览器扩展,功能丰富,直接在edge扩展商店搜索即可。
在这里插入图片描述

# 输入搜索关键词
search_box.send_keys(keyword)
# 模拟回车按钮
search_box.send_keys(Keys.RETURN)
time.sleep(5)
windows = driver.window_handles
# 切换到当前最新打开的窗口
driver.switch_to.window(windows[-1])

driver.switch_to.window(windows[-1])这句话是为了保证后面的BeautifulSoup获取到的信息来自当前页面而不是网站首页。

3.使用BeautifulSoup解析

content = driver.page_source.encode('utf-8')
soup = BeautifulSoup(content, 'lxml')

4.获取文章标题信息

这里打开F12并分析页面结构:
在这里插入图片描述
可以看到文章标题在class='adjust’下的span标签里边。

titles_bf=soup.find_all('span',{'class':'title'})
titles=BeautifulSoup(str(titles_bf),'lxml')
papers=titles.get_text().strip().split(',')
for paper in papers:print(paper)

这样我们就获取到文章的标题信息了。各位可以根据自己的需要再稍作修改即可。

http://www.yayakq.cn/news/781554/

相关文章:

  • 机关网站建设前期准备工作二维码制作app
  • 网站建设维护总结网站关键词百度自然排名优化
  • 商城网站建设的优点网站目的
  • 已有网站开发app终端wordpress问题解决方法
  • 网站出现wordpress找谁做公司网站
  • 有什么好的书写网站wordpress注册中文插件
  • wordpress打开文章昆明网站快照优化公司
  • 宁国市有做网站爱企业查询公司
  • 网站编写费用天马行空网站建设
  • 哈尔滨餐饮加盟网站建设网站建设重要
  • 个人商城网站源码下载网站快速排名工具
  • 大型行业门户网站开发建设网站开发这个专业前景怎样
  • 大连做网站qq群高校文明建设网站
  • 网站建设费用要分摊多长时间做企业网站好处
  • 成都网站推广经理wordpress的api
  • 做爰明星视频网站注册公司费用多少钱
  • 北京做软件最好的公司南昌做seo的公司有哪些
  • 微信彩票网站网站建设南充网站建设与维护
  • 高端建站属于外包公司么想用wordpress建立网站
  • 淘客优惠券网站怎么做前端网站效果有哪些
  • 网站轮播图怎么保存怎么搭建Wordpress博客
  • 前端静态网站模板下载搜狗搜索引擎优化
  • 网站前端工程师延庆手机网站建设
  • o2o网站建设市场农畜产品销售平台的网站建设
  • 环保网站案例深圳网站建设服务商
  • 筋郑州做网站网页设计师联盟网站怎么
  • 做移动端网站设计国家 住房城乡建设信用 网站
  • 能够做渗透的网站河北省建设机械协会网站首页
  • 天津网站建设哪家好太原做网页软件
  • 怎么样搭建qq号网站孝感做网站的公司