当前位置: 首页 > news >正文

徐州企业自助建站北京市工程建设交易信息网站

徐州企业自助建站,北京市工程建设交易信息网站,平面设计毕业设计作品,找工程去哪个网站文章目录 说明代码第一部分:链接保存为Json第二部分:链接转换为img 说明 根据关键词query获取google_img USERNAME “xxx” PASSWORD “xxx” 官网申请。 代码 首先获取图片链接,保存为json之后下载。 第一部分:链接保存为…

文章目录

  • 说明
  • 代码
    • 第一部分:链接保存为Json
    • 第二部分:链接转换为img

说明

根据关键词query获取google_img

USERNAME = “xxx”
PASSWORD = “xxx”

官网申请。

代码

首先获取图片链接,保存为json之后下载。

第一部分:链接保存为Json

import requests
from pprint import pprint
import pandas as pd
from tqdm import tqdm
import json
import time
import osname_list = ["cat","dog"]
USERNAME = "xxx"
PASSWORD = "xxx"
for object_name in name_list:start_page = 1length = 1total_it = 70print(object_name)for i in tqdm(range(total_it),desc=object_name):payload = {'source': 'google_search','domain': 'nl','query': object_name,'parse': True,'context': [{'key': 'tbm', 'value': 'isch'},],'start_page' : start_page,'pages' : length    }end_page = start_page+length# Get response.response = requests.post('https://realtime.oxylabs.io/v1/queries',auth=(USERNAME, PASSWORD),json=payload,)if not os.path.exists(f'./google_data/{object_name}'):os.makedirs(f'./google_data/{object_name}')with open(f'./google_data/{object_name}/object_name_page_{start_page}_to_{end_page}.json', 'w') as f:json.dump(response.json(), f,indent=4)start_page = end_pagetime.sleep(3)

第二部分:链接转换为img

import json
from tqdm import tqdm
import requests
import os 
folder = './google_data'
subname_list = os.listdir(folder)
down_folder = './google_image/img_download'
os.makedirs(down_folder,exist_ok=True)
fail_list = []
for subname in subname_list:subfolder = os.path.join(folder,subname)path_lists = os.listdir(subfolder)cnt = 0img_down_list = []for mypath in path_lists:json_path = os.path.join(subfolder,mypath)with open(json_path) as file:data = json.load(file)try:img_urls = data['results'][0]['content']['results']['organic']for img_url_item in tqdm(img_urls,desc=f'{subname}-{mypath[-7:-5]}'): img_url = img_url_item['image']if img_url in img_down_list:continueelse:img_down_list.append(img_url)# try:#     # except:#     print('None')if 'http' in img_url:response = requests.get(img_url)if response.status_code == 200:os.makedirs(f'./{down_folder}/{subname}',exist_ok=True)with open(f'./{down_folder}/{subname}/{subname}_{cnt}.jpg', 'wb') as file:file.write(response.content)#print('图片下载成功')cnt += 1else:print('图片下载失败,状态码:', response.status_code)  #print(img_url)except:print(subname)fail_list.append(subname)#break#break
#print(fail_list)
unique_set = set(fail_list)
unique_list = list(unique_set)
print(unique_list)
filename = 'my_list.txt'# 打开文件进行写入
with open(filename, 'w') as file:for item in unique_list:# 写入每个元素,每个元素后面跟一个换行符file.write(item + '\n')
http://www.yayakq.cn/news/244788/

相关文章:

  • 如何创建属于自己的网站长沙网上商城开发
  • 列举及简述网站建设的流程做网站推广的 什么是开户
  • 带做网站价位网页模板源代码
  • 免费行情软件app网站排行外贸网站整站程序
  • 内网建设网站外网访问合肥网络公司seo
  • 中山做百度网站的公司名称提高网站排名的软件
  • 个体工商户网站备案流程php网站 config
  • 多语言免费网站建设深圳手机网站建设公司
  • 北京海淀区网站开发广州seo营销培训
  • 沈阳网站建设渠道设计网站页面注意事项
  • 企业商城网站开发建设wordpress升级怎么退回
  • 做ppt找图片的网站四川省建设人才网站2018
  • 制作大型网站招生页面设计模板
  • 物流公司怎么做网站洛阳网电脑版
  • 青岛网站建设莫道网络企业文化建设网站建设
  • 中小型网站建设与管理 唐军民公司网站设计策划案
  • 模具加工东莞网站建设技术支持做网站外国的服务器
  • 做汽车的网站绍兴企业免费建站
  • 什么是推广型网站精品网站建设费用磐石网络名气
  • 网站建设文化包括哪些平台网站模板
  • 东莞网站建设aj成都竞价托管多少钱
  • 泗阳县建设局网站网站登录入口
  • 百度推广文案seo商城
  • 哈尔滨网站建设培训安阳贴吧
  • 公司想做个自己的网站怎么做的济南市建设网站
  • 企业官方网站建设费用友情链接买卖平台
  • 用html怎么做网站尾部揭阳网页制作公司
  • 站长工具麻豆梅州市建设培训中心网站
  • 自动化项目外包平台搜索引擎优化的具体措施
  • 网站seo哪家公司好电商设计网站模板