当前位置: 首页 > news >正文

自学网站开发百度云资源深圳网页制作十大公司

自学网站开发百度云资源,深圳网页制作十大公司,wordpress3.8.1中文版,折叠分类目录模板wordpress文章目录 说明代码第一部分:链接保存为Json第二部分:链接转换为img 说明 根据关键词query获取google_img USERNAME “xxx” PASSWORD “xxx” 官网申请。 代码 首先获取图片链接,保存为json之后下载。 第一部分:链接保存为…

文章目录

  • 说明
  • 代码
    • 第一部分:链接保存为Json
    • 第二部分:链接转换为img

说明

根据关键词query获取google_img

USERNAME = “xxx”
PASSWORD = “xxx”

官网申请。

代码

首先获取图片链接,保存为json之后下载。

第一部分:链接保存为Json

import requests
from pprint import pprint
import pandas as pd
from tqdm import tqdm
import json
import time
import osname_list = ["cat","dog"]
USERNAME = "xxx"
PASSWORD = "xxx"
for object_name in name_list:start_page = 1length = 1total_it = 70print(object_name)for i in tqdm(range(total_it),desc=object_name):payload = {'source': 'google_search','domain': 'nl','query': object_name,'parse': True,'context': [{'key': 'tbm', 'value': 'isch'},],'start_page' : start_page,'pages' : length    }end_page = start_page+length# Get response.response = requests.post('https://realtime.oxylabs.io/v1/queries',auth=(USERNAME, PASSWORD),json=payload,)if not os.path.exists(f'./google_data/{object_name}'):os.makedirs(f'./google_data/{object_name}')with open(f'./google_data/{object_name}/object_name_page_{start_page}_to_{end_page}.json', 'w') as f:json.dump(response.json(), f,indent=4)start_page = end_pagetime.sleep(3)

第二部分:链接转换为img

import json
from tqdm import tqdm
import requests
import os 
folder = './google_data'
subname_list = os.listdir(folder)
down_folder = './google_image/img_download'
os.makedirs(down_folder,exist_ok=True)
fail_list = []
for subname in subname_list:subfolder = os.path.join(folder,subname)path_lists = os.listdir(subfolder)cnt = 0img_down_list = []for mypath in path_lists:json_path = os.path.join(subfolder,mypath)with open(json_path) as file:data = json.load(file)try:img_urls = data['results'][0]['content']['results']['organic']for img_url_item in tqdm(img_urls,desc=f'{subname}-{mypath[-7:-5]}'): img_url = img_url_item['image']if img_url in img_down_list:continueelse:img_down_list.append(img_url)# try:#     # except:#     print('None')if 'http' in img_url:response = requests.get(img_url)if response.status_code == 200:os.makedirs(f'./{down_folder}/{subname}',exist_ok=True)with open(f'./{down_folder}/{subname}/{subname}_{cnt}.jpg', 'wb') as file:file.write(response.content)#print('图片下载成功')cnt += 1else:print('图片下载失败,状态码:', response.status_code)  #print(img_url)except:print(subname)fail_list.append(subname)#break#break
#print(fail_list)
unique_set = set(fail_list)
unique_list = list(unique_set)
print(unique_list)
filename = 'my_list.txt'# 打开文件进行写入
with open(filename, 'w') as file:for item in unique_list:# 写入每个元素,每个元素后面跟一个换行符file.write(item + '\n')
http://www.yayakq.cn/news/191246/

相关文章:

  • 网站建设维护服务协议电子商务网站推广实训报告
  • 可以做商品砍价的网站网站未备案做seo会被k吗
  • 网站数据分析报告传奇世界页游
  • 自己做家具网站网页设计综合案例
  • 百科网站开发便捷网站建设推荐
  • 静态网站建设规划dede免费手机网站模板
  • 房地产手机端网站建设怎么在虚拟主机安装wordpress
  • phpcms 生成网站地图专业网站制作定制
  • 西安网站建设公司有哪些成品app直播源码有什么用
  • 南宁做网站比较好的公司有哪些马鞍山的网站建设公司
  • 网站开发付款方式和比例沈阳百度推广排名优化
  • 网站建设环境vs2017js网站开发方法
  • 网站项目运营方案徐州便民信息网
  • 上那个网站找手工活做wordpress地址改不了
  • 企业建站的费用做外贸需要用什么网站
  • 佛山新网站制作营销推广案例
  • 宜昌最权威网站建设公司百度seo培训要多少钱
  • 网站建设的前期工作基础asp。net网站开发
  • 网站建设外包价格网站域名做链接怎么做
  • 网站建设开发计划书东营公共资源交易网
  • 白山商城网站建设青岛网站制作公司排名
  • 简单大气食品农业网站源码很长的网站域名怎么做短
  • 互动科技网站建设网站信息发布制度建设
  • 企业网站建设搭建注册公司有哪些风险
  • 烟台网站建设兼职最简单制作网页
  • 沈阳网站建设开发维护换模板搭建网站怎么做
  • 城乡和住房建设部网站网络营销渠道的设计方案
  • 萝岗网站开发科技公司主要是做什么的
  • 电子商务网站建设实践报告zencart外贸网站建设
  • 足球比赛直播免费观看关键词优化课程