当前位置: 首页 > news >正文

网站被做跳转怎么办酷家乐软件培训班

网站被做跳转怎么办,酷家乐软件培训班,企业网站如何优化,做网站页面一般设置多大尺寸以AnyEdit数据集为例,我们展示了批量读取parquet图片文件的代码,相关数据集地址如下: Huggingface-AnyEdit 代码如下所示,请注意使用时应查看文件格式来适应性修改代码 import os import pandas as pd import io import json fr…

以AnyEdit数据集为例,我们展示了批量读取parquet图片文件的代码,相关数据集地址如下:
Huggingface-AnyEdit

代码如下所示,请注意使用时应查看文件格式来适应性修改代码

import os
import pandas as pd
import io
import json
from tqdm import tqdm
from PIL import Image# 读取 parquet 文件
df = pd.read_parquet('./data/train-00000-of-00383.parquet')# 查看第一行数据
sample_row = df.iloc[0]  # 获取第一行数据
print(sample_row)#--------------------------------#
# 获取data文件夹下的所有parquet文件
#--------------------------------#
parquet_dir      = './data'
parquet_files    = [f for f in os.listdir(parquet_dir) if f.endswith('.parquet')]# 创建新的文件夹来保存图片
base_output_dir  = './extracted_images'
os.makedirs(base_output_dir, exist_ok=True)image_dir        = os.path.join(base_output_dir, 'image_files')
edited_dir       = os.path.join(base_output_dir, 'edited_files')
visual_input_dir = os.path.join(base_output_dir, 'visual_input_files')# 创建子文件夹
os.makedirs(image_dir, exist_ok=True)
os.makedirs(edited_dir, exist_ok=True)
os.makedirs(visual_input_dir, exist_ok=True)# 创建一个字典保存除了图像数据外的所有内容
non_image_data = []#-------------------#
# 遍历所有parquet文件
#-------------------#
for parquet_file in parquet_files:file_path = os.path.join(parquet_dir, parquet_file)print(f"Processing file: {file_path}")# 读取 parquet 文件df = pd.read_parquet(file_path)# 使用 tqdm 包装 DataFrame 的迭代器以显示进度条for index, row in tqdm(df.iterrows(), total=len(df), desc=f"Processing {parquet_file}"):# 提取图片字节数据image_file_data   = row['image_file']edited_file_data  = row['edited_file']visual_input_data = row['visual_input']# 提取除了图像列以外的其他数据row_data = {'image_id': row['image_id'],'edit_instruction': row['edit_instruction'],'edit_type': row['edit_type'],'input': row['input'],'output': row['output']}# 添加该行的非图像数据到字典列表中non_image_data.append(row_data)# 获取 image_id 来命名图像文件image_id = row['image_id']# 确保字节数据存在for image_data, label in [(image_file_data, 'image_file'), (edited_file_data, 'edited_file'), (visual_input_data, 'visual_input')]:if isinstance(image_data, dict) and 'bytes' in image_data:# 将字节数据转换为图片image = Image.open(io.BytesIO(image_data['bytes']))# 使用 image_id 作为图像文件名image_name = f"{image_id}.jpg"# 根据标签选择目标子文件夹if label   == 'image_file':target_dir = image_direlif label == 'edited_file':target_dir = edited_direlif label == 'visual_input':target_dir = visual_input_direlse:continue  # 如果标签没有匹配的,跳过# 定义目标保存路径target_path = os.path.join(target_dir, image_name)# 保存图片image.save(target_path)else:print(f"Skipping invalid data for {label} in row {index}")# 将非图像数据保存为 JSON 文件
json_file_path = './data.json'
with open(json_file_path, 'w') as json_file:json.dump(non_image_data, json_file)print(f"Non-image data saved to '{json_file_path}'")

http://www.yayakq.cn/news/415824/

相关文章:

  • wordpress网站文章排版插件科技网络有限公司
  • 网站怎么设置qq公司注册资金认缴和实缴的区别
  • wordpress 自建网站如何做淘客发单网站
  • 随州网站建设有哪些阿里指数数据分析平台官网
  • 网站空间20g网站服务器出错是什么意思
  • 网站搭建dns有用吗机关网站及新媒体建设实施方案
  • 移动ui设计 网站郑州世界工厂网
  • 湖南网站建设公司 地址磐石网络周口网站seo
  • 手机网站建设必要性长沙广告网络公司
  • 东源县住房和城乡建设部网站上海科技网络公司
  • 嘉定网站建设哪家好找商务合作的平台
  • 做网站需求需要沟通什么wordpress主题栏
  • wordpress适合大型网站吗网站上面关于我们要怎么填写
  • 网站源码绑定域名处理爱站网长尾关键词挖掘
  • 做网站能用思源黑体吗横沥网站建设
  • 青海报社网站建设公司做蛋糕网站的优点
  • 杭州网站关键词排名网站模板源码
  • 网站开发 附加协议麦客网做网站
  • 呼和浩特网站seo群晖怎样做网站
  • 网站建设总流程wordpress搭建企业网站
  • 易营宝智能建站wordpress微信分享记录
  • 提高网站规范化建设石家庄市住房和城乡建设局官方网站
  • 邗江区建设局网站网页设计意图怎么写
  • 济宁网站建设公司怎么样wordpress中文版书籍
  • 关键词竞价排名是什么意思如何优化网络连接
  • 三、网站开发使用软件环境树莓派怎么打开 wordpress
  • 朝阳网站开发联系电话产品建站工具
  • 东莞网站建设员网站开发与设计实训心得
  • 电子方案网站建设方案网站公司大全
  • 怎么给网站做备份呢广州代注册公司哪家好