当前位置: 首页 > news >正文

心力建网站精品网站建设费用 c磐石网络

心力建网站,精品网站建设费用 c磐石网络,app营销十大成功案例,网站建设 技术服务🥰大家知道吗,之前在给AI大模型"喂数据"的时候,我们往往需要把非结构化数据(比如PDF、PPT、Excel等)自己手动转成结构化的格式,这可真是太累人儿了。🥵 幸好现在有了Unstructured这个神级库,它内置的数据提取函数可以帮我们快速高效地完成这个…

🥰大家知道吗,之前在给AI大模型"喂数据"的时候,我们往往需要把非结构化数据(比如PDF、PPT、Excel等)自己手动转成结构化的格式,这可真是太累人儿了。🥵

幸好现在有了Unstructured这个神级库,它内置的数据提取函数可以帮我们快速高效地完成这个转换过程。而且支持常见的多种文件格式!🐶

比如说,如果我们要从一个PPT文件里提取数据,可以用partition_pptx函数:

from unstructured.partition.pptx import partition_pptxfilename = "example_files/msft_openai.pptx"
elements = partition_pptx(filename=filename)

这个函数会把PPT文件的内容解析成一个elements列表,每个元素都是一个Element对象,分别代表PPT里的标题、文字、图片等内容。

但是我们想要的是结构化数据而不是对象呀,所以还需要再转换一下:

element_dict = [el.to_dict() for el in elements]
print(json.dumps(element_dict, indent=2))

这两行代码的作用是:

  1. 遍历elements列表,把每个Element对象都转换成字典(调用它们的to_dict方法)
  2. 把这些字典组成一个新列表element_dict
  3. 使用json.dumpselement_dict转成Json格式的字符串,并指定indent=2让结果更加美观

是不是很酷?现在我们就拥有了结构化的数据啦!

如果是PDF文件的话,流程也差不多:

from unstructured.shared import Files, PartitionParameters
from unstructured.openai_api import SDKfilename = "example_files/CoT.pdf"
with open(filename, "rb") as f:files = Files(content=f.read(), file_name=filename)req = PartitionParameters(files=files, strategy='hi_res', pdf_infer_table_structure=True)s = SDK.get_instance() 
resp = s.general.partition(req)
print(json.dumps(resp.elements, indent=2))

这里主要新的地方是用Files对象来存PDF文件的内容,然后定义一个PartitionParameters来设置处理策略(比如识别表格等)。

最后就是创建SDK实例,调用partition方法,传入之前定义的参数,就能获取PDF里的结构化数据啦!

对于Excel文件,官方文档里也有介绍,应该也是类似的操作。

有了这些技能,我们就能把海量的非结构化数据高效地转换成结构化格式,喂给大模型"吃"啦!以后制作AI应用的时候,效率和开发体验都会更上一层楼~🚀

http://www.yayakq.cn/news/104096/

相关文章:

  • 网站开发主要技术网站后台添加表格
  • 贵阳网站开发哪家专业如何更快的学习.net网站开发
  • 中国建设项目招标网站网站整体规划
  • 杨凌网站建设公司WordPress如何迁移数据
  • 国外网站托管青岛的互联网公司排名
  • 李洋网络做网站编程是什么
  • 阿里云网站地图是怎么做的优秀设计网站推荐
  • 网站开发外包价格wordpress 停站
  • 天元网络揭阳百度推广优化
  • 行唐县做网站电话wordpress date
  • 四川建设厅官方网站查询济南市建设执业资格注册中心网站
  • 源码超市网站源码西安高端网站建设哪家好
  • 网站备案 人在上海cms监控软件手机版
  • 广州公司建站网站域名分类
  • 因脉网站建设公司怎么呀韩国拓者室内设计网站
  • 环球贸易网站东莞建站公司
  • 哈尔滨营销型网站建设公司怎样用网络挣钱
  • 官方网站建设对比株洲专业做网站设计的
  • 天津做个网站需要多少钱div做网站
  • 怎么删除网站的死链要做一个网站得怎么做
  • 北京网站建设公司哪家最好wordpress api接口
  • 网络销售怎么干网站优化新闻
  • 医院网站建设山东查询个人信息的网站
  • 南宁做网站优化的公司wordpress排版
  • 网站个人备案需要什么开发一个安卓app
  • 大兴网站开发网站建设咨询微信公众号转入公司网站建设
  • 在线网站建设建议vs做的网站案例
  • 上海微信网站公司新网站怎样做推广
  • 店面门头设计网站番禺建设网站报价
  • 长沙做公司网站英文网站制作++官网