当前位置: 首页 > news >正文

网站搬家内页打不开菜鸟教程网站

网站搬家内页打不开,菜鸟教程网站,做彩票的网站有哪些,html个人网站源码Ovis简介 Ovis是阿里国际AI团队开源的多模态大模型,看新闻介绍效果不错,在多个场景的测试下都能达到SOTA,其中的Ovis1.6-Gemma2-9B在30B参数以下的模型中取得了综合排名第一,赶超MiniCPM-V-2.6等行业优秀大模型。所以我也部署一个…

Ovis简介

Ovis是阿里国际AI团队开源的多模态大模型,看新闻介绍效果不错,在多个场景的测试下都能达到SOTA,其中的Ovis1.6-Gemma2-9B在30B参数以下的模型中取得了综合排名第一,赶超MiniCPM-V-2.6等行业优秀大模型。所以我也部署一个看看效果,是否能够帮我提升工作效率。

Ovis 1.6 Gemma2-9B 适用于多种场景,包括但不限于:

  • 数学推理问答: 能够准确回答数学问题。
  • 物体识别: 识别花的品种等物体。
  • 文本提取: 支持多种语言的文本提取。
  • 复杂任务决策: 例如识别手写字体和复杂的数学公式。
  • 图像描述生成: 通过对图片的识别处理能够给出菜谱。
  • 视觉问答: 在图像理解任务上表现出色。

使用环境

操作系统: Ubuntu22.04

部署步骤

PIP库安装

1.克隆 Ovis 项目。如果 git clone 失败,可以直接下载 .ZIP 压缩包 Ovis项目地址

git clone git@github.com:AIDC-AI/Ovis.git

2.创建环境,安装依赖。

conda create -n ovis python=3.10 -y
conda activate ovis
cd Ovis
pip install -r requirements.txt
pip install -e .

报错批注:
在执行 pip install -r requirements.txt 时我遇到了下面的报错。

在这里插入图片描述
在这里插入图片描述

解决方法为,先执行下面的代码,再执行 pip install -r requirements.txt,实践可解决问题。

pip install setuptools_scm

模型下载

项目提供如图所示的三种参数大小的模型。我这里选择使用9B大小的 Ovis1.6-Gemma2-9B。(9B适合个人本地部署使用,根据自己的情况选择) 更多链接见项目

在这里插入图片描述

1.考虑的下载速度和稳定性,我这里使用 HuggingFace-Mirror 进行模型的下载。

git clone https://hf-mirror.com/AIDC-AI/Ovis1.6-Gemma2-9B

模型推理

该项目提供了两种推理方式,对应的程序都位于 /ovis/serve 目录中。

1.使用 runner.py 进行模型推理,需修改 runner.py 代码内容后,运行即可得到推理结果。

# 修改 runner.py 的这部分代码来实现推理
# 修改: 
# - <model_path>
# - <image_path>
# - <prompt>if __name__ == '__main__':runner_args = RunnerArguments(model_path='<model_path>')runner = OvisRunner(runner_args)image = Image.open('<image_path>')text = '<prompt>'response = runner.run([image, text])print(response['output'])

修改内容后,执行代码的效果如下。

在这里插入图片描述

上传的图片如下:
在这里插入图片描述

2.运行 server.py, 基于 Gradio 界面进行推理。

python ovis/serve/server.py --model_path MODEL_PATH --port PORT

执行命令后会产生下面的界面。

在这里插入图片描述

server.py 的完整代码如下(我加上了中文注释)

import argparse
import os.pathimport gradio as gr
from gradio.components import Textbox, Image
from ovis.serve.runner import RunnerArguments, OvisRunnerclass Server:"""Server 类用于封装 OvisRunner 实例,并提供一个可调用接口来处理图像和文本输入。它会接收来自 Gradio 界面的请求,将这些请求传递给 OvisRunner 进行推理,并返回结果。"""def __init__(self, runner: OvisRunner):"""初始化 Server 类实例时,传入一个已经配置好的 OvisRunner 实例。:param runner: 已经初始化并准备就绪的 OvisRunner 实例。"""self.runner = runnerdef __call__(self, image, text):"""当 Server 实例被像函数一样调用时,此方法会被执行。接收图像和文本作为输入参数,调用 runner.run 方法执行模型推理,并返回模型输出的结果。:param image: 用户上传的 PIL 图像对象。:param text: 用户输入的文本字符串。:return: 模型推理得到的结果字符串。"""response = self.runner.run([image, text])  # 执行模型推理output = response["output"]  # 获取推理结果中的 "output" 字段return outputif __name__ == '__main__':parser = argparse.ArgumentParser(description='启动 Ovis 模型的服务端')# 添加命令行参数解析器选项parser.add_argument('--model_path', type=str, required=True,help='指定 Ovis 模型文件或目录的路径。')parser.add_argument('--flagging_dir', type=str, default=os.path.expanduser('~/ovis-flagged'),help='设置保存用户提交数据副本(标记)的目录,默认为 ~/ovis-flagged。')parser.add_argument('--max_partition', type=int, default=9,help='设置模型的最大分区数,这可能与模型分片有关,默认为 9。')parser.add_argument('--port', type=int, required=True,help='指定服务监听的端口号。')args = parser.parse_args()  # 解析命令行参数# 确保标记目录存在,如果不存在则创建它os.makedirs(args.flagging_dir, exist_ok=True)# 创建 RunnerArguments 对象,用于配置 OvisRunnerrunner_args = RunnerArguments(model_path=args.model_path,max_partition=args.max_partition)# 使用 OvisRunner 和 Server 包装函数来创建 Gradio 应用程序界面demo = gr.Interface(fn=Server(OvisRunner(runner_args)),  # 函数:接收图像和文本,返回模型输出inputs=[Image(type='pil', label='图片'),  # 输入组件1:用于上传图片Textbox(placeholder='在这里输入文本...', label='提示')],  # 输入组件2:用于输入文本outputs=gr.Markdown(),  # 输出组件:以 Markdown 格式显示模型输出title=args.model_path.split('/')[-1],  # 应用标题:通常是模型路径的最后一部分flagging_dir=args.flagging_dir  # 标记目录:保存用户提交的数据副本)# 启动 Gradio 应用程序,监听指定端口demo.launch(server_port=args.port)

推理实测

注: 这里测评的是 Ovis 1.6 Gemma2-9B ,没有大规模的严谨测试,仅从使用角度上纯主观分享感受。

虽然我们可以看到各种说该模型的效果很强的帖子,但是实测下来存在几个问题.

1.显存占用,我使用的设备为24G显存,可以正常执行纯文本任务。在输入图片时,正常大小的图片都会导致炸显存 (只测试到 400*400及以上)。使用时需要考虑设备的显存大小。

2.文本提取,文本提取功能效果一般,效果如下所示。当图中有干扰的图像时不是很准确。

在这里插入图片描述

在这里插入图片描述

http://www.yayakq.cn/news/248191/

相关文章:

  • 6617网址导航彩票网站大全如何建网站的步骤
  • 番禺建设网站平台英山县城乡建设规划局网站
  • jsp网站维护页面模板只能选择已发表的内容
  • 网站四对联广告代码网上购物app
  • 电子商务专业就业方向淄博网站建设优化运营
  • 国产手机做系统下载网站wordpress博文怎么删
  • 网站建设的出路房地产趋势与前景
  • 网站开发无形资产常见的网页编辑工具有哪些
  • 微网站自助建站后台云南省建设工程信息网招标公告
  • 在本地做的网站怎么修改域名虚拟机wordpress教程视频
  • 修邦建设网站网站建设的分类
  • 网站开发亿玛酷技术WordPress分类信息主题
  • 做网站设计需要学会哪些注册一个空壳建筑公司
  • 平度做网站推广wordpress对联
  • 苏州外贸网站建设公司价格云南网站开发公司
  • 河南 网站备案seo整站优化
  • 百度注册网站怎么弄如何添加网站关键词
  • 网站域名所有权查询seo流量是什么
  • 网站建设个人wordpress模板在线编辑
  • 网站开发公司成本是什么在网站上做宣传
  • 济宁做网站多少钱电商都有哪些平台
  • 微网站怎么注册账号免费招工人在哪个网站
  • 个人网站logo图片有哪些网站可以做海报设计知乎
  • 网站建设平台点击进入免费空间大的网盘
  • 网站左侧漂浮导航天津装饰公司排行榜前十位有哪些
  • 如何做社交网站电子商务网站开发系统平台
  • 榆次做网站四川简阳建设局招标公告网站
  • 做网站需要什么花费网页设计与制作大赛
  • 便利店网站建设拓扑图用土豆做美食的视频网站
  • 酉阳网站建设股票海选公司用什么网站