当前位置: 首页 > news >正文

做机械比较好的外贸网站深圳外贸公司联系电话

做机械比较好的外贸网站,深圳外贸公司联系电话,做篮球视频网站,受欢迎的永州网站建设动手学习RAG: 向量模型动手学习RAG: moka-ai/m3e 模型微调deepspeed与对比学习动手学习RAG:rerank模型微调实践 bge-reranker-v2-m3动手学习RAG:迟交互模型colbert微调实践 bge-m3动手学习RAG: 大模型向量模型微调 intfloat/e5-mistral-7b-instruct动手学…
  • 动手学习RAG: 向量模型
  • 动手学习RAG: moka-ai/m3e 模型微调deepspeed与对比学习
  • 动手学习RAG:rerank模型微调实践 bge-reranker-v2-m3
  • 动手学习RAG:迟交互模型colbert微调实践 bge-m3
  • 动手学习RAG: 大模型向量模型微调 intfloat/e5-mistral-7b-instruct
  • 动手学习RAG:大模型重排模型 bge-reranker-v2-gemma微调

在这里插入图片描述

1. 环境准备

pip install transformers
pip install open-retrievals
  • 注意安装时是pip install open-retrievals,但调用时只需要import retrievals
  • 欢迎关注最新的更新 https://github.com/LongxingTan/open-retrievals

2. 使用大模型做重排

from retrievals import LLMRankermodel_name = 'BAAI/bge-reranker-v2-gemma'
model = LLMRanker.from_pretrained(model_name,causal_lm=True,use_fp16=True,)score = model.compute_score(['query', 'passage'])
print(score)scores = model.compute_score([['what is panda?', 'hi'], ['what is panda?', 'The giant panda (Ailuropoda melanoleuca), sometimes called a panda bear or simply panda, is a bear species endemic to China.']])
print(scores)

请添加图片描述

3. 微调

MODEL_NAME='BAAI/bge-reranker-v2-gemma'
TRAIN_DATA="/root/kag101/src/open-retrievals/t2/t2_ranking.jsonl"
OUTPUT_DIR="/root/kag101/src/open-retrievals/t2/ft_out"torchrun --nproc_per_node 1 \-m retrievals.pipelines.rerank \--output_dir ${OUTPUT_DIR} \--overwrite_output_dir \--model_name_or_path $MODEL_NAME \--model_type llm \--causal_lm True \--use_lora True \--data_name_or_path $TRAIN_DATA \--task_prompt "Given a query A and a passage B, determine whether the passage contains an answer to the query by providing a prediction of either 'Yes' or 'No'." \--query_instruction "A: " \--document_instruction 'B: ' \--positive_key positive \--negative_key negative \--learning_rate 2e-4 \--num_train_epochs 3 \--per_device_train_batch_size 4 \--gradient_accumulation_steps 16 \--dataloader_drop_last True \--max_len 256 \--train_group_size 4 \--logging_steps 10 \--save_steps 20000 \--save_total_limit 1 \--bf16

请添加图片描述

4. 评测

在C-MTEB中进行评测。微调前保留10%的数据集作为测试集验证

微调前的指标:
请添加图片描述

微调后的指标:

请添加图片描述

{"dataset_revision": null,"mteb_dataset_name": "CustomReranking","mteb_version": "1.1.1","test": {"evaluation_time": 77.35,"map": 0.7057362287508586,"mrr": 0.8166538440773136}
}

微调后map从0.637上升至0.706,mrr从0.734上升至0.816

http://www.yayakq.cn/news/870232/

相关文章:

  • 北京网站定制设计开发公司大城网站优化
  • 绵阳定制网站建设面料做电商 哪个网站好
  • 聊城做网站的公司流程找人做网站服务器不是自己的怎么办
  • 石景山做网站公司建设一个网站需要考虑什么
  • ui个人作品集网站办公用品网站建设可行性分析
  • 自动发卡网站开发网络课程网站建设
  • 天水市建设路第二小学网站营子区住房和城乡建设局网站
  • 地产网站建设公司谷歌seo视频教程
  • 怎么样才算是一个网站页面简单网站开发准备
  • 用wordpress做答题网站营销型网站是啥意思
  • 千博企业网站管理系统完整版 2014百度官方网站怎么做
  • 狠抓措施落实电脑优化软件推荐
  • 网站标题字数wordpress开发教程 pdf
  • 网站外包多少人做公司网站建设征稿令
  • 个人网站上线流程官方微网站吗
  • 山东省住房城乡建设部网站首页成都航空公司官方网站
  • 长沙网站推广优化正规代加工项目
  • 服装网站建设物流配送系统台州市建设规划局网站6
  • 南海建设工程交易网站wordpress设置背景音乐
  • 做网站维护需要懂什么帝国网站单页做301
  • 西宁做网站的公司东莞哪家网站建设
  • 官方网站下载微信霍林郭勒市建设局网站
  • 哈尔滨快速建站点击查看西安建设主管部门官方网站
  • 做ppt选小图案的网站网站定制开发前期要有一定的规划
  • 用博客网站做淘宝客中山网站建设推荐
  • 网站建设如何增加流量贵阳网站开发公司推荐
  • 如何让百度收录网站做影视会员网站
  • 网站后台发了文章看不到网站开发工具 n
  • 做网站分什么深圳网站建设专家
  • 昆明电子商务网站建设四川省建设招标网站首页