当前位置: 首页 > news >正文

衡水精品网站建设价格百度查重

衡水精品网站建设价格,百度查重,徐州网约车公司哪家好,路桥贝斯特做网站好吗语音识别在会议点名中的使用 概要解决问题的过程不行的一些参考可以的一个package自定义词语的拼音转换遗留的问题 小结 概要 提示:这里可以添加技术概要 这里只实现一个方面,每个android会议设备都可通过语音发送参会者姓名,自动转换成文字添加到人员名单. 语音采集…

语音识别在会议点名中的使用

    • 概要
    • 解决问题的过程
      • 不行的一些参考
      • 可以的一个package
      • 自定义词语的拼音转换
      • 遗留的问题
    • 小结

概要

提示:这里可以添加技术概要
这里只实现一个方面,每个android会议设备都可通过语音发送参会者姓名,自动转换成文字添加到人员名单.
语音采集和发送,是通路.
识别是核心.目前的模型和模块都是针对通用语言的,在这里不合适,我只要适合的名字,并且容易添加新的名字.
最后能接受自主调节.
听得懂指令. 看似需要AI支持了,难搞.

解决问题的过程

不行的一些参考

. https://alphacephei.com/vosk/lm
这是vosk的调整,明显还不支持中文

https://github.com/Uberi/speech_recognition/blob/master/reference/pocketsphinx.rst#installing-other-languages
这是pocketsphinx在speechrecognition中的表示,看似可以调整,但是难度有点太大了.
如同vosp中说的端到端,复杂程度大,但是通用性好.可是我只想加个词典,居然这么难的吗.

可以的一个package

`提示: pocketsphinx 5.0.3
这里 pypy:https://pypi.org/project/SpeechRecognition/
原理就用里面的离线库 spinx
准备中文库
这里的中文库从:
https://jaist.dl.sourceforge.net/project/cmusphinx/Acoustic%20and%20Language%20Models/Mandarin/cmusphinx-zh-cn-5.2.tar.gz?viasf=1
来源
https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Mandarin/

它可以搭配 /SpeechRecognition/ 中的sphinx使用,然而 pocketsphinx却不行.

然后借鉴这里https://blog.csdn.net/Zbreakzhong/article/details/109127837
对中文单词进行编码

将cmusphinx-zh-cn-5.2.tar.解压后放入
,\Lib\site-packages\speech_recognition\pocketsphinx-data\zh-CN
仿照 en-US,为个别文件和文件夹命名.
然后就可以更改根目录下dic文件
演示

段*栓 d uan4 h ong2 sh uan1
石*阳 sh ix2 x iang4  ii ang2
张*嘉 zh ang1 s ai4 j ia1

准备好后

 import speech_recognition as sr# 创建Recognizer对象
r = sr.Recognizer()# 从音频文件中识别语音
def recognize_speech_from_file(file_path):with sr.AudioFile(file_path) as source:audio = r.record(source)  # 读取音频文件try:text = r.recognize_sphinx(audio, language='zh-CN')  # 使用Google语音识别引擎识别语音return textexcept sr.UnknownValueError:print("无法识别音频")except sr.RequestError as e:print("无法连接到Google语音识别服务:{0}".format(e))# 从麦克风实时录制并识别语音
def recognize_speech_from_microphone():with sr.Microphone() as source:print("请开始说话...")audio = r.listen(source)  # 实时录制音频try:text = r.recognize_sphinx(audio, language='zh-CN')  # 使用Google语音识别引擎识别语音return textexcept sr.UnknownValueError:print("无法识别音频")except sr.RequestError as e:print("无法连接到Google语音识别服务:{0}".format(e))# 调用函数进行语音识别
file_text = recognize_speech_from_file('audio.wav')
print("音频文件识别结果:", file_text)mic_text = recognize_speech_from_microphone()
print("麦克风实时识别结果:", mic_text)

自定义词语的拼音转换

使用pypinyin,由于一开始想,也许可以听得懂拼音.只是字错.所以想用听来的字,转成拼音, 比对字典文字的拼音. 写了一上午后发现,拼音是听不懂的. 错误率的一半以上…但是这部分代码,可以借给生成 spinx的单词注音用.
目前来看 y, ii, w,uu, shi 是shix,需要一些这样的调节,其他都是一样的.另外取消了多音字的处理.

from pypinyin import pinyin, lazy_pinyin, Style
def name2py(name,duoyin=True):return  pinyin(name, heteronym=duoyin,style=Style.TONE3)
#names内容一行一个人名,转换成, dic的注音版
def getnames():
with open("names.txt", 'r',encoding ='utf-8') as nf:lines=[ln.strip() for ln in nf.readlines()]return lines
pinyin('中乐', heteronym=True,style=Style.TONE3)    nms=getnames()
pys=list(map(name2py,nms))#test=[['gao1', 'gao4'], ['lei2', 'lei4']]
#tar=[['gao1'],['lei2']]
#r=find1py(tar,test) 
def find1py(onepy,oneitem):if len(onepy)!=len(oneitem):return Falsefor (i,j) in zip(onepy,oneitem):if i[0][-1].isdigit():i=i[0][:-1]print(j)print("i in "+i)if ','.join(j).find(i)==-1:return Falsereturn True         def godo(name,pys=pys,nms=nms):target = name2py(name,duoyin=False)for i,item in  enumerate(pys):print(item)if  find1py(target,item):return nms[i]return None
def writedic():with open('zh.dic.txt','w') as wf:for i in nms[:30]:final=pinyin(i, heteronym=False,style=Style.INITIALS)rt=name2py(i,False)toget=i+" "for init ,r in zip(final,rt):r=r[0].replace("zhi","zhix").replace("chi","chix").replace("shi","shix")r= r.replace(init[0],'')r=r.replace('w','uu ').replace('y','ii ')toget+=fr"{init[0]} {r} "print (toget[:-1])#r=godo("含风",pys,nms)writedic() 

遗留的问题

忙音和部分语音会出现串位不知道为啥,有时候说一个人会出来两个
还有就是网络接口的调节, 接受语音提供反馈,vosp自身有这个功能. 目前用的没有.

小结

提示:这里可以添加总结
虽然已经结束了初步测试,但是还有性能和调优和网络化服务的需求.

http://www.yayakq.cn/news/151431/

相关文章:

  • 产品设计招聘网站微信公众号发文章教程
  • 网站后台无法修改电商哪个平台销量最好
  • 软件开发涵盖网站开发吗自学网站建设买什么书
  • 深圳沙头网站建设做盗市相关网站
  • 宁波关键词优化企业网站建设高端网站建设信息
  • 移动论坛网站模板免费下载汕头建站程序
  • seo网站推广策略医疗网站怎么做优化
  • 南京网站seo服务垂直行业门户网站建设方案
  • 重庆哪里做网站网站 备案 换空间
  • 枣庄公司网站建设怎样建立一个企业网站
  • 网站分几种类型在线编写html网页代码
  • 做网站的服务器很卡怎么办生成短链接的网站
  • 提升网站流量的方法域名申请成功后怎么做网站
  • 图片上传不了网站洛阳网站建设培训学校
  • 建立网站的注意事项网站开发商城1688
  • 一个网站同时做百度和360 百度商桥都可以接收客户信息吗免费域名解析ip
  • 网站建设jiage做网站怎么那么难
  • 什么网站做h5不收费js怎么做网页
  • 专业做化妆品的网站公众号网页版
  • 丹东 网站开发外包网站建设是什么意思
  • 网站开发招标采购需求网站报备流程
  • 天津网站seo策划上海招聘信息最新招聘2021
  • 工作室做网站北京工程建设交易信息网官网
  • 网站开发怎么谈调兵山网站建设
  • 东莞seo建站优化工具网站做视频
  • 洛阳做网站哪家专业wordpress 表格 链接地址
  • 很多网站没有后台做医疗的网站
  • 阿里网站域名要购卖吗wordpress时间排序
  • 门户网站和网站的区别深圳市宝安区邮编
  • wordpress 多备份淄博网络优化哪家专业