联通沃音乐文化有限公司廖乔勃获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉联通沃音乐文化有限公司申请的专利一种语音通话实时转写系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120526774B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511028384.2,技术领域涉及:G10L15/26;该发明授权一种语音通话实时转写系统及方法是由廖乔勃;李韩;陈星;林文迪;邹西山设计研发完成,并于2025-07-25向国家知识产权局提交的专利申请。
本一种语音通话实时转写系统及方法在说明书摘要公布了:本发明提供了一种语音通话实时转写系统及方法,涉及计算机技术领域,所述系统包括:网元模块用于当检测到用户端的通话请求时,获取对应的音频数据;语音送流引擎,用于基于预设感知加权矢量量化算法,对音频数据进行分层压缩,得到音频压缩数据,并对音频压缩数据进行格式转化处理,得到临时音频数据;语音引擎,用于对临时音频数据进行特征提取,得到多模态特征数据,并基于预设的语音识别模型对多模态特征数据进行处理,得到文本信息;分析优化模块,用于基于预设大模型,根据文本信息和预设词汇库得到对应的实时转写文本数据。本发明通过利用多模态特征数据,全面表征语音信息,使得语音识别模型能够更准确地进行语音到文本的转换。
本发明授权一种语音通话实时转写系统及方法在权利要求书中公布了:1.一种语音通话实时转写系统,其特征在于,包括网元模块、语音送流引擎、语音引擎和分析优化模块; 所述网元模块,用于当检测到用户端的通话请求时,获取对应的音频数据; 所述语音送流引擎,用于基于预设感知加权矢量量化算法,对所述音频数据进行分层压缩,得到音频压缩数据,并对所述音频压缩数据进行格式转化处理,得到临时音频数据; 所述语音引擎,用于对所述临时音频数据进行特征提取,得到多模态特征数据,并基于预设的语音识别模型对所述多模态特征数据进行处理,得到文本信息; 其中,所述多模态特征数据包括声纹特征数据和声学参数数据;所述对所述临时音频数据进行特征提取,得到多模态特征数据,包括: 对所述临时音频数据进行特征提取,得到所述声纹特征数据; 对所述临时音频数据进行识别,得到所述声学参数数据; 所述分析优化模块,用于基于预设大模型,根据所述文本信息和预设词汇库得到对应的实时转写文本数据; 其中,所述预设词汇库的构建过程包括: 获取对应的历史通话文本数据,并基于BiLSTM-CRF模型对所述历史通话文本数据进行识别,得到关键词信息,所述关键词信息包括术语数据和关键词数据; 根据各所述关键词信息确定对应的权重信息,并根据对应的所述权重信息对所述关键词信息进行排序和筛选,得到高频术语及个性化关键词; 根据所述高频术语及所述个性化关键词确定对应的所述预设词汇库。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人联通沃音乐文化有限公司,其通讯地址为:510000 广东省广州市黄埔区科学大道8号5栋201房5栋202房5栋203房5栋204房5栋205房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励