厦门亿联网络技术股份有限公司陈纪锦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门亿联网络技术股份有限公司申请的专利一种用于麦克风阵列会议设备的语音识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118887956B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411137459.6,技术领域涉及:G10L15/22;该发明授权一种用于麦克风阵列会议设备的语音识别方法及装置是由陈纪锦;毕永建设计研发完成,并于2024-08-19向国家知识产权局提交的专利申请。
本一种用于麦克风阵列会议设备的语音识别方法及装置在说明书摘要公布了:本申请涉及智能语音交互技术领域,公开了一种用于麦克风阵列会议设备的语音识别方法及装置,其方法包括获取任一单通道的输入音频;采用预设的3A模型对输入音频进行频带建模,融合提取的特征,经过复数网络计算,得到一个掩码作用于输入音频以得到目标音频;将目标音频输入预设的语音唤醒模型,确定唤醒词的音频段;判断是否存在人声;若存在人声,则利用预设的提取模型提取唤醒人声纹特征,确定唤醒人的音频段;将当前帧的唤醒人的音频段输入预设的人声识别模型进行人声指令识别,得到唤醒人的人声指令,通过语言模型识别人声指令对应的意图,并响应唤醒人的人声指令。本申请具有在会议室多人讲话的场景下,改善人声指令和唤醒词识别精度的效果。
本发明授权一种用于麦克风阵列会议设备的语音识别方法及装置在权利要求书中公布了:1.一种用于麦克风阵列会议设备的语音识别方法,其特征在于,包括以下步骤,获取任一单通道的待识别语音数据,得到输入音频; 采用预设的3A模型对所述输入音频进行降噪处理,得到目标音频; 所述3A模型对所述输入音频进行频带建模,融合提取的特征,经过复数网络计算,得到一个掩码,所述掩码作用于所述输入音频以得到目标音频; 将所述目标音频输入预设的语音唤醒模型,输出是否存在唤醒词及所述唤醒词的唤醒率,确定唤醒词的音频段; 根据所述唤醒词的音频段,判断是否存在人声; 若存在人声,则利用预设的提取模型提取存在人声的所述唤醒词的音频段中的唤醒人声纹特征,判断当前帧是否为唤醒人的声音,确定唤醒人的音频段; 将当前帧的所述唤醒人的音频段输入预设的人声识别模型进行人声指令识别,得到唤醒人的人声指令,通过语言模型识别人声指令对应的意图,并响应所述唤醒人的人声指令; 所述人声识别模型包括流式推理模型和非流式推理模型,所述人声识别模型的识别流程包括,模型初始化,将预设的实体槽位信息列表中对应的关键词设计成为热词,并加载至所述非流式推理模型中;将当前帧的所述唤醒人的音频段输入所述流式推理模型进行实时的语音识别,输出实时文本数据;若当前帧的所述唤醒人的音频段为最后一帧时,整合之前的所有的唤醒人的音频段,输入所述非流式推理模型中识别推理和搜索,输出完整文本数据; 其中,还包括:根据预配置的意图列表,基于所述意图列表中的槽位和实体信息构建有限状态机,查询所述实时文本数据和所述完整文本数据中是否存在对应的实体槽位;同时,若存在对应的实体槽位,则按照所述实体槽位构建搜索树;利用所述实体槽位在所述搜索树中按照深度优先进行搜索,得到对应的意图和所需的槽位信息并返回,同时响应所述唤醒人的人声指令。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门亿联网络技术股份有限公司,其通讯地址为:361009 福建省厦门市湖里区高新技术园护安路666号亿联网络总部大楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励