歌尔股份有限公司张圣获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉歌尔股份有限公司申请的专利语音唤醒方法、电子设备、存储介质及计算机程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120673760B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511189911.8,技术领域涉及:G10L15/22;该发明授权语音唤醒方法、电子设备、存储介质及计算机程序产品是由张圣;吴劼设计研发完成,并于2025-08-25向国家知识产权局提交的专利申请。
本语音唤醒方法、电子设备、存储介质及计算机程序产品在说明书摘要公布了:本申请公开了一种语音唤醒方法、电子设备、存储介质及计算机程序产品,涉及信号处理技术领域,包括:获取声音信号,对声音信号进行特征提取得到至少两个通道的二维信号特征,其中,二维信号特征的两个维度为时间维度和频率维度;对各通道的二维信号特征进行卷积处理得到至少一个通道的特征图,其中,卷积处理包括至少一次深度可分离卷积处理,深度可分离卷积处理包括二维逐深度卷积处理和二维逐点卷积处理;基于各通道的特征图识别得到语音唤醒词识别结果。本申请极大地降低了算法的参数量和计算量,并提升了端侧语音唤醒在复杂场景下的表现。
本发明授权语音唤醒方法、电子设备、存储介质及计算机程序产品在权利要求书中公布了:1.一种语音唤醒方法,其特征在于,所述语音唤醒方法包括: 获取声音信号,对所述声音信号进行特征提取得到至少两个通道的二维信号特征,其中,所述二维信号特征的两个维度为时间维度和频率维度; 对各通道的所述二维信号特征进行卷积处理得到至少一个通道的特征图; 基于各通道的所述特征图识别得到语音唤醒词识别结果; 所述对各通道的所述二维信号特征进行卷积处理得到至少一个通道的特征图的步骤包括: 采用预设的顺次连接的至少两个深度可分离卷积结构对各通道的所述二维信号特征进行卷积处理,得到各所述深度可分离卷积结构分别对应的输出数据,其中,第一个所述深度可分离卷积结构的输入数据为各通道的所述二维信号特征,第一个所述深度可分离卷积结构之后的各所述深度可分离卷积结构的输入数据为上一个所述深度可分离卷积结构的输出数据,对于每个所述深度可分离卷积结构,将输入数据输入所述深度可分离卷积结构进行卷积处理得到处理结果,所述输入数据与所述处理结果相加,得到所述深度可分离卷积结构的输出数据; 将各所述输出数据相加,得到至少一个通道的特征图; 其中,所述深度可分离卷积结构包括顺次连接的逐深度卷积模块、第一归一化激活模块、逐点卷积模块以及第二归一化激活模块;所述逐深度卷积模块包括与输入数据中每个通道的二维特征分别对应的第一类型的卷积核,所述第一类型的卷积核用于对相应通道的二维特征进行卷积处理;所述逐点卷积模块包括至少一个第二类型的卷积核,所述第二类型的卷积核的尺寸为1×1×M,M为所述第一归一化激活模块的输出通道数; 所述获取声音信号,对所述声音信号进行特征提取得到至少两个通道的二维信号特征的步骤包括: 采用包括至少两个麦克风的麦克风阵列采集获得至少两个通道的声音信号,对每个通道的声音信号进行特征提取,得到每个通道分别对应的单通道的二维信号特征,组合得到至少两个通道的二维信号特征; 或,对单通道的声音信号采用至少两种特征提取方式进行特征提取,得到至少两种二维信号特征,每种二维信号特征作为一个通道,得到至少两个通道的二维信号特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人歌尔股份有限公司,其通讯地址为:261031 山东省潍坊市高新技术产业开发区东方路268号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励