深圳市汇通博泰数码科技有限公司卢庚圣获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市汇通博泰数码科技有限公司申请的专利录音笔关键词声音识别方法、装置及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119964600B 。
龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510066773.8,技术领域涉及:G10L25/51;该发明授权录音笔关键词声音识别方法、装置及设备是由卢庚圣;邓奕文设计研发完成,并于2025-01-16向国家知识产权局提交的专利申请。
本录音笔关键词声音识别方法、装置及设备在说明书摘要公布了:本发明涉及声音识别技术领域,公开了一种录音笔关键词声音识别方法、装置及设备,该方法包括:对录音笔采集的原始声音信号进行傅里叶变换和时域随机化处理,得到目标时域声音信号;提取目标时域声音信号中音调特征、音色特征和响度特征,生成目标声音特征向量;基于多个标准语音样本建立标准基线特征库;对目标声音特征向量进行加权k‑means聚类分析,生成动态特征权重矩阵;将目标声音特征向量和所述动态特征权重矩阵输入图结构多任务学习模型进行关键词识别,输出初始关键词识别结果;根据标准基线特征库,对初始关键词识别结果进行加权优化,生成目标关键词识别结果,本发明提升了录音笔的关键词声音识别结果的准确性。
本发明授权录音笔关键词声音识别方法、装置及设备在权利要求书中公布了:1.一种录音笔关键词声音识别方法,其特征在于,所述方法包括: 对录音笔采集的原始声音信号进行傅里叶变换和时域随机化处理,得到目标时域声音信号;具体包括:对所述录音笔采集的原始声音信号进行采样频率归一化处理,得到标准化采样信号;对所述标准化采样信号进行分帧处理,将所述标准化采样信号划分为多个时间窗口帧,得到分帧信号序列,并对所述分帧信号序列进行短时傅里叶变换处理,得到频域信号谱;对所述频域信号谱进行幅值归一化处理,得到归一化频域信号谱;根据高斯分布概率密度函数对所述归一化频域信号谱进行随机化变换,得到满足高斯分布的随机化频域信号,并对所述随机化频域信号进行反傅里叶变换,得到初始时域信号;对所述初始时域信号进行均方根值计算,得到特征均方根值,并根据所述特征均方根值计算信噪比参数;根据所述信噪比参数对所述初始时域信号进行自适应滤波处理,得到目标时域声音信号; 提取所述目标时域声音信号中音调特征、音色特征和响度特征,生成目标声音特征向量;具体包括:对所述目标时域声音信号进行倒谱分析,提取基频特征数据,并对所述基频特征数据进行梅尔频率变换,得到音调特征数据;对所述目标时域声音信号进行短时能量分析,计算每个时间帧的能量分布,得到响度特征数据,并对所述目标时域声音信号进行线性预测编码分析,提取声道参数,得到音色特征数据;将所述音调特征数据、所述响度特征数据和所述音色特征数据组合构建特征矩阵,输入全卷积神经网络的全连接层;在所述全连接层中,对所述特征矩阵进行卷积运算和非线性激活函数处理,得到初级组合特征数据,并对所述初级组合特征数据设定阈值进行特征重要性评分,生成重要性得分矩阵;根据所述重要性得分矩阵对所述初级组合特征数据进行稀疏化处理,保留高重要性特征,得到筛选后的特征数据,并对所述筛选后的特征数据进行降维处理,生成目标声音特征向量; 基于多个标准语音样本建立标准基线特征库;具体包括:分别对所述多个标准语音样本进行傅里叶变换和时域随机化处理,得到多个标准时域声音信号,并分别对所述多个标准时域声音信号进行声音特征提取,得到多个标准声音特征向量;对所述多个标准声音特征向量进行数据分割,按照训练集和验证集8:2的比例划分,得到训练特征向量和验证特征向量;基于所述训练特征向量构建N棵决策树,对每棵决策树随机选择M个特征节点进行分裂计算,得到映射关系,其中,N为决策树数量,M为特征节点数量;对所述训练特征向量的每个维度计算概率密度函数值,构建K个高斯分布模型,得到特征维度概率分布矩阵,其中,K为高斯分布模型数量;根据所述特征维度概率分布矩阵进行期望最大化迭代计算,得到特征分布模型;将所述验证特征向量分别输入所述映射关系和所述特征分布模型进行预测计算,得到模型融合权重系数,并根据所述模型融合权重系数将所述映射关系和所述特征分布模型进行线性组合,得到标准基线特征库; 对所述目标声音特征向量进行加权k-means聚类分析,生成动态特征权重矩阵; 将所述目标声音特征向量和所述动态特征权重矩阵输入图结构多任务学习模型进行关键词识别,输出初始关键词识别结果; 根据所述标准基线特征库,对所述初始关键词识别结果进行加权优化,生成目标关键词识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市汇通博泰数码科技有限公司,其通讯地址为:518000 广东省深圳市宝安区西乡街道龙珠社区润东晟工业园7栋6层A;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励