Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 云南北飞科技有限公司林夕园获国家专利权

云南北飞科技有限公司林夕园获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉云南北飞科技有限公司申请的专利结合机器学习和深度学习的语音识别用语言处理系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120220666B

龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510551165.6,技术领域涉及:G10L15/20;该发明授权结合机器学习和深度学习的语音识别用语言处理系统是由林夕园;刘焱设计研发完成,并于2025-04-29向国家知识产权局提交的专利申请。

结合机器学习和深度学习的语音识别用语言处理系统在说明书摘要公布了:本发明涉及语言处理技术领域,具体地说,涉及结合机器学习和深度学习的语音识别用语言处理系统,其包括:音频采集处理单元用于采集音频信号;本体音色学习单元基于变分自编码器结合时序动态建模技术持续学习用户正常音色分布并构建主流音色学习模型,通过生成对抗网络结合KL散度检测技术构建主副流动态门控机制,判断当前音色是否偏离正常音色分布;噪音学习存储单元用于持续学习风噪特征及KTV噪声特征;本色语音识别单元基于主流音色学习模型和噪声特征库筛选用户语音信号进行语言处理。该结合机器学习和深度学习的语音识别用语言处理系统基于主流音色学习模型结合噪声特征库,在高噪声环境中锁定提取本体用户语音。

本发明授权结合机器学习和深度学习的语音识别用语言处理系统在权利要求书中公布了:1.结合机器学习和深度学习的语音识别用语言处理系统,其特征在于,包括: 音频采集处理单元1,所述音频采集处理单元1用于采集音频信号,并进行预处理以及提取音频特征; 本体音色学习单元2,所述本体音色学习单元2基于变分自编码器结合时序动态建模技术持续学习用户正常音色分布并构建主流音色学习模型,通过生成对抗网络结合KL散度检测技术构建主副流动态门控机制,动态判断当前音色是否偏离正常音色分布; 噪音学习存储单元3,所述噪音学习存储单元3用于持续学习风噪特征及KTV噪声特征,并存储至噪声特征库中; 本色语音识别单元4,所述本色语音识别单元4基于主流音色学习模型和噪声特征库,用于在嘈杂环境中筛选用户语音信号并使用端到端语音识别技术将其转化为文本语言; 所述本体音色学习单元2包括主流音色学习模块21和副流音色监测模块22; 其中,所述主流音色学习模块21基于变分自编码器结合时序动态建模技术构建主流音色学习模型,用于持续学习用户正常音色分布; 所述主流音色学习模块21基于变分自编码器结合时序动态建模技术构建主流音色学习模型,具体方法步骤如下: S2.1.1、从音频采集处理单元1中提取用户音频信号以及用户音频特征; 所述用户音频信号包括:时域用户音频信号和频域用户音频信号; 所述用户音频特征包括:用户MFCC音色特征、用户LPC倒谱系数和用户音色时序特征; S2.1.2、基于用户音频特征构建用户音色特征向量,并通过变分自编码器重构用户音色分布并优化变分自编码器; S2.1.3、基于用户音色分布,使用时序动态建模技术跟踪音色变化并分析当前音色状态; S2.1.4、基于用户音色分布和当前音色状态,构建主流音色学习模型; 所述S2.1.2中,基于用户音频特征构建用户音色特征向量,并通过变分自编码器重构用户音色分布并优化变分自编码器: 将用户音色特征向量输入到编码器中: ; ; 其中,为用户音色特征向量;为用户音色潜在变量;为用户MFCC音色特征;为用户LPC倒谱系数;为用户音色时序特征;为音色均值;为音色方差;为变分后验分布;为高斯分布; 通过解码器重构的用户音色特征: ; 其中,为音色特征的重构分布;为解码器的映射函数;为音色特征方差; 计算重构误差优化变分自编码器: ; 其中,为变分自编码器的总损失函数;为先验分布; 为变分后验分布和先验分布的KL散度;为重构误差; 所述S2.1.3中,基于用户音色分布,使用时序动态建模技术跟踪音色变化并分析当前音色状态,具体方法如下: 使用Kalman过滤器跟踪音色变化:;其中,为时间步;为时间步的音色状态向量;为音色变化转移矩阵;为时间步的音色状态向量;为高斯噪声项,表示音色状态在时间变化的不确定性,即模型误差项;使用GatedLSTM分析当前音色状态:; 其中,为当前时间步音色状态;为Sigmoid门控激活函数;为音色输入权重矩阵;为上一时间步状态权重矩阵;为时间步音色状态;为GatedLSTM偏置项; 所述S2.1.4中,基于用户音色分布和当前音色状态,构建主流音色学习模型,具体方法如下: ; ; 其中,为时间步的用户正常音色分布;为动态平滑因子;为时间步的用户正常音色分布;为时间步音色特征的重构分布;为GatedLSTM权重矩阵;为偏置项。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人云南北飞科技有限公司,其通讯地址为:650200 云南省昆明市中国(云南)自由贸易试验区昆明片区经开区经开路3号昆明科技创新园B01-65号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。