昆明理工大学高盛祥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉昆明理工大学申请的专利基于自监督说话人表征解耦的方言语种识别方法、系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119964554B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510102857.2,技术领域涉及:G10L15/00;该发明授权基于自监督说话人表征解耦的方言语种识别方法、系统是由高盛祥;周杰;余正涛;董凌;王文君设计研发完成,并于2025-01-22向国家知识产权局提交的专利申请。
本基于自监督说话人表征解耦的方言语种识别方法、系统在说明书摘要公布了:本发明涉及基于自监督说话人表征解耦的方言语种识别方法、系统,属于自然语言处理技术领域。本发明包括:将原始语音输入到自监督模型的上下文编码器中提取输出上下文表示;将上下文表示进行加权求和,然后使用平均池化层将结果转换为自监督语音表征;自监督语音表征输入到说话人性别分类器和方言分类器分别得到被解耦的说话人表征和方言表征;利用说话人表征和方言表征,基于梯度下降算法对自监督模型进行训练,通过反向传播损失函数相对于网络中各个权重的梯度来调整网络的权重参数,用训练好的自监督模型进行方言的识别。本发明所提出的模型在低资源下方言语种识别中表现出了优异的性能。
本发明授权基于自监督说话人表征解耦的方言语种识别方法、系统在权利要求书中公布了:1.基于自监督说话人表征解耦的方言语种识别方法,其特征在于:所述方法包括: Step1、将原始语音输入到自监督模型的上下文编码器中提取输出上下文表示; Step2、将上下文表示进行加权求和,然后使用平均池化层将结果转换为自监督语音表征; Step3、自监督语音表征输入到说话人性别分类器和方言分类器分别得到被解耦的说话人表征和方言表征; Step4、利用说话人表征和方言表征,基于梯度下降算法对自监督模型进行训练,通过反向传播损失函数相对于网络中各个权重的梯度来调整网络的权重参数,用训练好的自监督模型进行方言的识别; 所述Step3中,所述说话人性别分类器和方言分类器均采用交叉熵损失函数来计算各自的损失;方言和性别分类的损失函数分别定义如下: ; ; 其中,和分别表示真实的方言和说话人性别标签;和表示预测的概率分;和是所有方言标签的数量和性别标签的数量;和分别是方言和性别分类的损失函数; 所述Step4中,所述自监督模型进行训练过程中,在自监督模型的前向传播过程中,梯度反转层并没有实质性的参与;当自监督模型训练的反向传播过程中,梯度反转层将后续层的梯度乘以并将其传递到前一层,这样模型的权重参数在更新时就会被训练到远离目标分布中;模型的权重参数的更新公式如下: ; ; ; 其中,是学习率,是一个可手动调节的超参数,表示说话人分类器的权重参数、表示方言分类器的权重参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650039 云南省昆明市一二一大街文昌路68号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励