广州大学;广州市广播电视台胡勇军获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州大学;广州市广播电视台申请的专利一种基于脑电情绪的语音合成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119724146B 。
龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411905530.0,技术领域涉及:G10L13/02;该发明授权一种基于脑电情绪的语音合成方法是由胡勇军;梁显武;滕建新;刘勤山;朱柳茜;何杰锋;姜檬檬;林浩设计研发完成,并于2024-05-15向国家知识产权局提交的专利申请。
本一种基于脑电情绪的语音合成方法在说明书摘要公布了:本发明公开了一种基于脑电情绪的语音合成方法,涉及智能语音合成领域。包括:采用脑电信号采集仪获取测试者听到语音片段后的脑电情绪数据并进行情绪标注,得到标注后的情绪极值组数据再进行预处理;通过预处理后的情绪极值组数据对卷积神经网络进行脑电情绪量度模型训练,得到训练好的脑电情绪量度模型;输出训练好的脑电情绪量度模型的识别结果作为vits模型的输入,进行情感语音合成模型训练,得到训练好的情感语音合成模型;通过训练好的情感语音合成模型对待配音的影视剧进行语音合成,输出最终的语音合成结果。本发明提出脑电情绪量度模型和情感语音合成模型,可以在情绪量度结果下优化语音生成,合成满足听众共情需求的情感丰富的语音。
本发明授权一种基于脑电情绪的语音合成方法在权利要求书中公布了:1.一种基于脑电情绪的语音合成方法,其特征在于,包括以下步骤: S1.获取数据:采用脑电信号采集仪获取测试者听到语音片段后的脑电情绪数据; S2.数据标注:将采集到的脑电情绪数据进行情绪标注,得到标注后的情绪极值组数据,具体为:首先对S1中获取得到的脑电情绪数据进行特征处理,筛选出能代表情绪极值的脑电情绪数据,对脑电情绪数据进行情感极性标注; S3.数据预处理:对情绪极值组数据进行预处理,得到预处理后的情绪极值组数据; S4.脑电情绪量度模型训练:通过预处理后的情绪极值组数据对卷积神经网络进行脑电情绪量度模型训练,得到训练好的脑电情绪量度模型; S5.情感语音合成模型训练:输出训练好的脑电情绪量度模型的识别结果作为vits模型的输入,从而进行情感语音合成模型训练,得到训练好的情感语音合成模型; S6.语音合成:通过训练好的情感语音合成模型对待配音的影视剧进行语音合成,输出最终的语音合成结果; S5的具体内容为: 情感语音合成模型分为模型学习语音重构训练和模型情绪增强学习训练; S51.模型学习语音重构:利用S3中得到的预处理后的情绪极值组数据对模型进行训练,学习语音重构,情感信息在文本编码器中以向量的形式嵌入;损失函数为生成的语音梅尔频谱图与真实样本的梅尔语谱图之间的差距,即是否能够重构语音,针对每一个样本的损失值表示为: S52.模型情绪增强学习:利用S4中得到的训练好的脑电情绪量度模型对AI生成的粤语语音进行情绪识别,通过设备导入配音员对AI配音情绪的反馈信号,用于校准AI配音情绪编码器的编码损失函数,然后计算损失值,完成对于情感语音合成模型的模型增强学习训练; 其中,损失函数包含模型生成语音与真实语音之间的误差、脑电设备监测专业配音员对AI配音情绪量度与真实情感标签的误差,采用交叉熵的形式,针对每一个样本损失值可以表示为: 其中,,为模型增强学习的总损失中重构损失和情绪损失的权重系数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州大学;广州市广播电视台,其通讯地址为:510006 广东省广州市番禺区大学城外环西路230号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励