中电信人工智能科技(北京)有限公司贡诚获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中电信人工智能科技(北京)有限公司申请的专利语音数据集的生成方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120877702B 。
龙图腾网通过国家知识产权局官网在2025-12-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511340288.1,技术领域涉及:G10L13/02;该发明授权语音数据集的生成方法及装置是由贡诚;刘帆;张晓雷;李学龙设计研发完成,并于2025-09-18向国家知识产权局提交的专利申请。
本语音数据集的生成方法及装置在说明书摘要公布了:本申请公开了一种语音数据集的生成方法及装置。其中,该方法包括:获取标准通用语言的语音数据集,并采用大语言模型将标准通用语言的语音数据集转化为目标语种文本;采用检索增强生成的方式生成目标语种语句文本;根据目标语种文本和目标语种语句文本生成目标语种语音,并根据目标语种语音构建目标语音数据集,其中,目标语种语音的语音特征与和标准通用语言语音数据集的语音特征一致。本申请解决了相关技术中由于目标语种语音数据库的语音数据量较少,导致翻译模型翻译目标语种的准确性较低。
本发明授权语音数据集的生成方法及装置在权利要求书中公布了:1.一种语音数据集的生成方法,其特征在于,包括: 获取标准通用语言的语音数据集,并采用大语言模型将所述标准通用语言的语音数据集转化为目标语种文本; 目标语种采用检索增强生成的方式生成目标语种语句文本; 根据所述目标语种文本和所述目标语种语句文本生成目标语种语音,并根据所述目标语种语音构建目标语音数据集,其中,所述目标语种语音的语音特征与和所述标准通用语言语音数据集的语音特征一致; 根据所述目标语种文本和所述目标语种语句文本生成目标语种语音,包括: 对所述目标语种文本和所述目标语种语句文本进行归一化处理,得到处理后的文本; 在所述处理后的文本中标注发音规则,得到标注后的文本; 从所述标准通用语言的语音数据集中找出与所述标注后的文本相关的语音片段,作为参考音频; 从所述参考音频中提取所述语音特征,其中,所述语音特征至少包括:音色和语调; 采用语音生成模型对所述语音特征和所述标注后的文本进行分析,生成所述目标语种语音。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中电信人工智能科技(北京)有限公司,其通讯地址为:100034 北京市西城区西四北大街156、158、160号2幢1至2层2-6、2-9内01;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励