Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 盐城工学院;盐城工学院技术转移中心有限公司刘聪获国家专利权

盐城工学院;盐城工学院技术转移中心有限公司刘聪获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉盐城工学院;盐城工学院技术转移中心有限公司申请的专利基于多模态大语言模型的有声书自动生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116821410B

龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310894064.X,技术领域涉及:G06F16/635;该发明授权基于多模态大语言模型的有声书自动生成方法是由刘聪;张坤;许莉娟设计研发完成,并于2023-07-19向国家知识产权局提交的专利申请。

基于多模态大语言模型的有声书自动生成方法在说明书摘要公布了:本发明提出了一种使用多模态大语言模型的有声书自动生成方法,模型生成不同角色的独特声音和说话风格,保持语音音调的一致性,根据场景和情绪调整角色的声音,以及创建真实的背景声音,模型使用现有的电影剧本和配音、有声书以及特别注释的数据集进行训练。

本发明授权基于多模态大语言模型的有声书自动生成方法在权利要求书中公布了:1.一种基于大型语言模型的有声书自动生成方法,其特征在于,包括以下步骤: 步骤1:训练数据的准备:首先获取多种来源的多模态训练数据,这些来源可以包括现有的电影剧本及配音、有声书以及人工专门注释的数据集,对于人工注释的数据集,人类注释员评估模型生成的声音与其对应角色的匹配程度,对声音在预定的尺度上进行评级,生成监督学习的标签,该数据集被用于提升模型对于声音风格的生成多样性,并将这些声音恰当地匹配至角色; 步骤2:模型训练:在获取训练数据后,在预训练好的大语言模型基础上,运用这些数据来训练多模态大语言模型,语言模型根据角色的属性如性别、年龄和性格生成独特的声音和说话风格,模型将输入的文本与相应的声音标签关联起来,进一步学习将角色属性与特定的声音风格联系在一起,模型通过理解文本上下文、识别角色及其属性和情绪,生成相应的独特声音,人类注释员的反馈被用于模型的迭代改进,以增强模型在生成符合角色性质并根据场景和情绪调整声音的能力; 步骤3:有声书生成:模型训练完成后,开始从给定的文本中生成有声书,模型处理文本以识别角色、属性和上下文,然后根据之前学习到的知识生成各角色的独特声音,模型会维持上下文的跟踪,并根据不同场景和角色的情绪调整语调、语速和音量,此外,模型根据场景描述生成真实的背景声音; 步骤4:用户反馈与持续优化:用户反馈是持续优化生成过程的重要部分,用户对生成的声音、声音一致性和与角色匹配度的反馈可以被纳入训练数据,进一步改进模型,因此,该过程形成了一个生成、反馈和改进的迭代循环,从而提高了自动生成有声书的整体质量和真实感。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人盐城工学院;盐城工学院技术转移中心有限公司,其通讯地址为:224000 江苏省盐城市亭湖区希望大道中路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。