Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京萌科科技有限公司唐倩获国家专利权

北京萌科科技有限公司唐倩获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京萌科科技有限公司申请的专利可交互的多模态人工智能数字人自动讲解方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120596655B

龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511094278.4,技术领域涉及:G06F16/334;该发明授权可交互的多模态人工智能数字人自动讲解方法及系统是由唐倩;郄晓烨;林鑫喆;杨宝墙设计研发完成,并于2025-08-06向国家知识产权局提交的专利申请。

可交互的多模态人工智能数字人自动讲解方法及系统在说明书摘要公布了:本发明提供可交互的多模态人工智能数字人自动讲解方法及系统,涉及人工智能体数字人技术领域,包括通过将文档转换为结构化文件,利用多模态人工智能模型解析图片序列得到文本内容,采用大语言模型及人工智能体构建讲解文本,并通过人工智能体将音频与数字人及讲解内容合成,并在播放过程中实现交互功能。本发明能够实现传统展示文档通过数字人与用户的实时交互,提高讲解内容理解效率,增强用户体验,适用于教育、展示、展览、文旅等多种场景。

本发明授权可交互的多模态人工智能数字人自动讲解方法及系统在权利要求书中公布了:1.可交互的多模态人工智能数字人自动讲解方法,其特征在于,包括: 接收文档并将所述文档转换为统一格式的结构化文件,所述结构化文件包括文档对应的图片序列;将所述图片序列输入多模态人工智能模型进行解析得到对应的文本内容,并建立所述图片序列与所述文本内容的对应关系; 将所述文本内容输入大语言模型进行语义分析,通过人工智能体构建前后连贯的讲解文本,将所述讲解文本经过文字转语音模块转换为音频文件,包括: 基于文本内容的格式类型,选择对应的处理接口将文本内容转换为图片序列,根据预设的长宽比及分辨率参数对所述图片序列进行规范化处理,生成图片编号与位置信息,将所述图片序列、图片编号及位置信息存入结构化文件; 对所述图片序列进行区域分割与特征提取得到图像特征向量,基于所述图像特征向量识别图片中的目标对象与场景要素,将所述目标对象与场景要素解析为对应的语义标签,通过所述语义标签生成文本描述,将所述文本描述与所述图片编号建立映射关系后存入所述结构化文件; 根据所述图片编号的顺序关系与所述位置信息,分析相邻图片文本描述的语义关联,基于所述语义关联构建图片间的逻辑连接图; 基于所述逻辑连接图生成主题框架,在所述主题框架中设置引入语、过渡语、总结语的位置标识,根据所述文本描述的语义内容与所述位置标识生成讲解文本; 从预设的表达风格库中选择与所述讲解文本对应的目标风格语言模板,生成带有目标风格的讲解文本; 将所述音频文件与数字人进行合成,其中选择三维数字人时,记录三维数字人的模型位置及动作数据,通过所述音频文件驱动三维数字人的肢体骨骼模型、表情模型及口型动作库进行同步播放; 在播放过程中,通过预设时间间隔对环境音频进行采样获得音频片段,对所述音频片段进行语音激活检测判断是否包含有效人声,当检测到连续预设个数的音频片段均包含有效人声时开始录音并进行语音识别,当连续预设个数的音频片段均未检测到有效人声时结束录音并生成语音识别结果; 判断当前播放位置是否位于句子或段落的结束位置,当位于所述句子或段落的结束位置时执行打断操作,记录播放内容及中止时间点;将所述语音识别结果输入所述大语言模型进行处理生成回答内容,所述回答内容包括上文衔接语、主体回答内容及下文衔接语;将所述回答内容通过所述文字转语音模块转换为回答音频并驱动所述数字人播放,播放完成后根据所述中止时间点继续播放原有内容。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京萌科科技有限公司,其通讯地址为:100144 北京市石景山区八大处路49号院6号楼二层2182号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。