Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 江苏数兑科技有限公司章海锋获国家专利权

江苏数兑科技有限公司章海锋获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉江苏数兑科技有限公司申请的专利多模态大模型的数据集成治理系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121144855B

龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511669220.8,技术领域涉及:G06F18/214;该发明授权多模态大模型的数据集成治理系统及方法是由章海锋;朱千垚;胡金彪设计研发完成,并于2025-11-14向国家知识产权局提交的专利申请。

多模态大模型的数据集成治理系统及方法在说明书摘要公布了:本发明提供多模态大模型的数据集成治理系统及方法,涉及数据处理技术领域,所述方法包括:获取多模态大模型的数据输入集合,并对其进行预处理,形成初步多模态数据集合;执行时间戳映射处理,将文本数据、图像数据以及语音数据的采集时间戳对齐至统一的时间索引表;执行语义一致性检测处理,通过比对文本数据中的症状描述、图像数据中的结构化标注以及语音数据中的口述内容,识别跨模态之间的语义错位,形成一致多模态数据集合;执行动态标签对齐处理,对检测出的错位项生成校正标签,并将校正标签更新至对应模态的标注内容中;输入至大模型训练管线,执行跨模态特征的统一治理处理,形成训练数据集合;本发明提高了数据集成治理的准确性。

本发明授权多模态大模型的数据集成治理系统及方法在权利要求书中公布了:1.多模态大模型的数据集成治理方法,其特征在于,所述方法包括: 获取多模态大模型的数据输入集合,并对其进行预处理,形成初步多模态数据集合; 根据初步多模态数据集合,执行时间戳映射处理,将文本数据、图像数据以及语音数据的采集时间戳对齐至统一的时间索引表,形成关联多模态数据集合; 根据关联多模态数据集合,执行语义一致性检测处理,通过比对文本数据中的症状描述、图像数据中的结构化标注以及语音数据中的口述内容,识别跨模态之间的语义错位,形成包含一致性标记的一致多模态数据集合; 根据一致多模态数据集合,执行动态标签对齐处理,对检测出的错位项生成校正标签,并将校正标签更新至对应模态的标注内容中,形成修正多模态数据集合; 根据修正多模态数据集合,将其输入至大模型训练管线,执行跨模态特征的统一治理处理,形成具备一致性与准确性的训练数据集合; 根据初步多模态数据集合,执行时间戳映射处理,将文本数据、图像数据以及语音数据的采集时间戳对齐至统一的时间索引表,形成关联多模态数据集合,包括: 获取文本数据、图像数据以及语音数据中所包含的原始采集时间标签,形成原始时间信息集合; 对原始时间信息集合进行时间标准化处理,将不同格式的时间标签统一转化为精确到秒级的统一时间格式,形成标准化时间信息集合; 根据标准化时间信息集合,计算各类数据在采集过程中的时间偏移量,并生成包含时间偏移量的映射表; 根据映射表对文本数据、图像数据以及语音数据执行时间对齐操作,使得不同模态数据在统一索引下具有相同的时间标识,形成具备时间一致性的关联多模态数据集合; 根据关联多模态数据集合,执行语义一致性检测处理,通过比对文本数据中的症状描述、图像数据中的结构化标注以及语音数据中的口述内容,识别跨模态之间的语义错位,形成包含一致性标记的一致多模态数据集合,包括: 提取文本数据中的关键词及关键短语,形成文本特征集合; 提取图像数据中的标注标签及对应的空间位置信息,形成图像特征集合; 提取语音数据转录文本中的主要描述内容,形成语音特征集合; 对文本特征集合、图像特征集合以及语音特征集合进行语义比对,若发现同一时间索引下存在症状部位、病灶位置或口述描述不一致的情况,则生成对应的一致性异常标记; 将一致性异常标记与原有数据进行绑定,形成包含一致性标记的一致多模态数据集合; 根据一致多模态数据集合,执行动态标签对齐处理,对检测出的错位项生成校正标签,并将校正标签更新至对应模态的标注内容中,形成修正多模态数据集合,包括: 根据一致多模态数据集合中的一致性异常标记,确定发生语义错位的数据位置,形成错位数据集合; 对错位数据集合中的文本数据,执行关键词替换或位置调整操作,生成修正后的文本标签; 对错位数据集合中的图像数据,执行标注区域重新定位或标注内容修订操作,生成修正后的图像标签; 对错位数据集合中的语音数据,执行描述短语的增补或删除操作,生成修正后的语音标签; 将修正后的文本标签、图像标签以及语音标签写入原始多模态数据集合中,形成包含校正标签的修正多模态数据集合; 根据修正多模态数据集合,将其输入至大模型训练管线,执行跨模态特征的统一治理处理,形成具备一致性与准确性的训练数据集合,包括: 根据修正多模态数据集合,对不同模态数据进行特征向量化处理,将文本数据转化为词向量表示,将图像数据转化为像素特征表示,将语音数据转化为声学特征表示,形成特征化多模态数据集合; 根据特征化多模态数据集合,执行跨模态特征对齐操作,对文本特征向量、图像特征向量以及语音特征向量在统一的特征空间中进行映射,生成具有统一表示维度的对齐多模态特征集合; 根据对齐多模态特征集合,执行权重分配操作,对各模态特征的重要性进行计算并生成对应权重值,将权重值与多模态特征绑定,形成加权多模态特征集合,其中权重值通过计算不同模态特征在时间索引和语义一致性上的贡献度得到; 根据加权多模态特征集合,执行统一治理操作,对包含的多模态特征进行融合,生成融合多模态特征集合,并通过一致性校验确认融合结果与修正标签的一致性; 将融合多模态特征集合输入至大模型,形成具备跨模态一致性与标签准确性的训练数据集合。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏数兑科技有限公司,其通讯地址为:210001 江苏省南京市秦淮区永智路5号南京白下高新技术产业园区五号楼E栋101-88室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。