贵州蓝梦工场科技有限公司蒙根获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉贵州蓝梦工场科技有限公司申请的专利跨文件信息汇总及新知识自动总结方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121052345B 。
龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511588713.9,技术领域涉及:G06N5/02;该发明授权跨文件信息汇总及新知识自动总结方法及系统是由蒙根;廖轶宸设计研发完成,并于2025-11-03向国家知识产权局提交的专利申请。
本跨文件信息汇总及新知识自动总结方法及系统在说明书摘要公布了:本发明公开了跨文件信息汇总及新知识自动总结方法及系统,属于文件数据处理技术领域,其方法具体包括:采集文档文件数据,基于语义嵌入模型对所述文档文件数据进行向量化,对文档文件数据语义向量进行重构和语义聚类后,构建语义结构图,所述语义结构图表示文档文件数据之间的逻辑关系,对语义结构图中关联不完整的节点进行内容补全,并从补全后的语义结构图中提取结构化的知识单元,基于所述结构化的知识单元,生成新知识文本;本申请解决了传统文档文件间知识割裂与人工总结效率低下的限制,显著提升了知识发现的自动化程度,适用于知识库建设、领域规则提取、领域知识发现等场景。
本发明授权跨文件信息汇总及新知识自动总结方法及系统在权利要求书中公布了:1.跨文件信息汇总及新知识自动总结方法,其特征在于,包括: 采集文档文件数据; 基于语义嵌入模型对所述文档文件数据进行向量化,对文档文件数据语义向量进行重构和语义聚类后,构建语义结构图,所述语义结构图表示文档文件数据之间的逻辑关系; 对语义结构图中关联不完整的节点进行内容补全,并从补全后的语义结构图中提取结构化的知识单元; 基于所述结构化的知识单元,生成新知识文本; 所述基于语义嵌入模型对所述文档文件数据进行向量化,对文档文件数据语义向量进行重构和语义聚类后,构建语义结构图,包括: 对采集的文档文件数据进行预处理,包括内容片段识别与拆分、内容格式标准化和去噪; 将预处理后的文档文件数据输入至预训练的特征提取模型中,并将提取的特征映射至统一的语义空间中,得到文档文件数据语义向量; 对文档文件数据语义向量进行加权重构,基于增强后的文档文件数据语义向量构建初始语义结构图; 对初始语义结构图进行聚类,根据聚类结果构建语义结构图; 所述对文档文件数据语义向量进行加权重构,基于增强后的文档文件数据语义向量构建初始语义结构图,包括: 从预处理后的文档文件数据中提取关联上下文元数据,所述关联上下文元数据包括:所在文件夹结构数据、文档关联引用和时间序列数据; 对关联上下文元数据进行上下文编码处理,得到统一语境向量; 构建上下文调制网络,利用自注意力机制计算文档文件数据语义向量与统一语境向量之间的互相关系,生成上下文敏感权重矩阵; 基于所述上下文敏感权重矩阵对文档文件数据语义向量进行加权重构,得到增强后的文档文件数据语义向量; 基于增强后的文档文件数据语义向量,构建初始语义结构图,所述初始语义结构图的节点为增强后的文档文件数据语义向量中单个文档文件数据的语义向量,边为单个文档文件数据的语义向量之间的逻辑关系; 所述基于所述结构化的知识单元,生成新知识文本,包括: 建立新知识生成目标模型; 对结构化的知识单元进行路径规划,选取路径作为新知识的主干内容; 将选取路径对应的知识单元输入至新知识生成目标模型中,根据设定的生成参数生成新知识内容。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人贵州蓝梦工场科技有限公司,其通讯地址为:550081 贵州省贵阳市观山湖区诚信北路81号大西南·富力中心A2栋11层6、7、8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励