北京理工大学;人保信息科技有限公司李国政获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京理工大学;人保信息科技有限公司申请的专利基于大语言模型的表格数据探索式可视分析系统与方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119557368B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411622003.9,技术领域涉及:G06F16/26;该发明授权基于大语言模型的表格数据探索式可视分析系统与方法是由李国政;奥登格日乐;冯云姗;梁宸伟;张少坤;刘驰;欧创新;姜峰;汪松设计研发完成,并于2024-11-14向国家知识产权局提交的专利申请。
本基于大语言模型的表格数据探索式可视分析系统与方法在说明书摘要公布了:本发明公开了一种基于大语言模型的表格数据探索式可视分析系统与方法,包括:解析原始表格数据并建立数据模型;自动化挖掘洞察并生成洞察的三种不同形式;交互模块中用户主导探索性数据分析并生成数据故事;计算模块中洞察引擎通过洞察图查找具有结构性关联的洞察;推理模块中大语言模型通过语义关联推荐进行洞察推荐。本发明能够对结构性表格数据建模,从而进行数据解析和洞察挖掘。自动化挖掘表格中潜在的洞察使得用户摆脱重复和密集的分析操作,通过融合人类直觉和见解、外部执行器的计算能力,以及大语言模型智能来增强探索性数据分析过程的交互性、透明性和可解释性,从而促进高效、直观的数据分析。
本发明授权基于大语言模型的表格数据探索式可视分析系统与方法在权利要求书中公布了:1.基于大语言模型的表格数据探索式可视分析系统,其特征在于,包括:由大语言模型提供支持的推理模块、以用户参与为中心的交互模块以及由洞察引擎驱动的计算模块; 向交互模块呈现洞察的可视化图表,为洞察计算模块构建具有连接的洞察图,为推理模块生成洞察的文本描述;洞察引擎搜索结构相关的数据洞察,大语言模型推荐语义相关的数据洞察,用户使用自然语言问题和交互式选择来指导视觉探索的过程,最终生成连贯的数据故事; 其中,生成洞察具体方法为: 洞察挖掘过程首先将原始表格数据划分为多个分析实体;对于具有多个维度的表格数据,先枚举每个维度及其分类值的所有可能组合;通过这些组合来筛选行数据,从而定义不同的子空间;在每个子空间中,基于不同的分类维度执行聚合操作,把具有相同分类属性的行进行合并,生成一个新的分析实体;该实体的数值属性由预设的聚合函数计算得出;每个分析实体都能代表数据的一个特定视角,从而允许对数据进行更精细的探索和分析; 接着在每一个分析实体内提取所有数据洞察;系统对每个分析实体进行遍历,并基于预定义的计算规则和阈值提取相关洞察;不同类型的洞察有相应的计算标准、阈值、可视化方式以及描述模板,只有通过预设阈值的洞察才会被保留;这些提取出的洞察会根据模板生成相应的文本描述,形成洞察图表,并链接成洞察图,这三种洞察形式将作为系统后续分析和展示的输入; a交互模块的输入:可视化图表 将表格数据的洞察分为三大类:形状洞察、点洞察和复合洞察;点洞察旨在突出特定数据点的重要性或这些数据点与常规模式的偏差;形状洞察则聚焦于数据的整体分布和结构,帮助用户了解数据的总体趋势和分布特性;复合洞察用于描述数据中不同子集之间的复杂模式,包括时间相关性、线性相关性和依赖性;为每一类洞察选择来其可视化图表形式,并利用Vega-Lite规范来实现相应的可视化表达;通过这些直观的视觉表示,用户能够快速理解数据洞察的含义,从而促进数据的进一步探索与分析; b计算模块的输入:洞察图 根据子空间定位器的特性将洞察关系分为同级关系和父子关系两类;同级关系是指两个洞察定位器的长度和规范的维度相同,有且仅有一个维度的属性值不同,其他维度的属性值都相同的情况;父子关系则表示数据的细化或泛化,具有层次性和方向性;当一个子空间的维度数比另一个子空间多一个,且前者的维度包含后者的所有维度时,两个子空间之间就形成了父子关系;父子关系帮助理解数据如何从广义到细节进行展开;基于这些关系组织数据洞察构建出洞察图;这一洞察图作为计算模块的输入,支持模块根据结构关系筛选和关联起不同数据洞察; c推理模块的输入:洞察描述 采用了基于预定义模板的方法;每个洞察的描述结构化为一个包含四个要素的元组:数据子空间的过滤条件、洞察类型、洞察得分和描述内容;这些要素分别提供洞察的上下文信息、洞察的性质和重要性、以及对数据模式的简明解释;描述部分阐明数据中的趋势、异常关键信息,并且说明洞察涉及的维度和数据操作; 其中,大语言模型推荐语义相关的数据洞察的具体方法为: 大语言模型接收已分组的候选洞察的描述形式作为输入,并结合用户提出的问题执行两阶段推理,从语义角度推荐下一步要探索的洞察;由于洞察引擎已经确定了候选洞察集,限制了决策空间,大语言模型的推理模式从生成转向决策;将决策过程分解为分组选择和洞察排名两个阶段,指导大语言模型使用思维链推理; 在分组选择阶段,仅向大语言模型提供与当前洞察和用户问题相关的分组信息;这些分组信息通过标识符来表示,并不包括具体的洞察信息;系统会从多个维度和层次上选择与当前洞察最相关的组;分组类型的选择能够有效引导后续探索的方向; 在洞察排名阶段,大语言模型会接收所选组内所有洞察的文本描述;系统通过构建当前洞察与每个候选洞察之间的语义关系来确定这些洞察的排名;这些语义关系包括逻辑性、数据关联性、问题相关性及洞察得分;根据这些标准,系统将推荐最相关的前五个洞察,并提供每项推荐的基本原理,解释其选择原因以及如何从当前洞察中推导得出; 用户通过多轮迭代不断探索数据,最终生成数据故事作为输出;这个数据故事包含所有有意义的探索路径,其同时具有逐步推理的顺序性和允许使用多个洞察支持一个分析结果的非线性结构特性;采用扩展的树结构来捕获这些特征,以用户选择的洞察作为节点,关联关系作为边,该探索过程树能够直观地展示用户的发现过程。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学;人保信息科技有限公司,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励