广东翼启数据产业有限公司林树生获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东翼启数据产业有限公司申请的专利一种基于政务服务数据的多源异构语料融合方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120493159B 。
龙图腾网通过国家知识产权局官网在2025-11-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510578949.8,技术领域涉及:G06F18/25;该发明授权一种基于政务服务数据的多源异构语料融合方法及系统是由林树生;江醒烜;许锦泽设计研发完成,并于2025-05-07向国家知识产权局提交的专利申请。
本一种基于政务服务数据的多源异构语料融合方法及系统在说明书摘要公布了:本发明提供一种基于政务服务数据的多源异构语料融合方法及系统,获取政务服务中多个数据源的原始语料集合,对原始语料集合中的各语料单元进行跨模态语义对齐处理,生成与各语料单元对应的规范化数据块,分别对规范化数据块进行多模态语义编码,得到各语料单元的语义特征向量,并对规范化数据块之间的关联属性集进行拓扑结构编码,生成全局结构关系图,基于全局结构关系图中的节点连接权重对语义特征向量进行动态权重分配,生成融合权重矩阵,并对语义特征向量进行跨模态特征融合,得到目标语义嵌入表示,生成与政务服务关联的标准化语料库。本发明解决了非均匀分布语料单元的语义聚合难题,大幅提升政务数据治理效率与跨部门协同能力。
本发明授权一种基于政务服务数据的多源异构语料融合方法及系统在权利要求书中公布了:1.一种基于政务服务数据的多源异构语料融合方法,其特征在于,所述方法包括: 获取政务服务中多个数据源的原始语料集合,其中所述原始语料集合包含不同数据类型的语料单元; 对所述原始语料集合中的各语料单元进行跨模态语义对齐处理,生成与各语料单元对应的规范化数据块,所述规范化数据块包含统一语义标签及关联属性集; 分别对所述规范化数据块进行多模态语义编码,得到各语料单元的语义特征向量,并对所述规范化数据块之间的关联属性集进行拓扑结构编码,生成全局结构关系图,具体包括:从各规范化数据块的关联属性集中提取共性属性键,所述共性属性键包括政务服务事项编码、用户标识符及时间区间;以各规范化数据块作为节点,基于所述共性属性键的匹配关系构建初始节点连接边,并计算节点间的属性重叠度及语义相关性;根据所述属性重叠度及语义相关性,对初始节点连接边进行加权处理,生成带权重的边集合;基于所述节点及带权重的边集合,构建包含节点特征矩阵及邻接矩阵的所述全局结构关系图,其中节点特征矩阵由各节点的语义特征向量组成; 基于所述全局结构关系图中的节点连接权重,对所述语义特征向量进行动态权重分配,生成融合权重矩阵,并通过所述融合权重矩阵对所述语义特征向量进行跨模态特征融合,得到目标语义嵌入表示; 根据所述目标语义嵌入表示,生成与政务服务关联的标准化语料库。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东翼启数据产业有限公司,其通讯地址为:515000 广东省汕头市汕头高新区科技东路7号1101房之1108单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励