北京计算机技术及应用研究所杨雨婷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京计算机技术及应用研究所申请的专利一种面向事件信息推演的数据增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120180378B 。
龙图腾网通过国家知识产权局官网在2025-09-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510675888.7,技术领域涉及:G06F18/25;该发明授权一种面向事件信息推演的数据增强方法是由杨雨婷;方志;余增文;黄泷;张宏;袁晓光设计研发完成,并于2025-05-23向国家知识产权局提交的专利申请。
本一种面向事件信息推演的数据增强方法在说明书摘要公布了:本发明涉及一种面向事件信息推演的数据增强方法,属于人工智能领域。本发明为解决可用的训练数据稀缺且难以获取的问题,利用事件图将采集得到的多源异构数据进行数据融合,使用融合网络的多模态嵌入表示将多源异构数据进行统一的表征描述,获得融合后的时间序列数据,然后,使用生成对抗网络进行训练,使得生成网络G基于随机噪声来生成隐向量Z,恢复网络R将隐向量Z转换回新的时间序列数据。本发明采用生成对抗网络对原始数据集进行扩展,以产生更多样化的训练样本,进而提升事件推演模型的学习效果和泛化能力,有效提升小样本事件信息推演能力。
本发明授权一种面向事件信息推演的数据增强方法在权利要求书中公布了:1.一种面向事件信息推演的数据增强方法,其特征在于,该方法包括如下步骤: 步骤一、数据收集 收集来自不同数据源的多维度情报数据,对情报数据进行初步处理,得到多源异构数据,并加载到统一的多模态数据库中;所述多源异构数据包括:图像数据和文本数据; 步骤二:数据处理 利用事件图将采集得到的多源异构数据进行数据融合,使用融合网络的多模态嵌入表示将多源异构数据进行统一的表征描述,获得融合后的时间序列数据,再进行数据标准化和归一化; 步骤三:模型训练 生成对抗网络包括:嵌入网络E、恢复网络R、生成网络G、判别网络D和监督网络S,通过训练生成对抗网络,使得生成网络G基于随机噪声来生成隐向量Z,恢复网络R将隐向量Z转换回新的时间序列数据; 步骤四:数据增广 模型训练完成后,向生成网络G提供随机噪声来生成隐向量Z,使用恢复网络R将隐向量Z转换回新的时间序列数据; 其中, 所述步骤二包括: S21、首先,构建事件图,事件图中的事件节点由多源异构数据组成;使用DeepWalk算法对事件图中的事件节点进行嵌入学习,并通过截断的随机游走算法生成事件节点序列,利用序列中事件节点的共现关系表示其局部近邻结构,然后将Word2Vec词嵌入模型应用于得到的序列,从而得到事件节点的网络表示; S22、针对多模态数据构建的异构网络,先为每种模态构建一个嵌入表示,然后将不同模态的嵌入表示映射到同一维度的嵌入空间,每一次迭代都最大化链接节点的嵌入表示之间的相似性,且最小化未链接节点的相似性,通过不断地调整向量表示生成过程中的参数,最终得到融合网络的多模态嵌入表示; S23、融合网络的多模态嵌入表示按时间顺序排列,得到经过融合后的时间序列数据X={x1,x2,...,xt,...,xT},其中每个xt为时间t的融合网络的多模态嵌入表示;对这些数据进行标准化和归一化处理,使得所有特征具有相同的数值范围[-1,1],生成标准化的时间序列数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京计算机技术及应用研究所,其通讯地址为:100854 北京市海淀区永定路51号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。