嘉杰科技有限公司吴洋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉嘉杰科技有限公司申请的专利一种基于深度学习的数据集增强方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120705590B 。
龙图腾网通过国家知识产权局官网在2025-12-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511141956.8,技术领域涉及:G06F18/214;该发明授权一种基于深度学习的数据集增强方法及系统是由吴洋;兰伟杰;胡志设计研发完成,并于2025-08-15向国家知识产权局提交的专利申请。
本一种基于深度学习的数据集增强方法及系统在说明书摘要公布了:本发明涉及数据集增强技术领域,尤其涉及一种基于深度学习的数据集增强方法及系统,方法包括:将原始文本输入预训练跨模态文本编码器,得到原始语义向量。预设多目标模态,构建各模态的投影函数,将原始语义向量映射为各目标模态的风格引导向量,并加权融合生成综合风格向量。对原始文本进行句法分析,提取词级掩码,基于掩码将上下文词向量与综合风格向量进行差异化融合,生成全局融合语义向量。通过可训练的投影矩阵将其映射至大语言模型的输入空间,形成软提示向量并注入模型输入层,引导生成多个语义忠实且风格多样的增强文本,完成数据集增强。本发明实现了在保留原有语义信息的同时增强了生成文本多风格化的效果。
本发明授权一种基于深度学习的数据集增强方法及系统在权利要求书中公布了:1.一种基于深度学习的数据集增强方法,其特征在于,包括: 获取原始文本,将原始文本输入预训练跨模态文本编码器中,得到原始语义向量; 预设多目标模态的集合,构建每一个目标模态的投影函数,将原始语义向量输入每一个模态投影函数,生成每一个目标模态风格引导向量,综合所有目标模态风格引导向量,得到综合风格向量; 对原始文本进行句法分析提取掩码,基于掩码对原始文本的上下文词向量与所述综合风格向量进行融合,生成全局融合语义向量; 所述全局融合语义向量包括: 对原始文本进行句法分析提取原始文本语义主干词汇以及非语义主干词汇,根据原始文本语义主干词汇以及非语义主干词汇生成词级掩码;利用预训练语言模型编码获取原始文本中每一个词的上下文感知词向量,结合每一个词的上下文感知词向量和原始文本的综合风格向量,按照对应掩码信息进行融合,得到融合后每一个词的词级融合向量;将每一个词的词级融合向量进行平均聚合得到全局融合语义向量; 将全局融合语义向量经由可训练的线性投影矩阵映射至预训练大语言模型的输入嵌入空间,形成软提示向量,将软提示向量注入大语言模型的输入层,生成多个增强文本,完成数据集增强。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人嘉杰科技有限公司,其通讯地址为:430000 湖北省武汉市洪山区文化大道555号融科智谷工业项目(三期)C5号楼11层2研发号房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励