马上消费金融股份有限公司李长林获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉马上消费金融股份有限公司申请的专利数据增强方法及装置、目标文本分类模型的训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116226383B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310207383.9,技术领域涉及:G06F16/353;该发明授权数据增强方法及装置、目标文本分类模型的训练方法是由李长林;夏粉;肖冰;曹磊;罗奇帅设计研发完成,并于2023-03-06向国家知识产权局提交的专利申请。
本数据增强方法及装置、目标文本分类模型的训练方法在说明书摘要公布了:本公开提供了一种数据增强方法及装置、目标文本分类模型的训练方法,该数据增强方法包括:针对初始训练数据集中每两条初始训练数据,获取两条初始训练数据中的每条初始训练数据中训练文本对应的文本向量和真实类别标签对应的标签向量;根据两条初始训练数据分别对应的真实类别标签以及预先获取的两条初始训练数据分别对应的预测类别标签,确定两条初始训练数据对应的数据增强类型,不同数据增强类型对应不同数据增强方式;基于数据增强类型,对两条初始训练数据分别对应的文本向量进行数据增强处理,得到增强文本向量;根据两条初始训练数据分别对应的标签向量,确定与增强文本向量对应的增强标签向量。
本发明授权数据增强方法及装置、目标文本分类模型的训练方法在权利要求书中公布了:1.一种数据增强方法,其特征在于,所述数据增强方法用于对用于文本分类训练的初始训练数据集中每两条初始训练数据进行数据增强,所述初始训练数据包括训练文本和与所述训练文本对应的真实类别标签,所述数据增强方法包括: 针对所述初始训练数据集中每两条初始训练数据,获取所述两条初始训练数据中的每条初始训练数据中所述训练文本对应的文本向量和所述真实类别标签对应的标签向量; 根据所述两条初始训练数据分别对应的真实类别标签是否相同以及所述两条初始训练数据中每条初始训练数据对应的真实类别标签与预先获取的预测类别标签是否相同,确定所述两条初始训练数据对应的数据增强类型,不同数据增强类型对应不同数据增强方式; 基于所述数据增强类型,对所述两条初始训练数据分别对应的文本向量进行数据融合处理,得到增强文本向量;所述数据融合处理包括加权求和处理或者加权平均处理;以及 将所述两条初始训练数据中任意一条初始训练数据对应的标签向量作为增强标签向量;或者,对所述两条初始训练数据分别对应的标签向量进行加权求和处理,得到与所述增强文本向量对应的增强标签向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人马上消费金融股份有限公司,其通讯地址为:401121 重庆市渝北区黄山大道中段52号渝兴广场B2栋4至8楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励