哈尔滨工业大学单丽莉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利一种长文本的标签推荐模型构建方法及标签推荐方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116484123B 。
龙图腾网通过国家知识产权局官网在2025-10-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310486453.9,技术领域涉及:G06F16/9538;该发明授权一种长文本的标签推荐模型构建方法及标签推荐方法是由单丽莉;冯明强;刘秉权;孙承杰;刘远超;林磊设计研发完成,并于2023-04-28向国家知识产权局提交的专利申请。
本一种长文本的标签推荐模型构建方法及标签推荐方法在说明书摘要公布了:本发明提供一种长文本的标签推荐模型构建方法及标签推荐方法,涉及自然语言处理技术领域,该模型构建方法包括:获取历史长文本,对历史长文本进行标注,得到文本标签、标准相似度、历史子句和子句的历史权重;根据历史权重得到历史关键句,对文本标签进行标签扩充,得到历史伪标签,并根据历史伪相得到历史标签序列;以上述数据训练初始预测模型,得到预测模型;以上述数据训练初始排序模型,得到重排序模型;根据预测模型和重排序模型得到标签推荐模型。本发明的有益效果:根据子句权重得到表示长文本含义的关键句,对文本标签进行扩充以得到便于模型理解的伪标签,实现长文本的标签推荐,且有效提升了模型的准确度。
本发明授权一种长文本的标签推荐模型构建方法及标签推荐方法在权利要求书中公布了:1.一种长文本的标签推荐模型构建方法,其特征在于,包括: 获取历史长文本,对所述历史长文本进行标注,得到所述历史长文本对应的多个文本标签和所述文本标签与所述历史长文本间的标准相似度; 根据第一预设长度对所述历史长文本进行重叠分割,得到多个历史子句,并标注每个所述历史子句在所述历史长文本中的历史权重; 按照所述历史权重由高到低的顺序,选取第一预设数量的所述历史子句进行拼接处理,得到历史关键句,删除所述标准相似度小于预设阈值的所述文本标签,对剩余的所述文本标签进行标签扩充,得到历史伪标签,并标注每个所述历史伪标签与所述历史长文本的历史伪相似度,按照所述历史伪相似度由高至低的顺序,对所述历史伪标签进行排序,得到历史标签序列; 构建初始预测模型,以所述历史子句、所述历史权重、所述历史标签和所述标准相似度训练所述初始预测模型,得到预测模型,所述预测模型用于输出每个待测子句的目标权重、多个预测标签及多个所述预测标签的预测相似度,其中,根据所述目标权重得到预测关键句,根据所述预测相似度对所述预测标签进行预处理,对预处理后的所述预测标签进行扩充,得到目标伪标签; 构建初始重排序模型,以所述历史关键句、所述历史标签序列、所述历史伪标签及所述历史伪相似度训练所述初始排序模型,得到重排序模型,所述重排序模型用于根据所述预测关键句和所述目标伪标签得到预测伪相似度,并输出按照所述预测伪相似度由高至低的顺序进行排序的预测标签序列; 根据所述预测模型和所述重排序模型得到标签推荐模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150000 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励