齐鲁工业大学(山东省科学院)鹿文鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉齐鲁工业大学(山东省科学院)申请的专利基于对比学习的医疗问题摘要生成方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116521860B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310496321.4,技术领域涉及:G06F16/34;该发明授权基于对比学习的医疗问题摘要生成方法和装置是由鹿文鹏;魏斯博;张国标;管红娇;董祥军;张维玉设计研发完成,并于2023-04-27向国家知识产权局提交的专利申请。
本基于对比学习的医疗问题摘要生成方法和装置在说明书摘要公布了:本发明公开了一种基于对比学习的医疗问题摘要生成方法和装置,属于人工智能、自然语言处理领域。本发明要解决的技术问题为如何使用自然语言处理技术,为较长的患者健康问题自动生成简短的摘要,以便于在标准问答数据库中检索与之匹配的常见问题。采用的技术方案为:①一种基于对比学习的医疗问题摘要生成方法,该方法包括如下步骤:S1、构建医疗问题摘要生成数据集;S2、构建困难负样例;S3、构建医疗问题摘要生成模型;S4、训练医疗问题摘要生成模型。②一种基于对比学习的医疗问题摘要生成装置,该装置包括:医疗问题摘要生成数据集构建单元、困难负样例构建单元、医疗问题摘要生成模型构建单元及医疗问题摘要生成模型训练单元。
本发明授权基于对比学习的医疗问题摘要生成方法和装置在权利要求书中公布了:1.一种基于对比学习的医疗问题摘要生成方法,其特征在于,该方法包括如下步骤: 步骤S1,构建医疗问题摘要生成数据集:首先需要获得由用户在医疗问答社区提出的医疗问题和专家撰写的参考摘要以构建医疗问题摘要生成数据集,然后将其切分成训练数据集、验证数据集和测试数据集; 步骤S2,构建困难负样例:首先遍历训练数据集中所有医疗问题的参考摘要,构建医疗实体词典;然后针对每个医疗问题的参考摘要识别出其中的医疗实体,并对这些医疗实体进行同类替换操作,得到困难负样例; 步骤S3,构建医疗问题摘要生成模型,主要操作包括:加载数据集、构建序列到序列模型架构及医疗问题编码器、构建正负样例编码器、构建编码器动量更新模块、构建简单负样例及其存储队列、构建平均池化层; 步骤S4,训练医疗问题摘要生成模型,将步骤S1所得到的医疗问题摘要生成训练数据集对步骤S3构建的医疗问题摘要生成模型进行训练,以优化模型参数,主要步骤包括:构建损失函数和优化模型训练;其中,损失函数由交叉熵损失函数、简单负样例的对比学习损失函数、困难负样例的对比学习损失函数三部分组成; 其中,步骤S3中所述构建简单负样例及其存储队列具体如下: 首先构建简单负样例,然后定义队列的数据结构和简单负样例在队列中的出队和入队操作; 所述构建简单负样例具体为:对于一个训练数据样本{CHQ1,FAQ1},其中CHQ1是医疗问题,FAQ1是医疗问题对应的参考摘要;CHQ1在语义上应该与自己的参考摘要FAQ1相似,而与其他CHQii≠1的参考摘要FAQi有很大不同;故可将FAQ1作为CHQ1的正样例,把其他CHQi的参考摘要FAQi作为CHQ1的简单负样例; 步骤S3中所述构建平均池化层具体如下: 使用医疗问题编码器和正负样例编码器分别对医疗问题和正负样例进行编码,得到其特征表示,平均池化层负责提取这些特征表示的均值特征,具体公式如下: RC=AvgPoolingR'C RS=AvgPoolingR'S 其中,AvgPooling代表平均池化层;R'C代表使用医疗问题编码器EncoderB对医疗问题C进行编码得到的编码表示;R'S代表使用正负样例编码器EncoderK对正样例或负样例S进行编码得到的编码表示;RC和RS分别代表R'C和R'S经过平均池化层后的表示。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人齐鲁工业大学(山东省科学院),其通讯地址为:250353 山东省济南市长清区大学路3501号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。