Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 昆明理工大学李岫宸获国家专利权

昆明理工大学李岫宸获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉昆明理工大学申请的专利一种融合密度聚类与ERNIE的医疗文本关系抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115952284B

龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211576536.9,技术领域涉及:G06F16/35;该发明授权一种融合密度聚类与ERNIE的医疗文本关系抽取方法是由李岫宸;朱波;邹艳华;邱兰设计研发完成,并于2022-12-09向国家知识产权局提交的专利申请。

一种融合密度聚类与ERNIE的医疗文本关系抽取方法在说明书摘要公布了:本发明公开了一种融合密度聚类与ERNIE的医疗文本关系抽取方法,包括如下步骤:首先,获取非结构化的中文医疗文本,其中,对实体进行识别和标注,并对文本使用正则表达式进行清洗;然后,对标注的实体进行向量化处理,并使用HDBSCAN算法进行聚类,其中,向量化前先进行平滑处理,以更准确提取到实体的词频特征;最后,将聚类结果标注到文本中,并作为ERNIE预训练模型的输入进行关系抽取,其中,抽取采用封闭式降低未知关系造成的歧义。本发明改善了中文医疗文本词频不足的特性,通过预训练模型的运用充分挖掘了实体关系的先验知识,同时通过预训练模型强化实体在文本中的位置信息,提升关系抽取的准确性。

本发明授权一种融合密度聚类与ERNIE的医疗文本关系抽取方法在权利要求书中公布了:1.一种融合密度聚类与ERNIE的医疗文本关系抽取方法,其特征在于,包括如下步骤: 获取原始标注文本,将中文医疗文本数据与已标注的实体分别提取,其中,提取的非结构化文本使用正则表达式进行数据清洗,删除文本中多余的符号与网页、图片链接信息; 对已标记的实体使用HDBSCAN算法对向量化后的实体进行聚类,其中,为避免生僻字造成概率回退现象,使用平滑处理后的词向量矩阵得到聚类标签; 在实体进行聚类前,剔除重复出现的实体数据; 对头实体与尾实体进行分别聚类; 创建关系数据集,用于关系抽取时确定关系分类数量; 聚类所使用词向量矩阵使用平滑处理后的TFIDF词向量矩阵,关系抽取使用Embedding词向量矩阵; 将聚类结果融合到中文医疗文本中输入到ERNIE预训练模型中进行关系抽取,其中,采用封闭式抽取降低未知关系造成的歧义; 所述ERNIE医疗文本关系抽取模型为基于ERNIE模型的变体,结合了医学领域特定关系抽取语料进行训练,并采用Transformer架构中的自注意力机制来处理关系抽取任务,所述模型的损失函数Loss为: ; 其中,pi为关系抽取模型输出层经过softmax输出的关系类别预测向量,y为关系类别标签的one-hot表示,N为关系类别数量; 所述融合密度聚类的ERNIE医疗文本关系抽取模型包括聚类层、词嵌入层、自注意力层,并且通过多层Transformer网络进一步提升抽取精度。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650500 云南省昆明市呈贡区景明南路727号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。