Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 昆明理工大学相艳获国家专利权

昆明理工大学相艳获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉昆明理工大学申请的专利基于局部和全局字符表征增强的中文命名实体识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115455955B

龙图腾网通过国家知识产权局官网在2025-06-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211273187.3,技术领域涉及:G06F40/279;该发明授权基于局部和全局字符表征增强的中文命名实体识别方法是由相艳;刘威;黄于欣;郭军军设计研发完成,并于2022-10-18向国家知识产权局提交的专利申请。

基于局部和全局字符表征增强的中文命名实体识别方法在说明书摘要公布了:本发明涉及基于局部和全局字符表征增强的中文命名实体识别方法。现有中文命名实体识别方法将其建模为基于字符的序列标注问题,但单独的中文字符向量难以表征独立语义,带来实体边界和类型识别错误问题。中文字符的字形结构及其相关领域术语包含了领域实体特有的信息,有效利用这些信息有利于上述问题的解决。为此本发明利用自编码机制融合字符的形旁结构嵌入、形旁序列嵌入和上下文语义嵌入,得到局部字符表征;并利用交互门控机制,将字符所对应的全局领域术语表征和局部字符表征相结合,得到增强的字符表征;最后将增强的字符表征送入Bi‑LSTM和CRF层,获得字符序列标签。在领域中文命名实体识别数据集上的实验表明,本发明是有效的。

本发明授权基于局部和全局字符表征增强的中文命名实体识别方法在权利要求书中公布了:1.基于局部和全局字符表征增强的中文命名实体识别方法,其特征在于:所述方法包括如下步骤:Step1、将在语料上所训练的字符向量作为字符的初始嵌入:将每个字符都映射到一个密集向量表示,得到每个句子的字符嵌入;Step2、将字符拆分为形旁和其他的字符成分,然后用序列特征编码器来提取字符的字形序列特征;Step3、将单个字符视为二维图像,通过图像特征编码器来获得字符的字形结构特征;其中汉字所对应的图像通过的多个卷积层,捕获低级别的图形特征,再使用自适应池化操作并应用群卷积映射到最终字形结构特征;Step4、采用自编码机制,对字符的字形结构特征、字形序列特征和预训练的字符嵌入三种向量进行融合得到字符局部表征;Step5、首先在领域语料库上使用word2vec的Skip-Gram模型训练一个领域词典,然后,对每个字符在词典中进行查询匹配,得到若干个词集合,再通过加权分配权并拼接最后得到字符的全局表征;Step6、在获得字符的局部表征和全局表征后,利用交互门控机制对两者的特征进行信息筛选,得到综合表征;之后将综合表征送入到Bi-LSTM进行上下文编码,然后CRF被用作解码层,来得到输出结果的标签;所述Step4中,首先将字符的字形结构特征、字形序列特征和预训练的字符嵌入拼接起来,再通过变换层得到一个自动融合的潜在向量,然后尝试从自融合的潜在向量重建最初拼接的向量,最后,通过计算原始向量和重构向量之间的欧氏距离,使用均方误差来计算损失,获得经过中间层压缩但没有损耗的信息;所述Step5包括如下步骤:Step5.1、字符ci在一个使用Skip-Gram模型预训练好的词典D中进行查询匹配;如果D中的某个词w中包含有字符ci,则根据字符出现在该词中的不同位置情况,分别将其纳入到四个词集Bci,Mci,Eci,Sci中;具体来说,如果ci出现在某个词w的开头位置,就将该词w归类到词集Bci;如果ci出现在某个词w的中间位置,就将该词w归类到词集Mci中;如果ci出现在某个词w的尾部,就将该词w归类到词集Eci;如果ci和某个词w相同,即字符为一个独立的词,就将该词w归类到词集Sci;Step5.2、统计出字符ci匹配到的某个词w在训练数据中出现的次数m,以及字符ci匹配到的所有的词在训练集数据中出现的总次数M,则字符ci匹配到的某个词w的频率为: Step5.3、将匹配词集Bci中每一个词的词向量乘以其权重并加和,得到字符ci作为词语起始字符的表征 其中,Edw表示词w的嵌入向量;Step5.4、循环执行Step5.3中同样的方法,获得字符ci作为词语中间字符的表征作为词语末尾字符的表征以及作为独立词语的表征Step5.5、将字符ci的四种表示组合起来得到每个字符的全局表征dg表示字符的全局表征维度大小;

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650500 云南省昆明市呈贡区景明南路727号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。