Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 之江实验室朱世强获国家专利权

之江实验室朱世强获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉之江实验室申请的专利一种基于知识图谱的中文易混词生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115858811B

龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211609449.9,技术领域涉及:G06F16/36;该发明授权一种基于知识图谱的中文易混词生成方法是由朱世强;袭向明;龙沁沁;谢冰;赵鑫安;尹越;宋伟设计研发完成,并于2022-12-14向国家知识产权局提交的专利申请。

一种基于知识图谱的中文易混词生成方法在说明书摘要公布了:本发明公开了一种基于知识图谱的中文易混词生成方法。该方法包括中文词知识图谱的本体设计、中文文本数据的预处理过程、中文词对在语义字音字形等方面的相似性计算过程、知识图谱实例化过程、用户输入文本的预处理过程、与用户输入文本相对应的知识图谱子图抽取过程以及以多源异构数据为输入的中文易混词生成过程等。本发明可从发音、字形、语义等多方面刻画中文词对的相似性,并能结合文本的领域和主题信息,实现跨领域中文易混淆词的准确生成。

本发明授权一种基于知识图谱的中文易混词生成方法在权利要求书中公布了:1.一种基于知识图谱的中文易混词生成方法,其特征在于,包括以下步骤: 步骤一:定义面向中文易混词生成的中文词知识本体,包含实体类型和或实体属性,以及实体间关系类型和或关系属性; 步骤二:对中文文本数据进行清洗和特征提取,得到处理后的中文字和词以及对应的特征,生成中文词集; 步骤三:根据生成的中文词集,计算词-词之间在发音、词形、语义的相似度和编辑距离; 步骤四:根据步骤一所构建的知识本体、步骤二中数据预处理得到的中文词集以及步骤三得到的发音、词形、语义的相似度和编辑距离,完成知识图谱实例化; 步骤五:根据步骤二得到的中文词集,利用步骤四得到的知识图谱,得到中文词集中的每条数据对应的知识图谱的子图; 步骤六:根据步骤三得到的发音、词形、语义的相似度和编辑距离,得到中文词集中的每个中文词的易混词集合; 步骤七:构建基于深度学习的多输入多输出的中文易混词生成模型,利用步骤二得到的中文词集,以及步骤五得到的每条数据对应的知识图谱的子图作为输入,以步骤六得到的每个中文词的易混词集合作为标签,训练所述中文易混词生成模型; 步骤八:接收用户输入,并进行和步骤二相同的清洗和特征提取预处理操作; 步骤九:根据步骤八得到的结果,以及步骤四生成的知识图谱,生成所述知识图谱的子图; 步骤十:将步骤八得到的结果和步骤九生成的知识图谱的子图输入训练后的中文易混词生成模型,得到用户输入中各中文词所对应的中文易混词集合。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人之江实验室,其通讯地址为:311121 浙江省杭州市余杭区之江实验室南湖总部;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。