Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 广东工业大学邢玛丽获国家专利权

广东工业大学邢玛丽获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉广东工业大学申请的专利一种基于词语相似度的中文短文本分类方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118568255B

龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410562008.0,技术领域涉及:G06F16/353;该发明授权一种基于词语相似度的中文短文本分类方法和系统是由邢玛丽;翟子朗;詹汉城;鲁仁全;常乐设计研发完成,并于2024-05-08向国家知识产权局提交的专利申请。

一种基于词语相似度的中文短文本分类方法和系统在说明书摘要公布了:本发明公开了一种基于词语相似度的中文短文本分类方法和系统,可应用于判断文本事件类型及对文本进行分类。包括以下步骤:利用预设的事件类型集对文本进行分词,获得事件触发词和所属事件类型标签的向量形式。对得到的分词文本进行文本特征提取得到文本语义向量。对获得的事件触发词和预设的事件类型集使用自然语言处理模型进行向量化,获得各自的词向量,利用所述词向量计算获得事件触发词与事件类型集之间的相似度向量。将文本语义向量与相似度向量融合得到总特征,并输入到文本分类器中对文本进行分类,输出分类结果并评估准确率。本发明引入了文本语义特征和词语相似度融合的概念,充分挖掘文本的特征,从而提高了文本分类的精确度和效率。

本发明授权一种基于词语相似度的中文短文本分类方法和系统在权利要求书中公布了:1.一种基于词语相似度的中文短文本分类方法,其特征在于,包括如下步骤: S1:利用预设的事件类型集,对待分类文本进行分词,清洗数据,提取标签,获得事件触发词和文本所属事件类型标签的预设向量形式; S2:对S1得到的分词文本,进行文本特征提取,得到文本语义向量; S3:对S1获得的事件触发词和预设的事件类型集,使用预训练过的自然语言处理模型分别进行向量化,获得各自的词向量,利用所述词向量计算获得事件触发词与事件类型集之间的相似度向量,所述相似度向量是一个长度为65的向量,形式为: s=[s1,s2,…,si,…,s65] 其中si表示触发词与事件类型ei的相似度,利用余弦相似度算法计算得到,表达式如下所示: S4:将S2得到的文本语义向量与S3得到的相似度向量进行融合,得到最终用于分类的总特征,其中,文本语义向量需要降维至与相似度向量相同的维度才能进行特征融合; 所采用的特征降维方法如下: 所采用的融合基于以下公式: fG=ZG·f′text+1-ZG·f′similar 其中,sigmoid表示sigmoid激活函数,WG、UG是降维矩阵,f′text是降维后的文本特征向量,是可学习的相似度向量权值,其中f′similari是第i个相似度向量,ZG是基于两种特征的贡献度计算出来的总权重,是一个介于0-1之间的数,fG∈Rb×n是融合后的总特征; S5:将总特征输入文本分类器中,对待分类文本进行分类,输出分类结果,并评估分类准确率。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东工业大学,其通讯地址为:510080 广东省广州市越秀区东风东路729号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。