Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 广东工业大学邢玛丽获国家专利权

广东工业大学邢玛丽获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉广东工业大学申请的专利基于多尺度特征与关联特征的中文短文本分类方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119046405B

龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411049576.7,技术领域涉及:G06F16/334;该发明授权基于多尺度特征与关联特征的中文短文本分类方法及系统是由邢玛丽;翟子朗;詹汉城;鲁仁全;邓木清设计研发完成,并于2024-08-01向国家知识产权局提交的专利申请。

基于多尺度特征与关联特征的中文短文本分类方法及系统在说明书摘要公布了:本发明公开了一种基于多尺度特征与关联特征的中文短文本分类方法及系统,涉及自然语言处理领域,包括:获取文本数据集合和主题词集合并进行预处理,使用BERT模型提取文本特征,再使用多个不同的卷积层提取文本多尺度语义特征,计算预处理后的文本的关联信息并构建文本图,使用图神经网络提取文本关联特征,使用交叉注意力机制融合文本多尺度语义特征与文本关联特征,得到融合特征,构建文本分类器,将融合特征输入到文本分类器中得到分类结果,评估分类结果,计算评价指标并对文本分类器进行迭代训练,优化文本分类器参数。本发明通过结合文本多尺度语义特征与文本关联特征,实现文本特征的增强,从而进一步提高中文短文本分类准确度。

本发明授权基于多尺度特征与关联特征的中文短文本分类方法及系统在权利要求书中公布了:1.一种基于多尺度特征与关联特征的中文短文本分类方法,其特征在于,包括以下步骤: 获取带标签的文本数据集合和预设的主题词集合并进行预处理,得到文本集合和词汇表,所述预处理包括以下至少任意一种:文本分词、停用词过滤、构建词汇表、文本编码、主题词编码、标签提取和标签one-hot编码; 使用BERT模型提取所述文本集合的文本特征,再使用多个不同的卷积层提取所述文本特征的文本多尺度语义特征; 计算所述文本集合和所述词汇表中的词语的关联信息,基于关联信息构建文本图,然后使用图神经网络从所述文本图提取文本关联特征; 将提取到的所述文本多尺度语义特征与所述文本关联特征使用交叉注意力机制进行融合,得到融合特征; 构建文本分类器,将所述融合特征输入到所述文本分类器中,得到分类结果; 其中,所述预处理的方法具体为: 采用中文分词模型jieba库,对所述带标签的文本数据集合进行文本分词处理,得到分词文本,将所述分词文本与哈工大停用词表进行对照,去除其中的停用词,得到文本集合,其形式为: Text=[token1,token2,token3,…,tokenN] 其中,tokenN表示文本的第N个分词; 构建词汇表,将所述文本集合中的每一个分词添加进词汇表中并去除词汇表中重复的分词的重复部分; 使用编码器将所述文本集合中的文本进行向量化编码,得到文本向量; 然后使用编码器将所述词汇表中的所有分词进行向量化编码,得到词语向量; 使用编码器将所述主题词集合中的主题词进行向量化编码,得到主题词向量; 提取所述带标签的文本集合的标签并将所述标签作为主题标签,然后使用one-hot编码器对主题标签进行向量化编码,获得主题标签的one-hot向量; 其中,计算关联信息的具体步骤如下: 将所述词语向量输入BERT模型,获取BERT模型的输出,作为词语特征,再将所述主题词向量输入BERT模型,获取BERT模型的输出,作为主题词特征; 采用词嵌入模型获取所述词语特征、所述主题词特征与文本语义特征的词嵌入向量,以所述词嵌入向量为基础,计算关联信息,所述关联信息包括文本-词语关联信息、词语-主题词关联信息、词语-词语关联信息和文本-文本关联信息。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东工业大学,其通讯地址为:510080 广东省广州市越秀区东风东路729号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。