四川省人工智能研究院(宜宾)邵杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉四川省人工智能研究院(宜宾)申请的专利一种联合多种注意力的最大化句法信息的作者归属方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115081426B 。
龙图腾网通过国家知识产权局官网在2026-03-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210820417.7,技术领域涉及:G06F40/211;该发明授权一种联合多种注意力的最大化句法信息的作者归属方法是由邵杰;刘建博;佘磊;阿卜杜拉·阿曼·汗设计研发完成,并于2022-07-13向国家知识产权局提交的专利申请。
本一种联合多种注意力的最大化句法信息的作者归属方法在说明书摘要公布了:本发明公开了一种联合多种注意力的最大化句法信息的作者归属方法,包括获取未知作者的文本信息数据,对文本信息数据进行预处理,得到字符原始数据和句法原始数据,并分别嵌入得到字符嵌入向量和标签嵌入向量;从字符嵌入向量中提取字符2‑grams特征图,并采用最大池化方法构建内容特征向量;从标签嵌入向量中提取句法信息特征,并分别计算不同单词之间的注意力系数,构建句法特征向量;将内容特征向量和句法特征向量拼接得到文本风格特征,根据文本风格特征预测文本信息数据的作者归属。本发明能够提升匿名文本的分类准确率和分类效果。
本发明授权一种联合多种注意力的最大化句法信息的作者归属方法在权利要求书中公布了:1.一种联合多种注意力的最大化句法信息的作者归属方法,其特征在于,包括以下步骤: S1、获取未知作者的文本信息数据,对文本信息数据进行预处理,得到字符原始数据和句法原始数据,并分别嵌入得到字符嵌入向量和标签嵌入向量; S2、从字符嵌入向量中提取字符2-grams特征图,并采用最大池化方法构建内容特征向量; S3、从标签嵌入向量中提取句法信息特征,并分别计算不同单词之间的注意力系数,构建句法特征向量; S4、将内容特征向量和句法特征向量拼接得到文本风格特征,根据文本风格特征预测文本信息数据的作者归属; 步骤S3具体包括: 根据文本信息数据构建句法成分树,将句法成分树编码为分布式表示向量; 根据文本信息数据中单词的依赖关系构建句法依赖树,对句法依赖树中各个节点按顺序编号,提取句法依赖树的结构特征,得到单词的邻接矩阵; 将标签嵌入向量、分布式表示向量及单词的邻接矩阵进行拼接,并采用多个平行的单层卷积神经网络提取包含句法特征的单词嵌入向量; 采用分层的注意力网络分别计算各个句法特征的单词嵌入向量中的标签注意力系数,并对各个句法特征的单词嵌入向量添加对应的标签注意力系数,得到最终的单词嵌入向量; 采用双向长短时记忆从单词嵌入向量中提取句法信息,并采用图注意力网络计算句法成分树中不同邻接点的注意力系数,得到节点特征向量; 将所有的节点特征向量相加,得到句法特征向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川省人工智能研究院(宜宾),其通讯地址为:644000 四川省宜宾市宜宾临港经济技术开发区长江北路西段附二段430号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励