奇安信科技集团股份有限公司;网神信息技术(北京)股份有限公司马勇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉奇安信科技集团股份有限公司;网神信息技术(北京)股份有限公司申请的专利基于文本风格的文本类别识别方法、系统及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114443833B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110320155.3,技术领域涉及:G06F16/35;该发明授权基于文本风格的文本类别识别方法、系统及设备是由马勇设计研发完成,并于2021-03-25向国家知识产权局提交的专利申请。
本基于文本风格的文本类别识别方法、系统及设备在说明书摘要公布了:本发明实施例提供了一种基于文本风格的文本类别识别方法,所述方法包括:对待检测文本进行分词操作以获取目标数量的分词,M为正整数;对所述目标数量的分词分别进行向量表示,以获取目标数量的特征向量;将所述目标数量的特征向量输入到训练好的一个或多个风格分类网络中,得到风格表示向量;将所述目标数量的特征向量输入到训练好的内容分类网络中,得到目标类分类向量;及根据所述风格表示向量和所述目标类分类向量,判断所述待检测文本是否为目标类文本。本发明实施例使得在特定字符不显著或并没有显著标志也可以准确的识别出待检测文本的目标文本类别,提高了对待检测文本的识别效率和识别准确率。
本发明授权基于文本风格的文本类别识别方法、系统及设备在权利要求书中公布了:1.一种基于文本风格的文本类别识别方法,其特征在于,包括: 对待检测文本进行分词操作以获取目标数量的分词; 对所述目标数量的分词分别进行向量表示,以获取目标数量的特征向量; 将所述目标数量的特征向量输入到训练好的一个或多个风格分类网络中,得到风格表示向量;所述一个或多个风格分类网络用于基于所述目标数量的特征向量提取所述待检测文本的风格特征,并将所述风格特征转化为所述风格表示向量; 将所述目标数量的特征向量输入到训练好的内容分类网络中,得到目标类分类向量;所述内容分类网络用于基于所述目标数量的特征向量提取所述待检测文本的内容特征,并将所述内容特征转化为所述目标类分类向量;及 根据所述风格表示向量和所述目标类分类向量,判断所述待检测文本是否为目标类文本; 其中,所述一个或多个风格分类网络和所述内容分类网络共用全连接分类结构,所述全连接分类结构包括全连接层和分类层; 所述根据所述风格表示向量和所述目标类分类向量,判断所述待检测文本是否为目标类文本的步骤,包括: 通过数组拼接函数拼接第一风格表示向量、第二风格表示向量和所述目标类分类向量,得到目标向量;所述第一风格表示向量对应于所述待检测文本的词汇风格,所述第二风格表示向量对应于所述待检测文本的其他风格;及 将所述目标向量输入到所述全连接层并经所述分类层,得到所述待检测文本为所述目标类文本的置信度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人奇安信科技集团股份有限公司;网神信息技术(北京)股份有限公司,其通讯地址为:100088 北京市西城区新街口外大街28号102号楼3层332号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。