恭喜湘江实验室易国栋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜湘江实验室申请的专利一种基于句法增强的多维向量化文本相似度计算方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119918526B 。
龙图腾网通过国家知识产权局官网在2025-07-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510416311.4,技术领域涉及:G06F40/194;该发明授权一种基于句法增强的多维向量化文本相似度计算方法是由易国栋;赵俊伟;黄偲乐;杨英丽;张新玉;吴奇;陈佳婷;蔡文雅;朱钰杰设计研发完成,并于2025-04-03向国家知识产权局提交的专利申请。
本一种基于句法增强的多维向量化文本相似度计算方法在说明书摘要公布了:本发明实施例中提供了一种基于句法增强的多维向量化文本相似度计算方法,属于数据处理技术领域,具体包括:步骤1,对输入文本进行分词和句法分析,得到分词结果及其对应的成分标签;步骤2,分别采用WoBERT模型和Transformer的自注意力机制对分词结果进行向量化表示并进行融合,得到融合向量;步骤3,通过深度集成变换器对融合向量进行降维处理,生成具有强表达能力的目标词向量;步骤4,针对相同成分标签的目标词向量,通过义素相似度公式计算相似度值;步骤5,基于全部相似度值,通过加权平均调整最终相似度评分。通过本发明的方案,引入基于句法与词向量结合的文本相似度匹配方法,提高了相似度计算的精度和效率。
本发明授权一种基于句法增强的多维向量化文本相似度计算方法在权利要求书中公布了:1.一种基于句法增强的多维向量化文本相似度计算方法,其特征在于,包括: 步骤1,对输入文本进行分词和句法分析,得到分词结果及其对应的成分标签; 步骤2,分别采用WoBERT模型和Transformer的自注意力机制对分词结果进行向量化表示并进行融合,得到融合向量; 步骤3,通过深度集成变换器对融合向量进行降维处理,生成具有强表达能力的目标词向量; 所述步骤3具体包括: 步骤3.1,利用前瞻性层通过深度神经网络架构对融合向量进行初步处理,通过多个神经元对融合向量进行线性变换和非线性激活,生成输出特征向量H 其中,H为前瞻性层的输出特征向量,表示融合向量,为权重矩阵,为偏置向量,为激活函数; 步骤3.2,引入集成学习策略,通过自编码器的多个子模型对特征向量H进行学习和预测,将不同子模型的输出通过聚合函数进行整合,得到聚合向量,其中,所述集成学习策略包括随机森林和梯度提升,所述聚合向量的表达式为 其中,为不同模型的输出,Aggregate为聚合函数,表示分词结果的数量; 步骤3.3,对聚合向量进行精炼处理,得到降维向量 其中,表示用于线性变换的权重矩阵,表示用于线性变换的偏置向量; 步骤3.4,结合上下文信息,对降维向量进行动态调整,得到目标词向量 其中,表示基于上下文信息对降维向量进行非线性映射的函数,表示从输入文本中提取的上下文特征向量; 步骤4,针对相同成分标签的目标词向量,通过义素相似度公式计算相似度值; 步骤5,基于全部相似度值,通过加权平均调整最终相似度评分。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湘江实验室,其通讯地址为:410000 湖南省长沙市长沙高新区尖山路217号北斗产业园1栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。