北京师范大学;北京邮电大学靳健获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京师范大学;北京邮电大学申请的专利基于主题特征的金融投诉案例的检索方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117171368B 。
龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311321253.4,技术领域涉及:G06F16/383;该发明授权基于主题特征的金融投诉案例的检索方法和装置是由靳健;傅湘玲;李朝阳;耿骞;黄威设计研发完成,并于2023-10-12向国家知识产权局提交的专利申请。
本基于主题特征的金融投诉案例的检索方法和装置在说明书摘要公布了:本发明涉及深度学习技术领域,特别涉及一种基于主题特征的金融投诉案例的检索方法和装置。方法包括:利用向量索引算法对待检索案例进行粗排检索,得到待检索案例的若干个相似案例;待检索案例分别与每一个相似案例生成文本对,并将若干个文本对输入至预先训练好的文本匹配模型中;其中,文本匹配模型是基于预训练模型训练生成的,预训练模型的输入层用于生成由词向量、位置向量、分段向量和主题信息词向量相加组成的输入向量,并将输入向量输入至文本匹配模块;得到各文本对的匹配分数,以根据匹配分数确定最终的目标案例。本方案可以使得预训练模型能够学习跨文本的主题特征,从而提高金融投诉案例检索的准确度和效率。
本发明授权基于主题特征的金融投诉案例的检索方法和装置在权利要求书中公布了:1.一种基于主题特征的金融投诉案例的检索方法,其特征在于,包括: 利用向量索引算法对待检索案例进行粗排检索,得到所述待检索案例的若干个相似案例; 所述待检索案例分别与每一个相似案例生成文本对,并将若干个文本对输入至预先训练好的文本匹配模型中;其中,所述文本匹配模型是基于预训练模型训练生成的,所述预训练模型由输入层和文本匹配模块组成,所述输入层用于生成由词向量、位置向量、分段向量和主题信息词向量相加组成的输入向量,并将所述输入向量输入至文本匹配模块; 得到各文本对的匹配分数,以根据所述匹配分数确定最终的目标案例; 所述文本匹配模型是通过如下方式训练生成的: 利用Bert语言模型和文本聚类算法,生成带有主题信息的词向量库; 获取若干个被标注有标签的文本样本对;其中,所述文本样本对包括第一文本和第二文本,所述标签用于表征所述第一文本和所述第二文本是否相似; 针对每一个文本样本对,均执行:将该文本样本对输入至预训练模型中,所述预训练模型的输入层基于所述词向量库,生成该文本样本对的主题信息词向量,并将主题信息词向量与该文本样本对的词向量、位置向量和分段向量相加组成输入向量; 将所述输入向量输入至预训练模型的文本匹配模块,以利用所述文本匹配模块的输出和该文本样本对对应的标签,对所述预训练模型的网络参数进行调整; 直至得到符合预期的文本匹配模型; 所述利用Bert语言模型和文本聚类算法,生成带有主题信息的词向量库,包括: 利用Bert语言模型和文本聚类算法,对案例库中的案例文本进行主题分类,得到每一个主题对应的主题向量,以生成主题矩阵; 计算所述案例库中每一个词语在每一个主题的重要性,生成重要性矩阵; 对所述重要性矩阵进行归一化,得到权重矩阵;其中,所述权重矩阵中含有每一个词语在每一个主题的权重; 将所述主题矩阵与所述权重矩阵相乘,得到带有主题信息的词向量库;其中,所述词向量库中的每一个词向量为该词语在主题维度的向量表示; 每一个词语在每一个主题的重要性是通过如下公式计算的: 式中,Wx,c为词语x在主题c中的重要性,tfx,c为词语x在主题c中出现的频率,fx为词语x在所有主题的中出现的频率,A为每一个主题的平均词语数量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京师范大学;北京邮电大学,其通讯地址为:100875 北京市海淀区新街口外大街19号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励