Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 天翼数字生活科技有限公司杨珉获国家专利权

天翼数字生活科技有限公司杨珉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉天翼数字生活科技有限公司申请的专利一种相似文档检索方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114117005B

龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111407744.1,技术领域涉及:G06F16/332;该发明授权一种相似文档检索方法、装置、电子设备及存储介质是由杨珉;孙立奋;毛绍嵘设计研发完成,并于2021-11-24向国家知识产权局提交的专利申请。

一种相似文档检索方法、装置、电子设备及存储介质在说明书摘要公布了:本发明公开了一种相似文档检索方法、装置、电子设备及存储介质,用于解决现有的相似文档检索方法时间成本高,效率低的技术问题。本发明包括:获取训练文档库;所述训练文档库包括多篇文档,每篇文档具有对应的文档ID;根据所述文档构建训练数据集;采用所述训练数据集训练神经网络,得到目标神经网络;接收目标文档,采用所述目标文档生成目标训练数据集;将所述目标训练数据集输入所述目标神经网络,得到所述目标文档的目标向量;计算所述目标向量与预设数据库中的对比向量之间的差值,并将差值小于预设阈值的对比向量对应的文档作为相似文档。

本发明授权一种相似文档检索方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种相似文档检索方法,其特征在于,包括: 获取训练文档库;所述训练文档库包括多篇文档,每篇文档具有对应的文档ID; 根据所述文档构建训练数据集; 采用所述训练数据集训练神经网络,得到目标神经网络; 接收目标文档,采用所述目标文档生成目标训练数据集; 将所述目标训练数据集输入所述目标神经网络,得到所述目标文档的目标向量; 计算所述目标向量与预设数据库中的对比向量之间的差值,并将差值小于预设阈值的对比向量对应的文档作为相似文档,其中,所述对比向量是通过待检索范围内的文档收集进数据库中,并通过所述目标神经网络生成相应的; 其中,所述根据所述文档构建训练数据集的步骤,包括: 将每篇所述文档划分为多个分词;每个分词具有对应的分词ID; 采用所有所述文档及每个所述文档对应的分词构建训练数据集; 其中,所述采用所有所述文档及每个所述文档对应的分词构建训练数据集的步骤,包括: 通过预设的滑动窗口,根据所述文档中分词的排列顺序,从所述文档的分词中提取出多个第一分词; 以所述滑动窗口中最后一个第一分词的分词ID为输出,以所述滑动窗口中除最后一个第一分词外的第一分词的分词ID及对应的文档ID为输入,生成训练数据; 按照所述文档中分词的排列顺序移动所述滑动窗口,并返回通过预设的滑动窗口,根据所述文档中分词的排列顺序,从所述文档中提出多个第一分词的步骤,直至遍历完所述文档中的所有分词; 采用得到的所有训练数据生成训练数据集; 其中,所述神经网络包括嵌入层、拼接层、全连接层和Softmax层;所述采用所述训练数据集训练神经网络,得到目标神经网络的步骤,包括: 将作为输入的第一分词的分词ID对应的分词向量拼接成为分词矩阵; 将所述分词矩阵与预设第一参数矩阵相乘,得到所述嵌入层的第一分支输出; 将所述第一分词对应的文档ID对应的文档向量与预设第二参数矩阵相乘,得到所述嵌入层的第二分支输出; 通过所述拼接层将所述第一分支输出和所述第二分支输出进行拼接,得到所述拼接成的拼接输出向量; 将所述全连接层的第三参数矩阵与所述拼接输出向量相乘,得到全连接层输出; 通过Softmax层对所述全连接层输出进行Softmax变换,得到所述神经网络的目标输出向量; 以作为输出的第一分词的分词ID构建目标向量; 计算所述目标输出向量和所述目标向量之间的损失值; 采用所述损失值更新所述第一参数矩阵、所述第二参数矩阵和所述第三参数矩阵; 判断当前训练次数是否等于预设次数阈值; 若否,返回将作为输入的第一分词的分词ID对应的分词向量拼接成为分词矩阵的步骤; 若是,基于更新后的第一参数矩阵、第二参数矩阵、第三参数矩阵构建目标神经网络。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天翼数字生活科技有限公司,其通讯地址为:200040 上海市静安区万荣路1256、1258号1423室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。