上海喜马拉雅科技有限公司颜杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海喜马拉雅科技有限公司申请的专利文本相似度检测方法、装置、计算机设备及可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116205219B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310226732.1,技术领域涉及:G06F40/284;该发明授权文本相似度检测方法、装置、计算机设备及可读存储介质是由颜杰设计研发完成,并于2023-03-09向国家知识产权局提交的专利申请。
本文本相似度检测方法、装置、计算机设备及可读存储介质在说明书摘要公布了:本发明提供的文本相似度检测方法、装置、计算机设备及可读存储介质,方法包括:获取待检测文本,并对待检测文本进行分词,得到词序列;根据版权文本对应的词位置信息表,从词序列中,确定位于词位置信息表中,且在词序列中的序列顺序与在词位置信息表中的序列顺序匹配的连续目标词;统计版权文本、待检测文本以及连续目标词各自的词总数,并计算版权文本与连续目标词的词总数之差,以及连续目标词与待检测文本的词总数比值;将词总数之差输入预设函数中得到相似度评估权重,并将相似度评估权重与词总数比值之间的乘积作为待检测文本与版权文本之间的相似度。本发明适用于长文本相似度检测场景,提高了检测效率和准确度。
本发明授权文本相似度检测方法、装置、计算机设备及可读存储介质在权利要求书中公布了:1.一种文本相似度检测方法,其特征在于,所述方法包括: 获取待检测文本,并对所述待检测文本进行分词,得到词序列; 根据版权文本对应的词位置信息表,从所述词序列中,确定位于所述词位置信息表中,且在所述词序列中的序列顺序与在所述词位置信息表中的序列顺序匹配的连续目标词,包括:若当前词和位于所述当前词之后第一预设数量个词均位于所述词位置信息表中,则根据所述当前词以及第一预设数量个所述词之间的词位置关系,确定所述当前词是否是所述连续目标词;所述当前词为所述词序列中的任意一个;若是所述连续目标词,则若所述当前词的下一个词位于所述词位置信息表中,则根据所述下一个词的词位置与所述当前词的词位置之间的大小关系确定所述当前词的下一个词是否为所述连续目标词;其中,所述连续目标词与所述版权文本匹配;所述大小关系为:所述下一个词存在一个词位置大于所述当前词的词位置且与所述当前词的词位置的间隔小于预设间隔; 统计所述版权文本、所述待检测文本以及所述连续目标词各自的词总数,并计算所述版权文本与所述连续目标词的词总数之差,以及所述连续目标词与所述待检测文本的词总数比值; 将所述词总数之差输入预设函数中得到相似度评估权重,并将所述相似度评估权重与所述词总数比值之间的乘积作为所述待检测文本与所述版权文本之间的相似度;所述相似度用于确定所述待检测文本是否属于版权文本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海喜马拉雅科技有限公司,其通讯地址为:201100 上海市闵行区紫星路588号2幢2062室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励