上海医米信息技术有限公司张朝武获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海医米信息技术有限公司申请的专利一种文本内容的标签化方法、设备、介质和程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121118913B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511652730.4,技术领域涉及:G06F40/30;该发明授权一种文本内容的标签化方法、设备、介质和程序产品是由张朝武;张智豪;刘雪琼;邓晓亮;檀真稳;张玉设计研发完成,并于2025-11-12向国家知识产权局提交的专利申请。
本一种文本内容的标签化方法、设备、介质和程序产品在说明书摘要公布了:一种文本内容的标签化方法、设备、介质和程序产品,涉及自然语言处理计算领域。由于设备采用了先由预设标签模型结合上下文进行初步语义分类,再于该分类所对应的特定知识数据库内进行向量化精确匹配的技术手段,因此能够首先利用模型的语境理解能力,将词语的真实含义限定在一个明确的语义范畴内,从而选择出高度相关的知识数据库。有效避免了在全局知识库中进行盲目搜索所导致的语义混淆问题,解决了传统方法难以区分专业文本中多义词语的障碍,进而提升了标签识别的准确性与可靠性。
本发明授权一种文本内容的标签化方法、设备、介质和程序产品在权利要求书中公布了:1.一种文本内容的标签化方法,其特征在于,所述方法包括: 在接收到待处理源数据文本的情况下,对源数据文本进行分词处理,得到候选词语和所述候选词语的上下文数据; 将所述候选词语和所述上下文数据输入预设标签模型,得到所述候选词语的初步类别; 在确定所述初步类别包含的子类别的数量高于预设阈值的情况下,在预先构建的本地标签库中获取与所述子类别对应的目标类别信息;所述本地标签库中包含历史标签化过程中经过人工确认的标准标签,以及与所述标准标签对应的类别和类别信息;所述目标类别信息包括所述子类别的类别定义和核心特征词集; 基于所述目标类别信息,对所述目标类别信息进行横向比较,提取每个子类别独有的差分特征集,所述差分特征集包括在一个子类别信息中出现频次超过预设值但在其他子类别信息中出现频次少于所述预设值的语义单元; 基于所述差分特征集对所述上下文数据进行注意力加权,生成与所述子类别对应的聚焦上下文向量; 计算所述聚焦上下文向量与对应的子类别语义向量之间的语义相似度,得到所述子类别的类别匹配分数; 确定所述类别匹配分数最高的子类别为更新后的初步类别; 确定与所述初步类别对应的目标知识数据库,并将所述目标知识数据库中的候选标签进行向量化得到候选标签向量; 将所述候选词语进行向量化得到候选词语向量; 将所述候选词语向量与所述候选标签向量进行向量匹配,得到匹配度; 将所述匹配度最高的候选标签向量对应的候选标签确定为所述候选词语的标签。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海医米信息技术有限公司,其通讯地址为:200433 上海市杨浦区国宾路18号1901室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励