解放号网络科技有限公司毕辉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉解放号网络科技有限公司申请的专利一种结合知识图谱的用户画像构建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115309982B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210845892.X,技术领域涉及:G06F16/9535;该发明授权一种结合知识图谱的用户画像构建方法是由毕辉设计研发完成,并于2022-07-19向国家知识产权局提交的专利申请。
本一种结合知识图谱的用户画像构建方法在说明书摘要公布了:本发明公开了一种结合知识图谱的用户画像构建方法,具体涉及大数据领域,包括包含知识图谱构建模块、标签抽取模块、人才画像模块和反馈模块组成的构建架构:其中,知识图谱构建模块包含:命名实体识别和关系抽取;标签抽取模块包含标签选择、数据清洗和标签存储;用户反馈模块:用户会对用户画像的标签进行反馈。本发明将知识图谱作为标签系统构建时的一种补充;使用端到端的方法构建知识图谱,提高了知识图谱的构建效率,降低复杂度;样本库和数据库的独立,能提高标签系统的可信度;构建的标签系统增加了外部信息的补充和校验,更准确可靠;端到端的知识图谱构建方法极大的提高了知识图谱的构建效率,并降低了复杂度。
本发明授权一种结合知识图谱的用户画像构建方法在权利要求书中公布了:1.一种结合知识图谱的用户画像构建方法,包括知识图谱构建模块、标签抽取模块、人才画像模块和反馈模块组成的构建架构,其特征在于: 其中,知识图谱构建模块包含:命名实体识别和关系抽取; 从模型库中导入预训练的end‑to‑end神经网络模型,通过样本接口从样本库中提取相关文本输入模型,输出文本中所有实体及相关关系的三元组; 深度学习通过反馈模块得到的数据加入原有数据库中一起训练,进一步提高模型的准确率;从模型库中导入预训练的端对端神经网络进行实体关系的直接预测;由此得到的实体关系外部知识补充到词向量的训练中; 标签抽取模块包含标签选择、数据清洗和标签存储; 标签选择:针对不同场景的用户,需要根据用户的需求,以及用户画像的应用方向进行不同策略的标签选择; 数据清洗:目标标签可能直接就是数据库中某个字段所对应的内容,也可能是内容中的内容,此时就需要对字段对应的内容进行清洗; 标签存储:将得到的标签按用户ID存储到hbase数据库中,每个用户ID会对应多个标签;rowkey ID下对应的内容为一个key标签名,value为标签值的dict; 人才画像模块用于整理用户画像的具体存储字段; 反馈模块:用户会对用户画像的标签进行反馈;若标签错误,则根据标签的产生方向分别反馈至样本库或数据库中,作为对数据和算法的修正; 具体的各模块间具体的构建步骤如下: S1:调取:人才简历库,并对数据进行清洗、合并的操作; S2:从结构化字段中抽取出人才的标签,行业,领域,专业技能,工作经验,教育经验,作为该人才的标签; S3:构建端到端的行业知识图谱,从各个领域的专业技能知识入手,构建领域‑行业‑技能的图谱网络,作为标签体系构建时的内容补充; S4:调取:人才简历库,对非结构化字段,一方面通过NLP算法,另一方面通过知识图谱的关系抽取算法,抽取出技能、行业经验、从业年限的标签; S5:综合结构化和非结构化标签,并进行语义对齐做二次验证,作为人才的标签; S6:抽取新项目案例的关键词,根据人才标签进行人才推荐。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人解放号网络科技有限公司,其通讯地址为:210000 江苏省南京市雨花台区宁双路19号云密城1号楼604室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励