Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 深圳市华傲数据技术有限公司田莹获国家专利权

深圳市华傲数据技术有限公司田莹获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉深圳市华傲数据技术有限公司申请的专利一种热点的提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115345252B

龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211043446.3,技术领域涉及:G06F18/2413;该发明授权一种热点的提取方法是由田莹;隋晓峰;唐野;陈立;龚健设计研发完成,并于2022-08-29向国家知识产权局提交的专利申请。

一种热点的提取方法在说明书摘要公布了:本发明公开了一种热点的提取方法,包括以下提取步骤:步骤S1,分析数据并提取;步骤S2,关键词词向量的模糊匹配;步骤S3,UIE模型事件地址信息抽取;步骤S4,相似度Bert模型抽取文本向量,对文本向量进行软聚类;步骤S5,文本向量聚类;步骤S6,排序热点事情生成日报。对文本进行两级聚合,先换分为大的类别作为热点事件,然后每个热点下面还聚合相似的事件作为子类别。采用了规则匹配加深度学习的方法,事件抽取采用了最新的UIE模型,事件提取精准,文本向量采用Bert模型,表示能力强;文本聚合采用了自己设计的软聚合,聚合速度快,并允许有一些没有类别的样本。

本发明授权一种热点的提取方法在权利要求书中公布了:1.一种热点的提取方法,其特征在于,包括以下提取步骤: 步骤S1,分析数据并提取:分析热点历史日报的数据,对热点词进行重处理,统计热点词频率并进行排序,提取出高频率的热点词,再用Textrank对高频热点词下的事件标题进行关键词提取,并进行人工筛选; 步骤S2,关键词词向量的模糊匹配:利用海量的热点事件语料训练word2vec词向量,分别提取不同热点词下关键词的词向量和事件标题分词后的词向量,计算关键词词向量和标题分词词向量的余弦相似度,达到对事件标题的模糊匹配; 步骤S3,UIE模型事件地址信息抽取:UIE模型是一个统一信息抽取模型,首先对一定量热点的语料数据进行标注,标注出文本中的事件和地址,然后用这些数据通过微调UIE模型达到收敛,最后用UIE模型提取标题的事件和地址; 步骤S4,相似度Bert模型抽取文本向量,对文本向量进行软聚类:Bert模型预先用海量的无标注文本进行预训练,然后用大量的相似文本对进行文本匹配训练,文本经过Bert提取的向量能很好地提取语义信息,相似的文本向量距离相接近,不同的文本向量距离相远离,文本首先进行token化,每一个中文的字为一个token,token序列经过Bert的嵌入层变成一个矩阵,然后经过多层的自注意力层和前馈神经网络,提取其中的文本表示,把提取的矩阵在序列方向上取平均即为文本的向量,再用cos相似度函数计算所有文本向量的相似度矩阵,提取其中大于0.9的值得位置对,遍历所有位置对,对含有相同位置的位置对相互合并,当聚类数目不再变化时,聚类结束; 步骤S5,文本向量聚类:对文本向量进行聚类处理,得到相似事件集合; 步骤S6,排序热点事情生成日报:对热点事件的数量进行排序,取前6条,生成日报。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市华傲数据技术有限公司,其通讯地址为:518000 广东省深圳市龙华区民治街道北站社区汇德大厦1号楼2203/2204;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。