Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国经济信息社有限公司晋东毅获国家专利权

中国经济信息社有限公司晋东毅获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国经济信息社有限公司申请的专利用于稿件处理的词向量搭建方法和稿件处理方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114662471B

龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210298544.5,技术领域涉及:G06F40/216;该发明授权用于稿件处理的词向量搭建方法和稿件处理方法和装置是由晋东毅设计研发完成,并于2022-03-25向国家知识产权局提交的专利申请。

用于稿件处理的词向量搭建方法和稿件处理方法和装置在说明书摘要公布了:本公开涉及一种用于稿件处理的词向量搭建方法和稿件处理方法和装置,包括:由资讯数据库中获取词向量模型搭建所需要的标签栏目。并由资讯数据库中所存储的各稿件中提取出预设个数的分词及各分词的向量值。对于各标签栏目,均对应匹配分词和向量值,构成包含标签栏目、分词和向量值的数据集合。基于所构成的数据集合,搭建得到词向量模型。其中,词向量模型为由多个数据集合形成的矩阵。本公开使用基于支持向量机原理的模型进行设计,通过映射特征过程的调参处理,来满足实际的业务需求。利用单篇文章的特征值和整体模型的特征值,辅助一些特定算法,就可以实现签发栏目推荐等功能。

本发明授权用于稿件处理的词向量搭建方法和稿件处理方法和装置在权利要求书中公布了:1.一种用于进行稿件处理的词向量模型搭建方法,其特征在于,包括: 由资讯数据库中获取词向量模型搭建所需要的标签栏目,并由所述资讯数据库中所存储的各稿件中提取出预设个数的分词及各所述分词的向量值; 对于各所述标签栏目,均对应匹配所述分词和所述向量值,构成包含所述标签栏目、所述分词和所述向量值的数据集合; 基于所构成的所述数据集合,搭建得到所述词向量模型; 其中,所述词向量模型为由多个所述数据集合形成的矩阵; 其中,在基于所构成的数据集合搭建得到所述词向量模型时,通过将资讯数据库中所有稿件的数据集合进行合并实现; 由所述资讯数据库中所存储的各稿件中提取出预设个数的分词及各所述分词的向量值时,基于开源的词库得到; 基于开源的词库由各稿件中提取出预设个数的分词时,包括: 根据所述词库中的分词工具包对所述稿件进行分词,由所述稿件中提取出第一分词集合和第二分词集合;其中,所述第一分词集合和所述第二分词集合分别采用不同的分词提取算法得到; 基于所述资讯数据库分别计算得到所述第一分词集合中各分词的IDF值和所述第二分词集合中各分词的IDF值; 根据所述第一分词集合中各分词的IDF值的大小对所述第一分词集合中各分词进行排序得到第一分词序列,由所述第一分词序列中选取前n个分词作为第一待提取词; 根据所述第二分词集合中各分词的IDF值的大小对所述第二分词集合中各分词进行排序得到第二分词序列,由所述第二分词序列中选取前n个分词作为第二待提取词; 其中,n>N,N为预设个数; 由n个所述第一待提取词和n个所述第二待提取词构成的分词集合中取前N个分词作为预设个数的分词;其中,在由n个所述第一待提取词和n个所述第二待提取词构成的分词集合中取前N个分词作为预设个数的分词时,对待提取词集合中的各分词进行权重值的计算,得到各分词的权重;进而再根据待提取词序列中各分词的权重对待提取词中的各分词进行排序,并根据排序结果由待提取词中提取出位于排序前N个的分词作为最终所需要的分词。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国经济信息社有限公司,其通讯地址为:100052 北京市西城区宣武门西大街57号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。