广东省海洋发展规划研究中心;中经网数据有限公司原峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东省海洋发展规划研究中心;中经网数据有限公司申请的专利海洋及相关产业分类识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120296173B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510796999.3,技术领域涉及:G06F16/353;该发明授权海洋及相关产业分类识别方法及系统是由原峰;周圆;安晓未;彭逸桓;唐玲;李浩;游俊凯;马天昊;毛欣设计研发完成,并于2025-06-16向国家知识产权局提交的专利申请。
本海洋及相关产业分类识别方法及系统在说明书摘要公布了:本发明提供一种海洋及相关产业分类识别方法及系统,包括:步骤S1:建立企业信用信息数据库;步骤S2:获取标准文件,并对标准文件和人工识别样本分别进行文本预处理;步骤S3:根据人工识别样本和所述标准文件,建立涉海企业识别模型;步骤S4:使用涉海企业识别模型对待识别企业进行识别,得到模型识别样本,通过比对模型识别样本和人工识别样本,计算各海洋产业的识别准确率、额外识别比;步骤S5:调整涉海企业识别模型,使用调整后的涉海企业识别模型对待识别企业进行识别,得到企业分类结果;步骤S6:为企业分类结果中的企业,计算对每个被识别的海洋产业的评估分数。本发明能够提高识别结果的准确率,具备可解释性,可展示分类依据。
本发明授权海洋及相关产业分类识别方法及系统在权利要求书中公布了:1.一种海洋及相关产业分类识别方法,其特征在于,包括: 步骤S1:建立企业信用信息数据库,将其中的企业分为人工识别样本和待识别企业,并在企业信用信息数据库中选定企业名称、经营范围、国民经济行业分类多个特征字段; 步骤S2:获取标准文件,并对所述标准文件和所述人工识别样本分别进行文本预处理; 步骤S3:根据人工识别样本和所述标准文件,学习各海洋产业的企业在企业名称、经营范围、国民经济行业分类三个特征字段中的特征组合及关联规则,建立涉海企业识别模型; 步骤S4:使用所述涉海企业识别模型对所述待识别企业进行识别,划分至n个海洋产业,得到模型识别样本,通过比对模型识别样本和人工识别样本,计算各海洋产业的识别准确率、额外识别比; 步骤S5:根据识别准确率和额外识别比,调整所述涉海企业识别模型,使用调整后的涉海企业识别模型对待识别企业进行识别,划分至n个海洋产业,得到企业分类结果; 步骤S6:为所述企业分类结果中的企业,计算对每个被识别的海洋产业的评估分数; 所述步骤S4包括: 步骤S4.1:将待识别企业中的文本进行分词,得到的特征词与海洋产业特征词对比,计算相对汉明距离,通过设置相对汉明距离的阈值对企业名称、经营分类模糊识别; 当待识别企业特征词与海洋产业特征词的汉明距离,相对于海洋产业特征词的长度较小时,将相对汉明距离的特征词挑选出来,判断两个特征词是否能被认为是相同的特征词,若能,则在输入涉海企业识别模型使用海洋产业特征词进行替换; 步骤S4.2:通过比对模型识别样本和人工识别样本,计算各海洋及相关产业的识别准确率、额外识别比;其中,额外识别比为模型识别为A海洋产业的企业数与人工识别为A海洋产业的企业数的比率,用于评估涉海企业识别模型在真实场景中的泛化能力; 所述步骤S5包括: 步骤S5.1:制定排除规则,包括对模型识别样本进行企业名称关键词分词提取,使用TF-IDF算法和人工补充,筛选出海洋产业排除词,排除不涉海和主营业务非此海洋产业的企业,控制额外识别比。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东省海洋发展规划研究中心;中经网数据有限公司,其通讯地址为:510000 广东省广州市海珠区南华东路547号5-7楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。