深圳市昊源诺信科技有限公司欧阳浩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市昊源诺信科技有限公司申请的专利基于神经网络自动化注释非结构化数据的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120197598B 。
龙图腾网通过国家知识产权局官网在2025-08-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510685350.4,技术领域涉及:G06F40/169;该发明授权基于神经网络自动化注释非结构化数据的方法是由欧阳浩;向坤设计研发完成,并于2025-05-27向国家知识产权局提交的专利申请。
本基于神经网络自动化注释非结构化数据的方法在说明书摘要公布了:本发明公开了基于神经网络自动化注释非结构化数据的方法,涉及非结构化数据技术领域,包括:基于NLP技术以及CV技术建立预处理注释法;使用预处理注释法获取注释处理区间;建立神经网络,并建立深入注释法;对神经网络进行训练,获取优选神经网络;基于优选神经网络对未注释数据进行自动化注释;本发明用于解决现有的注释非结构化数据方法中,无法解决当非结构化数据中数据的格式较多且数据源较多时,需分别对每个数据源均进行独立分析,导致跨类型数据统一标准难以建立,从而造成注释效率降低以及用户信息接收效率降低的问题。
本发明授权基于神经网络自动化注释非结构化数据的方法在权利要求书中公布了:1.基于神经网络自动化注释非结构化数据的方法,其特征在于,包括如下步骤: 获取未被注释的非结构化数据,记为未注释数据;基于NLP技术以及CV技术建立预处理注释法;使用预处理注释法对未注释数据进行预处理,并基于预处理结果获取注释处理区间; 获取已被注释的非结构化数据,记为已注释数据;建立神经网络,将预处理注释法以及注释处理区间引入神经网络,并在神经网络中建立深入注释法;基于未注释数据以及已注释数据对神经网络进行训练,并基于训练结果获取优选神经网络; 基于优选神经网络对未注释数据进行自动化注释; 预处理注释法包括: 获取未注释数据,基于NLP技术对未注释数据中的文字进行提取,并基于提取结果中独立文字段的提取顺序将得到的独立文字段依次记为数据文本SW1至数据文本SWn,其中,n为独立文字段的数量; 基于CV技术对未注释数据中的图像、音频以及视频进行提取,并将提取得到的图片、音频以及视频分别记为数据图像、数据音频以及数据视频; 预处理注释法还包括: 对于任意一个数据图像:将存在数据文本SW的数据图像记为文本图像,将未存在数据文本SW的数据图像记为常规图像; 对于任意一个数据音频:基于NLP技术对数据音频进行转文字处理,并将得到的文字记为音频文字;基于AI识别获取数据音频中的背景噪音,并将数据音频中背景噪音大于标准识别分贝的数据音频记为噪声音频; 将音频文字中处于噪声音频的音频文字记为干扰音频文字,将音频文字中未处于噪声音频的音频文字记为常规音频文字。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市昊源诺信科技有限公司,其通讯地址为:518000 广东省深圳市南山区西丽街道西丽社区打石一路深圳国际创新谷七栋D座101房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。