Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东南大学;南京市公安局马金豪获国家专利权

东南大学;南京市公安局马金豪获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东南大学;南京市公安局申请的专利面向机器学习应用的多版本非结构化数据存储方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119597224B

龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411810437.1,技术领域涉及:G06F3/06;该发明授权面向机器学习应用的多版本非结构化数据存储方法是由马金豪;吴文甲;汪兆斌;高波;张博;徐风雷;杨明设计研发完成,并于2024-12-10向国家知识产权局提交的专利申请。

面向机器学习应用的多版本非结构化数据存储方法在说明书摘要公布了:本发明公开了一种面向机器学习应用的多版本非结构化数据存储方法,具体包括:1非结构化多源数据的分布式存储框架:在数据正式存储前,利用多版本数据存储策略对多源数据进行处理和判断,基于存储空间和检索时间的权衡选择最优的存储策略,而基于神经网络的数据压缩技术会针对不同类型的数据进行相应压缩,以提高分布式数据库的存储效率和机器学习应用在数据访问、处理过程中的便捷性。2多版本数据存储策略:面对多源数据持续生成和存储版本不断变化的挑战。该方法可以部署在分布式的非结构化图数据库中,存储过程独立完整且具有全局视角,能够实现数据存储的管理和优化,适用于多类型数据源和高频数据更新的场景。

本发明授权面向机器学习应用的多版本非结构化数据存储方法在权利要求书中公布了:1.面向机器学习应用的多版本非结构化数据存储方法,其特征在于,所述方法包括: 11创建分布式的非结构化图数据库,并设计相应的图数据模型,包括图的节点、数据的关系、属性及其相应的表示; 12对于即将存储至数据库的多源数据,通过多版本数据存储策略对数据进行处理和判断,基于存储空间、检索时间、CPU资源消耗成本、网络资源消耗成本和数据更新、访问的频率选择最优的存储策略,即直接存储或增量存储; 13经过策略决策后的数据会根据其文本、图片、视频类型的特点进行分类,然后采用相应的基于神经网络的压缩算法实现各模态数据的压缩; 14压缩后的数据会被以直接存储或增量存储的方式存储到分布式的非结构化图数据库中; 所述步骤12具体包括: 21对于来自传感器、摄像头、无人机的具有存储需求的多源数据,更新并记录这些数据的版本信息; 22计算该版本数据采用直接存储和增量存储的存储空间成本,存储空间成本是存储该版本数据所需的存储空间的开销,直接存储策略的存储空间成本即该版本数据的存储空间大小,增量存储策略的存储空间成本需要计算新旧版本间差异集中所有差异的存储空间大小,其中差异集通过新版本与新旧版本交集进行差集计算得到; 23计算该版本数据采用直接存储和增量存储的检索时间成本,检索时间成本是从存储系统中获取所需版本完整数据所消耗的时间成本,直接存储策略的检索时间成本是查找到该版本数据所消耗的时间,在图数据库中即直接搜索节点所消耗的时间,增量存储策略的检索需要先搜索到上一版本数据的节点,再通过上一版本数据节点的增量属性获得新版本的完整数据,因此增量存储的检索时间成本就是这两个过程所消耗的时间之和; 24计算该版本数据采用直接存储和增量存储的CPU资源消耗成本,CPU资源消耗成本即存储该版本的数据所消耗的CPU资源,直接存储策略的CPU资源消耗成本是完成数据存储过程中读写、复制操作所需的时间与平均CPU使用率之积,增量存储的CPU资源消耗成本是完成增量差异数据的检测、计算、合并操作所需要的时间与平均CPU使用率之积; 25计算该版本数据采用直接存储和增量存储的网络资源消耗成本,网络资源消耗成本即存储该版本的数据所消耗的网络带宽资源,直接存储策略的网络资源消耗成本是存储过程中传输的完整数据量与网络可用带宽之商,增量存储策略的网络资源消耗成本是存储过程中传输的差异数据量与网路可用带宽之商; 26计算该版本数据采用直接存储和增量存储的总成本,两种存储策略的总成本计算方式均为存储空间成本、检索时间成本、CPU资源消耗成本、网络资源消耗成本的加权之和,四种成本的权重因子之和为1, 27计算版本更新频率,即每个版本数据被更新的频率,其计算方式是在某个时间区间内数据被更新的次数与时间差之商,设定一个版本更新频率阈值; 28计算版本访问频率,即每个版本数据被访问的频率,其计算方式是在某个时间区间内数据被访问的次数与时间差之商,设定一个版本访问频率阈值; 29综合考虑直接存储和增量存储的总成本、版本更新频率、版本访问频率因素,对数据版本存储策略进行决策,选取最优的存储方式,具体地,若直接存储的总成本大于增量存储的总成本、数据更新频率小于其阈值且数据访问频率也小于其阈值,则选择增量存储策略,相反地,若直接存储的总成本小于等于增量存储的总成本、数据更新频率大于其阈值或数据访问频率大于其阈值,则选择直接存储策略; 210执行多版本数据存储策略的结果,若该数据版本选择直接存储策略,则将完整的数据版本直接存入数据库,而不进行差异或增量处理,在图数据库中即在旧版本数据节点上创建一个子节点存储新版本的完整数据,若该数据版本选择增量存储策略,则仅存储相邻版本之间的差异或变化,在图数据库中即在旧版本的数据节点上添加一个增量属性,存储相邻版本之间的差异。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学;南京市公安局,其通讯地址为:211102 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。