广东职业技术学院郑波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东职业技术学院申请的专利一种校园数据采集方法、装置、存储介质及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114328394B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111676283.8,技术领域涉及:G06F16/13;该发明授权一种校园数据采集方法、装置、存储介质及设备是由郑波;古发辉;张宏仁;黄碧峰;彭丽设计研发完成,并于2021-12-31向国家知识产权局提交的专利申请。
本一种校园数据采集方法、装置、存储介质及设备在说明书摘要公布了:本发明提供了一种校园数据采集方法、装置、存储介质及设备;其中方法为:客户端根据待上传附件文件数据生成文件著录信息;服务器将文件著录信息写入到待写入序列中;构成预处理序列;服务器将预处理序列分割为多个子文件,存储到数据库中;客户端将待上传附件文件数据分割为多个子文件并生成索引表,对客户端的各个子文件进行归并分割操作并生成待上传附件文件数据的索引表;客户端将索引表和索引表对应的各个子文件依次上传到数据库进行存储。该方法可缩减客户端与服务器之间的传输数据大小,减少传输资源占用,优化了传输效率,不会长时间的占用服务器存储空间和网络信道带宽,提高了数据采集的速度。
本发明授权一种校园数据采集方法、装置、存储介质及设备在权利要求书中公布了:1.一种校园数据采集方法,其特征在于:包括以下步骤: 步骤1,客户端根据待上传附件文件数据生成文件著录信息,客户端向服务器发送文件著录信息;文件著录信息包括附件文件数据的文件头、文件名、文件编号和文件数据大小; 步骤2,服务器将客户端所上传的文件著录信息写入到待写入序列中,以所上传的文件著录信息作为当前文件著录信息;待写入序列为各个客户端上传的文件著录信息构成的队列; 步骤3,将当前文件著录信息的文件头依次与待写入序列中其余文件著录信息的文件头进行判断,将待写入序列中除当前文件著录信息外的各个与当前文件著录信息中文件头相同的文件著录信息进行提取,构成预处理序列; 步骤4,服务器将预处理序列中每个文件著录信息所对应的附件文件数据分割为多个大小为小于或等于阈值N1的子文件,得到每个附件文件数据的索引表与索引表所对应的各个子文件;服务器将每个附件文件数据的索引表与索引表所对应的各个子文件存储到数据库中;附件文件数据的索引表为附件分割后所有的子文件的文件头、文件名、文件编号、文件数据大小构成的序列表; 步骤5,客户端将待上传附件文件数据分割为多个大小为小于或等于阈值N1的子文件并生成待上传附件文件数据的索引表与索引表所对应的各个子文件,并将客户端的各个子文件与数据库中的子文件依次比对,对客户端的各个子文件进行归并分割操作并生成待上传附件文件数据的索引表; 步骤6,客户端将待上传附件文件数据的索引表和索引表对应的各个子文件依次上传到数据库进行存储; 步骤7,当客户端读取数据库中的附件文件数据时,服务器按照附件文件数据的索引表将数据库中的索引表所对应的各个文件依次进行文件合并从而得到附件文件数据; 所述步骤5中,将客户端的各个子文件与服务器的数据库中的子文件依次比对,对客户端的各个子文件进行归并分割操作并生成待上传附件文件数据的索引表的方法为: 步骤5.1,令客户端的各个子文件形成的子文件集合为G={g};i∈[1,M1],M1为客户端子文件总数;g为G中的第i个子文件;设置变量j,j∈[1,M2],M2为服务器的预处理序列中每个文件著录信息所对应的附件文件数据分割的子文件总数,设置i、j的初始值为1; 步骤5.2,计算g的哈希值为第一哈希值;计算数据库中第j个子文件的哈希值为第二哈希值; 步骤5.3,判断第一哈希值与第二哈希值是否匹配: 如果匹配,则执行步骤5.3.1:将待上传附件文件数据的索引表中g的文件头、文件名、文件编号、文件数据大小删除,并将数据库中第j个子文件的文件头、文件名、文件编号、文件数据和子文件在数据库中的位置写入待上传附件文件数据的索引表中;之后跳至步骤5.4; 如果不匹配,则执行步骤5.3.2:在数据库中搜索子文件的哈希值与第一哈希值的余弦相似度的值最大的哈希值,标记该哈希值对应的子文件为参比文件;或者是在数据库中搜索子文件的哈希值与第一哈希值之间的文件存取值最大的哈希值所对应的数据库中的子文件为参比文件; 判断N3与N2的大小,其中N2为子文件集合G中所有子文件中最小的子文件的大小,N3为参比文件的大小:若N3>N2,则将参比文件分割为第一子文件和第二子文件,第一子文件的大小为N2,第二子文件的大小为N3-N2;否则将参比文件作为第一子文件,第二子文件的大小为0; 判断N4与N2的大小,其中N4为第i个子文件gi的大小:如果N4>N2,则将第i个子文件gi分割为第三子文件和第四子文件,第三子文件的大小为N2,第四子文件的大小为N4-N2;否则将第i个子文件gi作为第三子文件,第四子文件的大小为0; 计算第一子文件的哈希值H1、第二子文件的哈希值H2、第三子文件的哈希值H3和第四子文件的哈希值H4; 判断哈希值H1与H3的大小:若H1与H3相等,则将第i个子文件gi从子文件集合G中删除,并将待上传附件文件数据的索引表中第i个子文件gi的文件头、文件名、文件编号和文件数据大小删除,并在数据库中将参比文件删除,将第一子文件、第二子文件存储在数据库中,将第四子文件和数据库中第一子文件的文件头、文件名、文件编号、文件数据和子文件在数据库中的位置写入待上传附件文件数据的索引表中,将第四子文件加入到子文件集合G中; 否则判断哈希值H2与H4的大小:若H2与H4相等,则将第i个子文件gi从子文件集合G中删除,并将待上传附件文件数据的索引表中第i个子文件gi的文件头、文件名、文件编号和文件数据大小删除,并在数据库中将参比文件删除,将第一子文件、第二子文件存储在数据库中,将第三子文件和数据库中第二子文件的文件头、文件名、文件编号、文件数据和子文件在数据库中的位置写入待上传附件文件数据的索引表中,将第三子文件加入到子文件集合G中; 步骤5.4,如果j≤M2则令j的值增加1并转到步骤5.2,如果j>M2则将j的值设置为1并转到步骤5.5; 步骤5.5,如果i≤M1则令i的值增加1并转到步骤5.2,如果i>M1则得到待上传附件文件数据的索引表,并以子文件集合G作为待上传附件文件数据的各个子文件。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东职业技术学院,其通讯地址为:528041 广东省佛山市禅城区澜石二路20号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
    
    
    
                        
                        
					
                
                
                            
                            
皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励