南京大学汪亮获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京大学申请的专利基于深度学习模型的开源软件项目拉取请求预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119902745B 。
龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510005033.3,技术领域涉及:G06F8/20;该发明授权基于深度学习模型的开源软件项目拉取请求预测方法是由汪亮;吴向臣;陶先平设计研发完成,并于2025-01-02向国家知识产权局提交的专利申请。
本基于深度学习模型的开源软件项目拉取请求预测方法在说明书摘要公布了:本发明公开一种基于深度学习模型的开源软件项目拉取请求预测方法,用于识别和预测来自开源软件项目分支的潜在拉取请求贡献,包括通过对开源软件副本的提交信息进行建模,模拟真实贡献的创建过程;通过设计一种时序过滤策略对提交历史中的关键提交子集进行筛选;最后通过副本提交中的文字与代码特征构建出一种对潜在拉取请求贡献的识别框架。本发明的Early拉取请求框架具有提前、准确与可扩展的优点,能够通过提前预测提交贡献,帮助开源项目更高效地管理分支和拉取请求,优化开发流程,提升项目协作效率等。
本发明授权基于深度学习模型的开源软件项目拉取请求预测方法在权利要求书中公布了:1.一种基于深度学习模型的开源软件项目拉取请求预测方法,其特征在于:通过对开源软件中的副本修改进行统计得到规范性统计参数;使用统计参数进行统计筛选建模; 使用深度模型对开源软件的文本与代码修改信息进行深度建模; 最后综合使用统计筛选模型与深度特征模型对开源软件中的潜在丢失贡献进行预测; 上述的方法具体包括如下步骤: 步骤1:从开源项目中获取需要的副本行为流数据,设从开源软件仓库获取得到了N个开源项目的数据,所有的开源项目的全体用集合Z表示,Z={z1,z2,…zi,…,zN},i=1,…,N,其中N为开源项目的数量,zi表示获得的数据集合中的第i个开源项目; 步骤2:获取集合Z中所有开源项目的副本工作记录,对所有的副本工作记录数据按照时间排序后存储于工作流数据库W中; 步骤3:从工作流数据库W中获取数据,对于W中的第i个项目的第j条行为流程记录wij,对每个副本修改记录进行数据清洗,去除无效或重复的拉取请求;对每个副本提交文件进行文本处理,得到副本修改序列全体的集合,称为全体副本修改序列S; 步骤4:对开源软件中的副本修改进行统计得到规范性统计参数集合P;根据参数集合P,设定拉取跳跃比例和拉取提交比例的阈值,从而筛选出符合条件的副本修改;选择统计筛选方法,建立统计筛选模型TF,并利用筛选模型将全体副本修改序列S作为输入进行潜在提交集合的提取; 步骤5:通过深度模型对开源软件的文本与代码修改信息进行建模,模型称为深度特征模型M;首先,从版本控制系统中收集相关的文本和代码修改数据,包括提交信息Message和代码差异CodeDiff数据;接着,提取文本特征和代码特征,并将它们结合形成综合特征集;通过给定的一组特征集合,设计出符合其特征性质的一组基于卷积网络的识别模块; 步骤6:将统计筛选模型TF与训练好的深度特征模型应用于实际的开源项目中,进行基于代码修改和提交文字进行拉取请求的预测,并收集反馈信息以不断迭代改进模型的性能和适用性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210023 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励