浙江大学高端装备研究院王嘉杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学高端装备研究院申请的专利一种基于大模型生成问答的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119721237B 。
龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411699739.6,技术领域涉及:G06N5/04;该发明授权一种基于大模型生成问答的方法是由王嘉杰;白洁;谢海波;杨华勇;王慧霞;朱茗西;胡嘉彦;李泳彤;刘珂设计研发完成,并于2024-11-26向国家知识产权局提交的专利申请。
本一种基于大模型生成问答的方法在说明书摘要公布了:本发明公开一种基于大模型生成问答的方法,本发明首先对大模型进行预训练,然后通过构建微调样本,优化数据组合方式,采用参数微调技术对预训练后的模型进行微调,最终得到的大模型能够生成稳定的问答。本发明能够实现在资源受限的情况下,高效地训练出问答领域大模型,实现高质量输出。
本发明授权一种基于大模型生成问答的方法在权利要求书中公布了:1.一种基于大模型生成问答的方法,其特征在于,该方法包括如下步骤: 步骤一:构建预训练数据集; 收集与目标问答领域相关的大规模高质量数据,并对数据进行预处理,确保数据质量;并采用数据增强技术,增加数据多样性,从而构建预训练数据集; 步骤二:选择并利用所述预训练数据集训练适合目标问答领域的预训练大模型,所述预训练大模型为基于Transformer的模型结构,包括输入层、多个隐藏层和输出层;所述输入层用于接收原始输入数据,并将其转换为大模型能够理解的数值向量;所述隐藏层包含多个注意力头,每个注意力头负责关注输入序列的不同部分;这些注意力头的输出通过拼接的方式被合并,传递给一个前馈神经网络,进一步提取和转换特征;所述输出层用于将所述隐藏层的输出转换为最终的任务结果; 步骤三:构造微调样本; 收集包含目标问答领域专业知识的电子文件和知识图谱,提取其中的专业知识,并对提取的内容进行格式标准化处理;然后对标准化处理后的文本内容采用自然语言处理技术,识别其中的关键信息和概念;再进行数据清洗,去除无关或冗余的信息,保留对大模型学习有用的数据;最后根据分析和清洗的结果,构建适合模型学习的语料库;对构建的语料库进行优化,优化措施包括样本平衡、特征选择,并根据目标问答领域的特点进行样本加权,确保大模型训练贴近实际应用场景; 步骤四:通过数据整合、特征工程、数据降维、数据平衡和数据融合,优化不同数据源或数据集之间的组合方式; 步骤五:采用参数微调技术LoRA或Q-LoRA,通过引入低秩结构来更新步骤二预训练后的模型的权重矩阵,并用更新后的模型的权重生成问答。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学高端装备研究院,其通讯地址为:311106 浙江省杭州市余杭区兴国路503号5幢103室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励