Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京大学周志华获国家专利权

南京大学周志华获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京大学申请的专利面向语言模型智能问答系统的多目标优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119323271B

龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411438427.X,技术领域涉及:G06F16/332;该发明授权面向语言模型智能问答系统的多目标优化方法是由周志华;赵鹏;马兰霁弘设计研发完成,并于2024-10-15向国家知识产权局提交的专利申请。

面向语言模型智能问答系统的多目标优化方法在说明书摘要公布了:本发明公开一种面向语言模型智能问答系统的多目标优化方法,使语言模型能够在不完备信息下,同时最大化用户体验和最小化交互次数以进行在线学习与决策任务。语言模型智能问答系统由多个语言生成模型和一个决策模型组成,语言生成模型负责生成若干个备选回答,决策模型负责选取其中两个回答作为反馈。首先设计初始策略以探索语言生成模型性能,使用用户反馈对语言生成模型进行简单排序。对于决策模型的设计,使用一种自适应于动态排序的决策方法,辅以逐对淘汰的方式,逐渐排除不符合用户需求的语言生成模型。与现有的问答模型优化技术相比,本发明不仅能够同时保证尽可能利用最符合用户需求的语言生成模型来提供答案,以最大化用户体验,还能够额外保证最小化寻得该语言生成模型所需的交互次数。

本发明授权面向语言模型智能问答系统的多目标优化方法在权利要求书中公布了:1.一种面向语言模型智能问答系统的多目标优化方法,其特征在于,所述语言模型智能问答系统包括多个语言生成模型和一个决策模型;语言生成模型负责生成备选回答,决策模型负责选择回答并返回给用户;所述多目标优化指的是最大化用户交互体验和最小化交互次数; 首先初始化语言生成模型与决策模型,当用户提问后,语言生成模型根据提问生成若干个备选回答,此过程由预训练的语言生成模型所决定;接着,决策模型做出决策,根据当前决策模型的内部状态,选择两个回答返回给用户,此过程需要应对探索未知的语言生成模型信息或利用已知的语言生成模型信息;然后,用户选择两个回答中较好的一个,根据这一反馈,决策模型更新其内部状态,此过程需要应对潜在的不准确用户反馈;最终,语言生成模型更新其备选回答集,此过程需要应对各语言生成模型的不均衡信息; 所述初始化语言生成模型与决策模型,包括: 设置语言生成模型的个数N; 初始化语言生成模型的集合则 初始化N个语言生成模型的权重向量S=0N; 初始化N个语言生成模型的资格向量Q=1N; 初始化历史反馈矩阵W=0N×N; 初始化轮数r=1; 所述决策模型做出决策,应对探索未知的语言生成模型信息或利用已知的语言生成模型信息的具体步骤为: 重复以下步骤,直到 选择第一个满足条件的语言生成模型:记该语言生成模型的序号为i,决策模型选择权重Si0且资格Qi=1的某个语言生成模型,若没有符合条件的模型则从集合中随机选择一个; 计算除i以外集合中的语言生成模型的历史信息其中k=1,…,i-1,i+1,…,N,WM,k表示所有历史反馈中,用户反馈模型m比模型k好的总次数和; 以概率采样得到一个语言生成模型,其中k=1,…,i-1,i+1,…,N,记该语言生成模型的序号为j,其对应回答作为第二个回答; 决策模型更新其内部状态,应对潜在的不准确用户反馈的具体步骤为: 重复进行以下步骤,直到语言生成模型i和语言生成模型j中某个语言生成模型的权重S为-r: 用户提出问题; 向用户返回编号为i和j的两个语言生成模型所生成的回答; 若用户反馈模型i的回答比模型j好,则Wi,j=Wi,j+1,Si=Si+1,Sj=Sj-1;否则Wj,i=Wj,i+1,Si=Si-1,Sj=Sj+1。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210023 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。