哈尔滨工业大学赵森栋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利一种基于大语言模型的医学问答系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119493848B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411647399.2,技术领域涉及:G06F16/3329;该发明授权一种基于大语言模型的医学问答系统是由赵森栋;王昊淳;刘佳彤;强泽文;李子健;秦兵;刘挺设计研发完成,并于2024-11-18向国家知识产权局提交的专利申请。
本一种基于大语言模型的医学问答系统在说明书摘要公布了:一种基于大语言模型的医学问答系统,本发明属于计算机领域人工智能中大语言模型领域,具体涉及基于大语言模型的医学问答系统。本发明的目的是为了解决通用大语言模型在医学领域上回答准确性低,解决医学问题能力差的问题。系统包括:大语言基座模块用于选取一个通用领域的开源大语言模型作为基座模型;知识实例采样模块用于从知识图谱中采样知识实例;问答数据生成模块用于使用大语言基座模型根据知识实例生成问答数据;大语言基座模型微调模块用于使用生成的问答数据对大语言基座模型进行微调,获得微调好的大语言基座模型;回复生成模块用于基于微调好的大语言基座模型对待处理医学知识问题进行回答。
本发明授权一种基于大语言模型的医学问答系统在权利要求书中公布了:1.一种基于大语言模型的医学问答系统,其特征在于:所述系统包括:大语言基座模块、知识实例采样模块、问答数据生成模块、大语言基座模型微调模块和回复生成模块; 所述大语言基座模块用于选取一个通用领域的开源大语言模型作为基座模型; 所述知识实例采样模块用于从知识图谱中采样知识实例; 所述问答数据生成模块用于使用大语言基座模型根据知识实例生成问答数据; 所述大语言基座模型微调模块用于使用生成的问答数据对大语言基座模型进行微调,获得微调好的大语言基座模型; 所述回复生成模块用于基于微调好的大语言基座模型对待处理医学知识问题进行回答; 所述问答数据生成模块用于使用大语言基座模型根据知识实例生成问答数据;具体过程为: 从医学知识图谱CMeKG中随机采样知识实例; 每个知识实例为一种疾病及对应的知识、一种药物及对应的知识、一种症状及对应的知识中的一组; 每个知识实例的格式如下: Type: Knowledge: Type字段记录知识实例类型; Knowledge字段记录知识实例内容; 所述知识实例采样模块用于从知识图谱中采样知识实例;具体过程为: 三一、对从医学知识图谱CMeKG中随机采样的知识实例进行分类,获得知识实例的类型;具体过程为: 根据随机采样的知识实例中的Type字段确定随机采样的知识实例的类型; 三二、针对不同的知识实例的类型编写问题模版; 三三、根据问题模版编写prompt,通过OpenAIAPI生成单类型问答数据; 三四、整合单类型知识实例,得到级联类型实例,根据级联类型编写prompt,通过OpenAIAPI生成级联类型问答数据; 所述三二中针对不同的知识实例的类型编写问题模版;具体过程为: 针对“Type”为“疾病”的类型,编写的问题模版; 针对“Type”为“药物”的类型,编写的问题模版; 针对“Type”为“症状”的类型,编写的问题模版; 所述三三中根据问题模版编写prompt,通过OpenAIAPI生成单类型问答数据;具体过程为: 三三一、根据每个问题模版编写提示prompt; 三三二、使用OpenAIAPI中的ChatGPTAPI,将每个提示prompt输入ChatGPTAPI中,从ChatGPTAPI返回值中取得对应的问答数据;具体过程为: 从ChatGPTAPI返回的chat_completion对象中提取choices[0].message.content字段; choices[0].message.content字段中记录的内容的格式为: question: answer: 所述三三二中使用OpenAIAPI中的ChatGPTAPI的具体过程为: 注册OpenAI账号,创建ChatGPTAPI密钥,通过Python客户端加载openai库,将获取的ChatGPTAPI密钥配置到代码openai.api_key参数中,将GPT3.5的版本名称配置到model参数中; 所述三四中整合单类型知识实例,得到级联类型实例,根据级联类型编写prompt,通过OpenAIAPI生成级联类型问答数据;具体过程为: 三四一、将医学知识图谱CMeKG中采样的相关联的知识实例进行组合,组合后类型为疾病-药物、疾病-症状或疾病-药物-症状; 三四二、 1、针对疾病-药物组合;具体过程为: 11、当类型为疾病-药物组合时,提取疾病的“knowledge”字段的内容; 获取“knowledge”字段中键“中心词”的值value1; 所述疾病的“knowledge”字段的内容以字典形式存储; 12、将药物的“knowledge”字段中的每个键值与value1进行匹配; 若匹配成功则将药物对应的“knowledge”字段中键值加入疾病的“knowledge”字段的内容中,获得新的疾病-药物组合; 若匹配失败则不处理; 13、重复执行12直至遍历完药物的“knowledge”字段中的所有键值,判断是否存在匹配成功; 若存在获得最终的新的疾病-药物组合; 若不存在,执行14; 14、基于同义词库获得value1的同义词列表,将同义词列表中的同义词赋值给value1,重复12,直至匹配成功,获得新的疾病-药物组合,结束;若无匹配成功,则放弃疾病-药物的组合; 2、针对疾病-症状组合;具体过程为: 21、当类型为疾病-症状组合时,提取疾病的“knowledge”字段的内容; 获取“knowledge”字段中键“中心词”的值value1; 所述疾病的“knowledge”字段的内容以字典形式存储; 22、将症状的“knowledge”字段中的每个键值与value1进行匹配; 若匹配成功则将症状对应的“knowledge”字段中键值加入疾病的“knowledge”字段的内容中,获得新的疾病-症状组合; 若匹配失败则不处理; 23、重复执行22直至遍历完症状的“knowledge”字段中的所有键值,判断是否存在匹配成功; 若存在获得最终的新的疾病-症状组合; 若不存在,执行24; 24、基于同义词库获得value1的同义词列表,将同义词列表中的同义词赋值给value1,重复22,直至匹配成功,获得新的疾病-症状组合,结束;若无匹配成功,则放弃疾病-症状的组合; 三四三、针对疾病-药物-症状组合;具体过程为: 1、将14获得的新的疾病-药物组合作为类型一,将症状作为类型二; 2、提取类型一的“knowledge”字段的内容;类型一“knowledge”字段的内容以字典列表形式存储;选取列表中第一个元素中键“中心词”的值value1; 所述元素为字典; 3、将类型二的“knowledge”字段中的每个键值与value1进行匹配; 若匹配成功则将类型二对应的“knowledge”字段中键值加入类型一的“knowledge”字段的内容中,获得新的类型一-类型二组合; 若匹配失败则不处理; 4、重复执行3直至遍历完类型二的“knowledge”字段中的所有键值,判断是否存在匹配成功; 若存在获得最终的新的类型一-类型二组合; 若不存在,执行5; 5、基于同义词库获得value1的同义词列表,将同义词列表中的同义词赋值给value1,重复3,直至匹配成功,获得新的类型一-类型二组组合,结束;若无匹配成功,则放弃类型一-类型二组的组合; 三四四、为疾病-症状、疾病-药物或疾病-药物-症状编写问题模板; 三四五、根据每个问题模版编写提示prompt; 三四六、使用OpenAIAPI中的ChatGPTAPI,将每个提示prompt输入ChatGPTAPI中,从ChatGPTAPI返回值中取得对应的问答数据; 所述三四六中使用OpenAIAPI中的ChatGPTAPI,将每个提示prompt输入ChatGPTAPI中,从ChatGPTAPI返回值中取得对应的问答数据; 具体过程为: 从ChatGPTAPI返回的chat_completion对象中提取choices[0].message.content字段; choices[0].message.content字段中记录的内容的格式为: question: answer: 所述使用OpenAIAPI中的ChatGPTAPI的具体过程为: 注册OpenAI账号,创建ChatGPTAPI密钥,通过Python客户端加载openai库,将获取的ChatGPTAPI密钥配置到代码openai.api_key参数中,将GPT3.5的版本名称配置到model参数中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励