数据空间研究院王建获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉数据空间研究院申请的专利基于细分产业知识分类和开源大模型的决策辅助问答方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117313864B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311362399.3,技术领域涉及:G06N5/04;该发明授权基于细分产业知识分类和开源大模型的决策辅助问答方法是由王建;吕孝忠;王佐成;李浩;张晞曈;孙昕;赵晨;王涛设计研发完成,并于2023-10-20向国家知识产权局提交的专利申请。
本基于细分产业知识分类和开源大模型的决策辅助问答方法在说明书摘要公布了:本发明公开了一种基于细分产业知识分类和开源大模型的决策辅助问答方法,包括:1、构建产业知识分类方法;2、对多源异构数据进行分类以及分类知识向量化存储;3、分类辅助查询和知识的相似度匹配;4、将匹配的产业知识和决策辅助查询组合成prompt输入到多个开源大模型中并得到对应的决策辅助回答。本发明结合多种方法构建了细分产业知识分类方法,能利用更细粒度的产业知识来提升大模型决策辅助回答的效果,同时利用文本质量打分模型来对多个开源大模型的回答进行排序展示,充分发挥不同大模型的各自优势,从而提高决策辅助回答的合理性和准确性。
本发明授权基于细分产业知识分类和开源大模型的决策辅助问答方法在权利要求书中公布了:1.一种基于细分产业知识分类和开源大模型的决策辅助问答方法,其特征在于,是按如下步骤进行: 步骤1、利用jieba分词、Jaccard相似度和Qwen-14B-chat大模型构建细分产业知识分类策略: 步骤1.1、利用专家知识库构建细分产业链图谱,并将所述细分产业链图谱中的中文类别名及其英文简写分别加入到细分产业类别词库中,从而形成维产业标签的类别词库;其中,表示第个中文类别名或其英文简写对应的产业类别标签; 将类别词库添加到jieba分词词典中,并将各个产业标签标注为名词; 利用结构化工具对多源异构数据进行结构化,并提取标题和文本内容组成知识知识库,其中,表示第个产业知识文档,表示知识库的产业知识文档数量; 步骤1.2、使用jieba分词器对知识库中各个产业知识文档中的标题及其内容进行词性切分,得到每个产业知识文档中的若干个名词; 统计每个文档中名词的词频,构建高频无关词库; 步骤1.3、对第个产业知识文档的若干个名词中的高频无关词进行过滤,得到第个产业知识文档的知识词向量;其中,表示第r个产业知识文档的第个词,表示维度; 计算第个词与第个产业类别标签之间的Jaccard相似度,从而得到第个词与所有产业类别标签之间的Jaccard相似度; 1 根据Jaccard相似度对所有产业类别标签进行排序,并选取相似度最高的前a个产业类别标签作为选项,并与空标签一起构成选项集合; 步骤1.4、以第个产业知识文档是否属于选项集合作为分类问题C,将选项集合、第个产业知识文档和分类问题C一起构成prompt输入序列; 步骤1.5、构建Qwen-14B-Chat大模型;用于对prompt输入序列进行处理,得到第个产业知识文档的产业类别预测标签; 步骤1.6、如果和中所有词的Jaccard相似度都小于所设定的阈值,则直接将第个产业知识文档的产业类别标签标记为未知类别; 步骤1.7、按照步骤1.3-步骤1.6的过程为知识库中每个产业知识文档的产业类别标签进行打标,从而得到知识库的产业分类标签; 步骤2、对知识库进行企业标签标注; 步骤2.1、利用实体识别方法从知识库中抽取企业实体并进行对齐,从而构建企业实体库; 步骤2.2、根据企业实体库,按照步骤1.2-步骤1.7对知识库中每个产业知识文档进行打标,从而得到知识库的企业实体标签; 步骤3、分类知识向量化存储; 步骤3.1、利用文本拆分器对带有产业分类标签和企业实体标签的第个产业知识文档进行拆分,得到第个产业知识文档的知识块集合;表示第个产业知识文档中的第个知识块,表示第个产业知识文档的标签集合,;表示第个产业知识文档中知识块的总数; 步骤3.2、利用text2vec模型LERT对第个知识块进行embedding操作,得到第个知识块向量,并根据产业分类标签和企业标签将所有知识块向量分类存储到向量数据库LangChainDatabase中; 步骤4、基于分类知识构建决策辅助查询; 步骤4.1、用户从中选取待查询的细分标签以及决策辅助查询问题;并使用text2vec模型LERT对进行embedding操作后,得到查询问题向量; 步骤4.2、利用式9计算和之间的Jenson-Shannon距离; 9 式9中,表示计算和之间的平均分布,||表示相对于平均分布的散度,表示相对于平均分布的散度; 步骤4.3、将与的Jenson-Shannon距离较近的前t个知识块向量所对应的知识块作为决策辅助查询问题的相关知识; 步骤5、大模型决策建议; 将相关知识和用户决策辅助查询问题组合成新的输入序列输入Qwen-14B-Chat大模型中进行处理,得到用户决策辅助查询问题对应的辅助决策建议。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人数据空间研究院,其通讯地址为:230031 安徽省合肥市高新区创新大道288号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励