康键信息技术(深圳)有限公司周尚思获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉康键信息技术(深圳)有限公司申请的专利问诊正则表达式生成方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113191141B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110482326.2,技术领域涉及:G06F40/284;该发明授权问诊正则表达式生成方法、装置、设备及存储介质是由周尚思设计研发完成,并于2021-04-30向国家知识产权局提交的专利申请。
本问诊正则表达式生成方法、装置、设备及存储介质在说明书摘要公布了:本发明涉及数据处理技术领域,公开了一种问诊正则表达式生成方法、装置、设备及存储介质。通过从采集到的标注数据中提取出病症特征,基于病症特征构建出共现矩阵,从共现矩阵中选择出组合频率较高的特征组合作为与诊断结果对应的特征组合,然后将选择出来的特征组合进行向量化处理,最后基于向量化后的特征组合生成正则表达式,通过这样的方式实现正则表达式的自动生成,其利用的疾病知识图谱模型对标注数据中进行病症特征的提取,避免了人为提取是产生的理解偏差而导致最后生成的表达式对诊断结果的识别不够精准的现象。此外,本发明还涉及区块链技术,标注数据可存储于区块链中。
本发明授权问诊正则表达式生成方法、装置、设备及存储介质在权利要求书中公布了:1.一种问诊正则表达式生成方法,其特征在于,所述问诊正则表达式生成方法包括: 获取多个问诊数据和对应的诊断结果,并基于所述诊断结果对对应的问诊数据进行标注,得到表达式生成样本集; 利用预设的疾病知识图谱识别模型,对所述表达式生成样本集中的每个样本进行病症特征的提取,生成每个样本的特征集; 根据每个样本的特征集生成共现矩阵,其中,一个诊断结果对应一个共现矩阵,并计算所述共现矩阵中各病症特征之间的组合频率; 筛选所述组合频率中满足预设值的病症特征组合进行向量化处理,并基于向量化后的特征组合生成对应的正则表达式; 所述基于所述诊断结果对对应的问诊数据进行标注,得到表达式生成样本集包括: 根据所述诊断结果,从预设的诊断标签表中查询出与所述诊断结果对应的标签; 确定与所述诊断结果对应的问诊数据,利用中文标记算法对所述问诊数据中的每个字设置上所述标签的标记,得到标记数据; 根据所述标签对所有所述标记数据进行分类,生成多个标记数据子集,其中所述分类为将所有所述标记数据中标签相同的进行合并,得到一个标记数据子集; 将多个标记数据子集生成表达式生成样本集; 所述将多个标记数据子集生成表达式生成样本集包括: 根据中文语法规则对每个标记数据子集中的标记数据进行单独分析,确定所述标记数据子集中的标记数据的主体内容和非主体内容; 利用分词工具将所述非主体内容从对应的标记数据子集中的标记数据中去除,直到所有标记数据子集中的标记数据完成去除非主体内容后,生成表达式生成样本集; 所述疾病知识图谱识别模型包括停用词识别网络和病症识别网络,所述利用预设的疾病知识图谱识别模型,对所述表达式生成样本集中的每个样本进行病症特征的提取,生成每个样本的特征集包括: 利用所述停用词识别网络对每个所述标记数据子集中的标记数据的主体内容中的每个字词进行语义的识别,并基于识别的结果筛选出无明显语义的字词进行标注,得到标注主体内容; 利用分析技术将所述标注主体内容中无明显语义的字词进行删除,得到样本分词; 通过所述病症识别网络对所述样本分词进行病症特征的识别和分割,得到所述每个样本的特征集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人康键信息技术(深圳)有限公司,其通讯地址为:518052 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励