Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及处理自然语言数据技术领域,提供了一种针对中文医疗实体识别的继续预训练方法,包括以下步骤:S1.分词标注:对医疗专业文本数据源进行文本清洗及分词处理,并对专有名词和术语进行标注;S2.插入分界标志:在句子中分词的词间位置插入分界标记...
  • 本发明涉及互联网金融与大数据处理技术领域,具体为一种基于大数据的互联网金融新实体识别方法及系统,包括以下步骤:获取多源互联网金融数据,包括新闻文本、社交平台评论、监管政策文档及交易流水数据;对获取的数据进行预处理之后通过NLP技术进行分词、...
  • 本发明涉及数据分析技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了一种基于大语言模型的分层对比解码方法、装置、设备及介质,所述方法包括:利用词元分类规律对目标输入文本的词元进行分类与标注,并对标注词元进行原始路径解码,得到下一个...
  • 本申请涉及一种AI生成文本识别方法、计算机设备及可读存储介质,方法包括:提取待检测文本关键词,计算文本中词语的权重值并筛选关键词;构建领域本体概念向量空间:以关键词为中心,通过滑动窗口算法获取其属性词集合,计算各属性词的三维特征向量,包括以...
  • 本发明属于文本处理领域,具体是公开了一种基于人工智能的中文大数转阿拉伯数字计算方法,方法包括:收集中文文本信息、提取中文大数分词和中文大数转换。本发明通过预训练的BERT模型捕捉汉字深层关联,结合长短期记忆网络捕捉长距离依赖,并在条件随机场...
  • 本发明公开了基于Longformer和Long‑CLIP模型的文档智能分段方法,涉及文档智能分段技术领域,本发明结合大语言模型和多模态模型,深入理解文档的文本语义与图像信息,实现基于内容语义的精准分块,避免对文档逻辑的割裂,确保分块在形式与...
  • 本公开涉及数据分析技术领域,尤其是提供一种信息分析的系统、方法、电子设备。系统包括:对待分析信息语料进行分词处理,得到目标分词,并对目标分词进行向量化处理,得到各目标分词对应的目标向量;通过跳字模型算法对目标向量和该目标向量的上下文词向量对...
  • 本发明针对属性用词或表示形式不同导致的异构问题,提出了一种基于领域集合相似度的属性对齐方法。该方法是基于杰卡德相似度方法的思想设计的一种软权重杰卡德方法,该方法包括:针对多源异构知识库实体属性数据存在的问题进行统一处理;将预处理好的属性值用...
  • 本申请涉及数据可视化技术领域,尤其涉及一种基于煤炭开采的数据可视化处理方法和系统,获取用户于交互界面中输入的煤炭开采描述数据,并对所述煤炭开采描述数据进行分词处理,根据分词结果确定第一可视化参数类别;基于预先构建的指标库中获取所有指标,根据...
  • 本申请公开了一种文本识别方法、装置、设备及存储介质,涉及计算机技术领域。所述方法包括:获取输入文本,输入文本包括至少一个字符;对至少一个字符分别执行特征提取,得到至少一个字符分别对应的字符特征;对至少一个字符分别执行词典匹配,得到至少一个字...
  • 本申请涉及情感分析模型的技术领域,尤其涉及一种情感分析模型训练方法、装置、设备及存储介质。包括:获取训练文本及标准四元组;对标准要素实体和标准方面实体进行实体序列组合,形成多视角提示词,结合训练文本及多视角提示词形成多视角输入序列;将多视角...
  • 本发明提供一种基于动态因果求证图的自主智能体谣言核查系统,包括对从记忆模块中读取的动态因果求证图的拓扑结构进行分析,生成行动指令的规划模块;执行规划模块下达的行动指令,将非结构化的证据信息转化为对动态因果求证图的结构化操作,找到最佳求证路径...
  • 本发明涉及自然语言处理技术领域,具体为一种基于实体表示和边信息增强的事件抽取方法;所述方法包括:通过实体表示增强模块融合词性信息、序列信息和实体类型引导的注意力机制优化实体识别,采用加权交叉熵损失函数解决样本不平衡和标签转移约束;构建包含伪...
  • 本申请实施例公开了一种文本信息的安全检测方法、装置、设备及存储介质,包括:将获取到的初始测试文本信息进行语句拆分,得到多个最小语义单元,将各最小语义单元与预设测试指标进行匹配确定关键风险点;确定与关键风险点的风险类型对应的目标变异等级,根据...
  • 本公开实施例提供了一种用于文本的实体识别方法、装置、介质和设备。该方法的一具体实施方式包括:获取预先训练得到的用于识别实体的实体识别模型,其中,所述实体识别模型在训练过程中所使用的训练数据是基于语言模型得到的;基于待识别文本和所述实体识别模...
  • 本发明公开了一种基于掩码预测的短文本实体消歧方法,包括:获取待消歧短文本;对所述待消歧短文本进行处理,获取目标候选实体;构建知识库,获取所述目标候选实体在所述知识库中的目标描述信息,其中,所述目标描述信息用于作为掩码预测模型的候选项;将所述...
  • 本发明涉及数据处理领域,特别是涉及一种用户拼写错误概率预测方法、介质及设备。步骤为:先构建含用户历史拼写错误记录等内容的用户错误画像;实时监测目标字段输入行为,提取输入速度等作为行为特征向量;基于当前输入文本、错误画像及特征向量计算拼写错误...
  • 本发明公开了一种中文纠偏方法和装置。本发明包括:根据待纠偏的初始中文文本确定纠偏场景;根据对应于所述纠偏场景的中文训练文本构建语句分类数据集,采用所述语句分类数据集构建语句分类器;基于所述语句分类器构建纠偏训练模型,根据对应于所述纠偏场景的...
  • 本申请提供了描述题的智能批改方法、装置及介质。本实施例通过标准语义理解模型的倒数第二层除了连接原第一输出层之外还连接第一全连接网络,并将第一全连接网络的倒数第二层除了连接原第二输出层之外还连接输出激活方式不同于第二输出层的第三输出层,以对输...
  • 本公开提供一种文档识别方法、装置、电子设备、存储介质及程序产品。所述方法包括:获取目标文档,确定所述目标文档中的目标语言文本块数目,所述目标语言文本块包括由一种或多种语言所编辑的文本块;根据所述目标语言文本块数目,确定所述目标文档的文档类型...
技术分类