Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 合肥工业大学陈波获国家专利权

合肥工业大学陈波获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉合肥工业大学申请的专利基于BERT模型和TF-IDF加权的文本特征数据处理方法与系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119538919B

龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411612370.0,技术领域涉及:G06F40/284;该发明授权基于BERT模型和TF-IDF加权的文本特征数据处理方法与系统是由陈波;谭馨蕊设计研发完成,并于2024-11-13向国家知识产权局提交的专利申请。

基于BERT模型和TF-IDF加权的文本特征数据处理方法与系统在说明书摘要公布了:本发明属于数据智能处理技术领域,具体涉及基于BERT模型和TF‑IDF加权的文本特征数据处理方法与系统,该方法首先获取目标领域文本的待分析数据,并利用jieba库进行分词、移除停用词和统一文本格式等预处理。随后,构建效果词典,包括初始效果词词典的构建、词典扩充和人工检查与标注。在特征提取阶段,计算TF‑IDF值以评估文档中词语的重要性。创新性评分环节,通过正则表达式匹配效果词,并利用大语言模型进行二次判断,对共同效果词进行二次赋权,最终基于TF‑IDF值对目标领域文本的创新性进行评分。该方法结合了BERT模型的深度语义理解与TF‑IDF的文本统计特性,提高了目标领域文本创新性评估的准确性和效率。

本发明授权基于BERT模型和TF-IDF加权的文本特征数据处理方法与系统在权利要求书中公布了:1.基于BERT模型和TF‑IDF加权的文本特征数据处理方法,其特征在于,所述方法包括: 获取目标领域文本的待分析文本数据; 对所述待分析文本数据进行分词、移除停用词和统一文本格式的预处理,以生成待处理文本数据; 将所述待处理文本数据输入至预先构建的效果词典中进行效果词匹配和评估之后,利用大语言模型对匹配到的效果词进行二次判断和二次赋权,生成所述目标领域文本的文本特征数据处理结果; 其中,所述预先构建的效果词典包括初始效果词、共现分析得到的词语、词向量模型得到的近义词以及新标注的词语的效果词典; 所述利用大语言模型对匹配到的效果词进行二次判断和二次赋权,生成所述目标领域文本的文本特征数据处理结果,包括: 根据效果词典中的词语,构建正则表达式匹配模式,在待处理文本数据中对效果词进行定位; 将包含效果词的语句输入到大语言模型进行二次判断,得到推理效果词; 将大语言模型输出的推理效果词与通过正则表达式匹配到的效果词进行对比,对同时存在于推理结果与匹配结果的效果词进行二次赋权; 以待处理文本数据中每个词语的TF‑IDF值为基础,结合二次赋权后的效果词得分,对单个目标领域文本创新性进行评分; 所述二次赋权的得分计算方式为: 设定赋权系数,对于每个共同效果词,效果词得分计算为原TF‑IDF值乘以赋权系数; 所述对单个目标领域文本创新性进行评分具体根据以下公式计算: 文本摘要包含个效果词,目标领域文本的创新性评分为: ; 其中,是共同效果词在待分析数据中出现的次数; 是非共同效果词出现的次数;是正则表达式匹配到的效果词总数,是共同效果词的数量,是非共同效果词的数量。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥工业大学,其通讯地址为:230000 安徽省合肥市屯溪路193号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。