Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 三亚学院刘齐宏获国家专利权

三亚学院刘齐宏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉三亚学院申请的专利一种适用于金融大模型的文本数据预处理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121561264B

龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610077915.5,技术领域涉及:G06F18/10;该发明授权一种适用于金融大模型的文本数据预处理方法是由刘齐宏设计研发完成,并于2026-01-21向国家知识产权局提交的专利申请。

一种适用于金融大模型的文本数据预处理方法在说明书摘要公布了:本发明涉及人工智能技术领域,公开了一种适用于金融大模型的文本数据预处理方法,该方法包括:接收按时间戳排序的原始金融文本序列;进行分词与词性标注;基于滑动时间窗动态计算各文本单元的情绪波动指数;自适应设定情绪噪声判定阈值并标记候选噪声单元;通过嵌入空间余弦相似度评估语义稳定性,二次确认噪声;剔除确认噪声后,执行指代消解与逻辑衔接重构以修复上下文连贯性;输出纯净文本序列。该系统包括对应功能模块。本发明通过动态阈值与语义双重验证机制,在高噪声场景下显著提升有效信息保留率与噪声剔除准确率,保障金融大模型输入数据的质量与处理吞吐量。

本发明授权一种适用于金融大模型的文本数据预处理方法在权利要求书中公布了:1.一种适用于金融大模型的文本数据预处理方法,其特征在于,包括: 接收金融实时新闻流中的原始文本序列,所述原始文本序列由多个按时间戳排序的文本单元构成; 对所述原始文本序列进行初始分词与词性标注,生成带语法属性的词元序列; 基于所述词元序列,计算每个文本单元的情绪波动指数,包括: 从预设的金融情绪词典中匹配当前文本单元中的情绪关键词,所述金融情绪词典包含正面情绪词集与负面情绪词集,每类词项均标注有情绪强度权重; 统计当前文本单元中所有情绪关键词的情绪强度权重之和,得到原始情绪得分; 以滑动时间窗长度为30个文本单元,计算当前窗口内原始情绪得分的移动平均值作为历史基准情绪水平; 计算当前文本单元的原始情绪得分与所述历史基准情绪水平的绝对差值,并除以所述历史基准情绪水平,得到相对情绪偏差; 对所述相对情绪偏差进行指数平滑处理,得到最终的情绪波动指数; 所述情绪波动指数通过滑动时间窗内情绪词频密度变化率与历史基准情绪水平的偏差度确定; 根据所述情绪波动指数,动态设定当前时间窗的情绪噪声判定阈值,所述情绪噪声判定阈值随滑动时间窗内情绪波动指数的标准差自适应调整; 将情绪波动指数超过所述情绪噪声判定阈值的文本单元标记为候选噪声单元; 对所述候选噪声单元进行语义稳定性评估,所述语义稳定性评估通过计算该单元与其前后相邻非噪声单元在嵌入空间中的余弦相似度均值实现; 若所述余弦相似度均值低于预设的语义一致性下限,则将该候选噪声单元确认为情绪噪声并予以剔除; 对剔除情绪噪声后的文本序列进行上下文连贯性修复,所述上下文连贯性修复包括对被剔除单元前后文本边界处的指代消解与逻辑衔接重构; 输出经修复后的纯净文本序列,供金融大模型进行后续训练或推理使用。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人三亚学院,其通讯地址为:572000 海南省三亚市迎宾路落笔洞;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。