近日,上海财经大学统计与数据科学学院教授张立文与其领衔的金融大语言模型课题组(SUFE-AIFLM-Lab)联合财跃星辰、数据科学和统计研究院、滴水湖高级金融学院正式发布首款DeepSeek-R1类推理型人工智能金融大模型:Fin-R1,以仅7B的轻量化参数规模展现出卓越性能。Fin-R1基于Qwen2.5-7B-Instruct模型开发,通过构建高质量金融推理数据集与两阶段混合框架训练,实现了金融推理的逻辑闭环,其技术创新表明高校在垂直领域大模型研发中实现了从技术突破到产业落地的闭环,标志着高校在金融科技领域的自主创新迈入新高度。
Github 地址:https://github.com/SUFE-AIFLM-Lab/Fin-R1
技术报告:https://arxiv.org/abs/2503.16252
模型地址:https://huggingface.co/SUFE-AIFLM-Lab/Fin-R1
简介
为此,我校团队从多个权威数据源蒸馏并筛选出约 60k 条面向金融专业场景的高质量 COT 数据集 Fin-R1-Data,该数据集涵盖中英文金融垂直领域的多维度专业知识并根据具体任务内容将其分为金融代码、金融专业知识、金融非推理类业务知识和金融推理类业务知识四大模块,可有效支撑银行、证券以及信托等多个金融核心业务场景。在 Fin-R1-Data 数据的基础上以 Qwen2.5-7B-Instruct 为基座进行指令微调 (SFT) 预热和强化学习 (RL) 训练得到金融推理大模型 Fin-R1。通过构建金融高质量 CoT 数据集与结合指令微调(SFT)和强化学习(RL)进行训练的两阶段工作框架为模型在金融领域的应用提供了坚实的理论支撑、决策逻辑以及技术实现能力,同时能有效提升模型的金融复杂推理能力和泛化能力,使模型在金融推理任务中展现出卓越性能。
图 1 Fin-R1 应用场景示例
Fin-R1 的总体工作流程如下:首先通过构建 60k 规模的金融推理数据集 Fin-R1-Data,帮助模型重构知识体系,然后采用 "两步骤训练框架" 塑造模型认知和推理能力,最后在多个金融基准测试上验证模型的性能突破,实现了从 “数据构建 - 模型训练 - 性能验证 - 模型部署 - 场景应用” 的完整技术闭环。
图 2 Fin-R1 总体工作流程
场景应用
强大的多场景适配能力
数据构建
破解知识碎片难题
传统的金融数据分散、标注成本高,而且缺乏对复杂推理逻辑的针对性设计,导致模型难以适配金融业务场景,为将 DeepSeek-R1 的推理能力迁移至金融场景并解决高质量金融推理数据问题,用 Deepseek - R1(满血版)针对涵盖行业语料(FinCorpus、Ant_Finance),专业认知(FinPEE),业务知识(FinCUGE、FinanceIQ、Finance-Instruct-500K),表格解析(FinQA),市场洞察(TFNS),多轮交互(ConvFinQA)以及量化投资(FinanceQT)的多个数据集进行领域知识蒸馏筛选,构建了约 60k 条面向专业金融推理场景的高质量 COT 数据集 Fin-R1-Data 。
性能验证
专业场景性能超越,验证技术闭环价值
Fin-R1 的评测表现不仅反映出模型在投顾服务、投资者会议等多轮交互场景中具有长对话跟踪能力,能避免传统模型常见的上下文遗忘或逻辑跳跃问题并生成逻辑连贯的渐进式建议,同时展现出模型在处理财务报表重组、财务比率交叉验证时的强大数值推理能力。精准覆盖金融行业对可解释性、合规性、数值严谨性的核心诉求。
模型部署
Fin-R1 从训练框架到模型权重均开源,计算资源需求量小,个人电脑即可部署,更加适用于金融场景,并且通过两阶段训练框架,解决了金融数据碎片化和推理逻辑不可控等问题,在各大金融基准测试中表现卓越,展现出强大的推理能力和业务泛化能力,为金融智能化发展提供了有力支持。
来源 | 统计与数据科学学院
编辑 | 烟文雪 校对|李京烁