我的位置: 上观号 > 上海经信委 > 文章详情

阶跃星辰发布多模态推理模型,瞄准Agent再进一步|上海新“模”样

转自:上海经信委 2025-04-09 20:38:19

资料来源:阶跃星辰

4月8日,阶跃星辰发布全新多模态推理模型Step-R1-V-Mini。这款模型支持图文输入,文字输出,有良好的指令遵循和通用能力,能够高精度感知图像并完成复杂推理任务。目前,用户已经可以在阶跃AI网页端体验Step-R1-V-Mini ,且阶跃星辰开放平台已面向开发者推出该模型的API接口。

根据阶跃星辰介绍,Step-R1-V-Mini 具有超强的感知能力和推理能力,能精准捕捉画面中的各种细节,并基于用户指令进行深度推理,用户也可以清晰地看到Step-R1-V-Mini 的思维链路。比如上传一张家常菜照片并询问菜品做法,模型可以清晰地识别出加工前使用的菜品、蘸料,并给出细致到“虾仁 300g、大葱白 2 根”的操作方式。

Step-R1-V-Mini 的模型性能在多个公开基准评测榜单中表现亮眼,在MathVision 等视觉推理榜单中位列国内第一,在视觉推理、数学逻辑和代码等方面表现优异。

公开资料显示,此前阶跃星辰已先后推出多模态理解模型 Step-1V、Step-1.5V,以及语言推理模型 Step-R-mini。在LMSYS、OpenCompass等国内外权威基准评测榜上,阶跃星辰多模态理解模型性能持续领先。此前,阶跃星辰创始人、CEO姜大昕曾表示多模态和推理是Agent两大必备要素,2025年该公司将重点发力智能终端Agent。Step-R1-V-Mini 的推出被认为是阶跃星辰今年推进战略主线的最新进展。

欢迎转发,但请注明出处“上海经信委”

觉得不错请点赞!