斗鱼体育 阶跃星辰开源Step 3.7 Flash大模子 ,鼓励Agent向企业分娩级演进

发布时间:2026-05-30 浏览次数:101 来源:未知 作者:admin

斗鱼体育 阶跃星辰开源Step 3.7 Flash大模子 ,鼓励Agent向企业分娩级演进

5月29日,基础大模子创业公司阶跃星辰负责发布并开源Step 3.7 Flash模子。这款面向分娩级Agent场景谋划的Flash模子,采取寥落夹杂大家架构,总参数为1960亿,配备18.8亿参数的视觉编码器ViT,激活参数仅为110亿,最高生成速率可达每秒400个Token。

模子赈济25.6万Token险峻文长度,提供三种推理层级,主要面向高频、多轮、低蔓延的智能体诈骗场景。

与本年2月开源的Step 3.5 Flash比拟,3.7版块在Agent才调上进行了系统性强化。模子要点优化了四个要津才调:原生多模态交融与奉行、联网与视觉搜索增强、高可靠器用调用与编排以及Agent生态兼容性。

Step 3.7 Flash大要平直处置UI界面、图表、文档、图片以及种种诈骗界面,将复杂视觉信息滚动为结构化成果和可奉行任务,并在信息不细则时主动发起搜索进行交叉考据。器用调用方面,模子可在长程多轮使命流中舒适调用API、浏览器、末端、Office等外部系统。

基准测试方面,Step 3.7 Flash在ClawEval 1.1自主任务奉行评测中得分67.1%,在检会多器用协同的Toolathlon上得分49.5%,在横跨44种奇迹的GDPval上得分45.8%,PG电子(PocketGames)游戏官网在τ²-bench Telecom全难度通讯任务测试中通过率均超越98%。

在代码与工程才调上,模子在SimpleVQA Search视觉问答任务中得分79.2%,在V* Python视觉编程任务中得分95.3%,在SWE-Bench Pro软件工程评测中得分56.3%,位列环球第二。

需细心的是,这些数据均由阶跃星辰官方败露,尚未过程孤苦第三方机构横向考据。

Z6尊龙凯时2026世界杯推荐官网

开源生态方面,Step 3.7 Flash采取Apache 2.0开源公约,斗鱼体育中国官网已在Hugging Face和ModelScope平台上线,权重和代码均可平直下载。

模子对Claude Code、OpenClaw、KiloCode、RooCode、Hermes Agent等主流迷惑框架和器用调用公约进行了兼容优化,同期赈济云霄与腹地部署。

在硬件适配层面,该模子可在Mac Studio M4 Max、DGX Spark以及AMD AI Max+395等腹地设置上运转。

现时开源大模子界限竞争样貌已较为强烈。2026年4月,DeepSeek发布了V4系列,包含旗舰版V4-Pro与轻量版V4-Flash,总参数差别达到1.6万亿和2840亿,均赈济百万Token险峻文,采取MIT开源公约。

2月,阿里开源了Qwen3.5-Plus,总参数3970亿,激活170亿参数,部署显存占用较前代裁汰60%。4月,腾讯混元发布Hy3 preview并同步开源,同期还有月之暗面Kimi K2.6和智谱GLM-5.1接踵发布。

Step 3.7 Flash在参数范围上处于竞品序列的中等水平,其中枢互异在于明确聚焦Agent场景的工程化优化而非纯参数竞赛。模子在器用调用和任务奉行方面的针对性谋划,使其在特定Agent使命流中具备互异化竞争力,但在通用推理才和洽极致性能上尚需更多第三方评检修证。

从行业趋势看,国产大模子开源已造成密集迭代态势。齐全2025年12月,国产开源大模子环球累计下载量打破100亿次。斯坦福大学2026年3月发布的AI指数论述线路,先进闭源模子的全体发达仅比顶尖开源模子最初3.3个百分点。

OpenRouter平台的用户数据线路,Step 3.5 Flash上线一个月后曾登顶该平台OpenClaw调用量月榜环球第一,讲明商场对高效Agent模子存在信得过需求。

Step 3.7 Flash能否接续这一趋势,将取决于其在施行部署中的舒适性、社区汲取速率以及后续第三方孤苦评测的反映。