Main Brief

当日重点整理

01 产品

Google AI Studio上线全栈Vibe Coding开发环境,集成代理协作与安全存储

Google AI在AI Studio中推出全新的全栈"氛围编码"(Vibe Coding)体验,将代理式开发、多人协作构建、安全登录与存储以及外部服务连接整合为一体化环境。这一更新使AI Studio从单纯的模型调试工具升级为完整的应用开发平台,开发者可以在同一界面内完成从原型到部署的全流程,标志着AI开发工具正在向"全栈IDE"方向快速演进。 From ↗

02 研究

陈天桥团队发布MiroThinker-H1,BrowseComp深度研究跑出88.2分新SOTA

陈天桥团队推出MiroThinker-H1模型,主打长视野推理与深度多步分析能力,在BrowseComp基准测试中以88.2分刷新SOTA纪录。该模型通过划分episode控制研究阶段、将失败重试限制在episode内的架构设计,为长链Agent开发提供了新思路。开发者karminski-牙医随即将其封装为OpenClaw SKILL插件,使社区用户可直接调用该模型进行深度研究任务。 From ↗

03 产品

Cursor Composer 2上线,底层模型换装月之暗面Kimi-k2.5

Cursor正式发布Composer 2,其核心底层模型已切换为月之暗面的Kimi-k2.5。Cursor通过对Kimi-k2.5进行持续预训练和高算力强化学习训练来适配自身产品需求,展示了开放模型生态在商业产品中的深度集成路径。这是中国开源模型首次成为全球头部AI编码工具的核心引擎,标志着开放模型生态的商业化进入新阶段。 From ↗

04 工具

英伟达发布SOL-ExecBench基准,用"光速分数"量化GPU实际算力余量

英伟达推出SOL-ExecBench基准测试工具,将GPU的实际执行性能转化为直观的"光速"百分比分数,帮助开发者评估硬件在真实工作负载下的性能余量。该工具填补了AI硬件性能评估中"理论峰值"与"实际可用"之间的量化空白,为优化模型部署和硬件选型提供了标准化参考框架。 From ↗

05 产品

Devin上线自动化任务调度,AI智能体支持定时工作流编排

Cognition Labs为其AI编程智能体Devin新增任务调度功能,用户可以创建自动化工作流并设定执行时间,实现从即时交互到定时编排的跨越。该功能已面向所有用户开放,官方同步提供了示例提示词供参考。这意味着AI智能体正从"随叫随到"的被动模式向"主动执行"的自治模式演进,是Agent能力边界的重要扩展。 From ↗

06 模型

小米MiMo V2 Pro冲入竞技场前10,代码与专家赛道双双表现突出

小米自研大模型MiMo V2 Pro在Arena平台的多项排名中表现亮眼:Code Arena排名第13位,Arena Expert排名第10位,代码生成和专家级推理两项核心能力均跻身全球前列。这是小米大模型首次在国际主流竞技场榜单中进入前十,表明国内硬件厂商的AI模型研发已具备与专业AI公司同台竞技的实力。 From ↗