AI 日报｜2026-04-29

Main Brief

当日重点整理

01 模型

小米开源MiMo-V2.5-Pro双模型，编码榜单超越Opus 4.5跻身前十

小米正式开源MiMo-V2.5-Pro系列双模型，在Code Arena编码榜单上超越Opus 4.5排名第9，同时提供百万亿token训练数据和Agent框架。该模型采用MIT许可，Pro版本在文本竞技场排名开源第2、视觉竞技场排名开源第7。此前MiMo-V2.5基础版已在前端设计榜单位列第11（开源第3），显示小米在开源大模型赛道的竞争力正快速提升。 From ↗

02 模型

DeepSeek V4预览版开源，自称接近闭源顶尖模型水平

DeepSeek发布V4预览版并同步开源，技术报告称其性能接近当前闭源顶尖模型，被官方定位为“最强开源模型之一”。该模型专注于高效百万token上下文处理能力。同日DeepSeek宣布V4-Pro折扣延长至5月31日，Orange AI也在ColaOS中限时免费开放DeepSeek V4使用。DeepSeek连续两日密集动作（含多模态内测），显示出其加速追赶闭源模型的明确节奏。 From ↗

03 产业

OpenAI与微软解除云合作独家限制，知识产权转为非独家

OpenAI与微软完成合作协议重大修订：解除Azure云服务独家限制，知识产权从独家授权转为非独家，同时重新划分收入分成比例。这一结构性变动意味着OpenAI未来可在多个云平台上部署模型，而微软对OpenAI技术的独占性被打破。这是AI行业最大合作关系的一次根本性重组，将直接影响云AI服务的竞争格局。 From ↗

04 模型

DeepSeek开启多模态内测，视觉能力已可识别图像

DeepSeek正式开启多模态能力内测，当前版本已支持图像识别功能。此前社区已有预告讨论，但官方首次确认内测可用。多模态能力的加入将显著提升DeepSeek在Agent执行链路中的实用性——视觉理解是AI代理与真实世界交互的关键能力。同日社区还热议了DeepSeek即将推出完整视觉/多模态模型的预告，显示DeepSeek正从纯文本向多模态全面扩展。 From ↗

05 模型

NVIDIA发布Nemotron 3 Nano Omni：30B参数MoE多模态模型，本地25GB显存可跑

NVIDIA推出Nemotron 3 Nano Omni，采用30B参数MoE架构，支持图像输入、推理和工具调用，本地运行仅需约25GB显存。该模型已在LM Studio、Fireworks AI和Amazon SageMaker上线，NVIDIA NIM API提供免费测试。同日NVIDIA还发布了专注推理任务的Nemotron-3-Nano-Omni-30B-A3B-Reasoning变体。MoE架构在保持多模态能力的同时大幅降低部署门槛，对本地部署用户尤为友好。 From ↗

06 产品

百度发布GenFlow 4.0，全面集成Office三件套实现自动化办公

百度正式发布GenFlow 4.0版本，核心亮点是全面集成Office三件套（文档、表格、演示），主打AI驱动的自动化办公效率提升。该产品定位为一站式AI办公平台，将大模型能力深度嵌入日常办公场景。在国内大厂竞相布局AI办公的背景下，百度此举是对标微软Copilot和谷歌Workspace AI的直接回应。 From ↗