Main Brief

当日重点整理

01 模型

小米开源MiMo-V2.5-Pro双模型,编码榜单超越Opus 4.5跻身前十

小米正式开源MiMo-V2.5-Pro系列双模型,在Code Arena编码榜单上超越Opus 4.5排名第9,同时提供百万亿token训练数据和Agent框架。该模型采用MIT许可,Pro版本在文本竞技场排名开源第2、视觉竞技场排名开源第7。此前MiMo-V2.5基础版已在前端设计榜单位列第11(开源第3),显示小米在开源大模型赛道的竞争力正快速提升。 From ↗

02 模型

DeepSeek V4预览版开源,自称接近闭源顶尖模型水平

DeepSeek发布V4预览版并同步开源,技术报告称其性能接近当前闭源顶尖模型,被官方定位为“最强开源模型之一”。该模型专注于高效百万token上下文处理能力。同日DeepSeek宣布V4-Pro折扣延长至5月31日,Orange AI也在ColaOS中限时免费开放DeepSeek V4使用。DeepSeek连续两日密集动作(含多模态内测),显示出其加速追赶闭源模型的明确节奏。 From ↗

03 产业

OpenAI与微软解除云合作独家限制,知识产权转为非独家

OpenAI与微软完成合作协议重大修订:解除Azure云服务独家限制,知识产权从独家授权转为非独家,同时重新划分收入分成比例。这一结构性变动意味着OpenAI未来可在多个云平台上部署模型,而微软对OpenAI技术的独占性被打破。这是AI行业最大合作关系的一次根本性重组,将直接影响云AI服务的竞争格局。 From ↗

04 模型

DeepSeek开启多模态内测,视觉能力已可识别图像

DeepSeek正式开启多模态能力内测,当前版本已支持图像识别功能。此前社区已有预告讨论,但官方首次确认内测可用。多模态能力的加入将显著提升DeepSeek在Agent执行链路中的实用性——视觉理解是AI代理与真实世界交互的关键能力。同日社区还热议了DeepSeek即将推出完整视觉/多模态模型的预告,显示DeepSeek正从纯文本向多模态全面扩展。 From ↗

05 模型

NVIDIA发布Nemotron 3 Nano Omni:30B参数MoE多模态模型,本地25GB显存可跑

NVIDIA推出Nemotron 3 Nano Omni,采用30B参数MoE架构,支持图像输入、推理和工具调用,本地运行仅需约25GB显存。该模型已在LM Studio、Fireworks AI和Amazon SageMaker上线,NVIDIA NIM API提供免费测试。同日NVIDIA还发布了专注推理任务的Nemotron-3-Nano-Omni-30B-A3B-Reasoning变体。MoE架构在保持多模态能力的同时大幅降低部署门槛,对本地部署用户尤为友好。 From ↗

06 产品

百度发布GenFlow 4.0,全面集成Office三件套实现自动化办公

百度正式发布GenFlow 4.0版本,核心亮点是全面集成Office三件套(文档、表格、演示),主打AI驱动的自动化办公效率提升。该产品定位为一站式AI办公平台,将大模型能力深度嵌入日常办公场景。在国内大厂竞相布局AI办公的背景下,百度此举是对标微软Copilot和谷歌Workspace AI的直接回应。 From ↗