AI 日报｜2026-03-17

Main Brief

当日重点整理

01 产业

GPT-5.4上线首周即揽10亿美元ARR，单次查询成本达80美元

GPT-5.4发布仅一周便创造了10亿美元的年度经常性收入，效率相比前代提升高达32倍。但与此同时，单次查询成本也飙升至80美元，凸显高端AI能力与使用成本之间的巨大张力。这一数据表明，顶级AI模型的商业化变现速度已远超市场预期，但高昂的推理成本可能成为企业大规模采用的瓶颈。 From ↗

02 产品

Manus将AI代理从云端搬上桌面，My Computer应用支持本地文件操控

Manus正式发布桌面应用My Computer，将AI代理能力从云端迁移至用户本地设备，支持macOS和Windows系统。应用可直接利用本地计算资源执行整理照片、重命名发票、构建桌面应用等任务，无需将数据上传至云端。这标志着AI Agent正从远程服务器形态向个人桌面环境渗透，隐私保护和本地化执行成为新的产品差异化方向。 From ↗

03 研究

Kimi发布创新注意力机制论文获马斯克点赞，社区已动手可视化解读

Kimi团队在arXiv发布了一篇提出新型注意力机制架构的论文，迅速引发社区关注并获得马斯克本人赞赏。论文核心创新在于对传统注意力计算方式的重新设计，社区成员随即使用K2.5工具对论文进行了可视化拆解。这篇来自中国团队的架构创新论文获得全球顶级AI人物的公开认可，反映了基础架构研究领域的竞争格局正在发生变化。 From ↗

04 产业

黄仁勋GTC放言算力需求进入百万倍增长期，预测翻倍至万亿美元

在英伟达GTC大会上，黄仁勋提出算力需求已进入「百万倍增长」阶段，并将2027年前全球算力需求预测从此前水平翻倍至1万亿美元。大会同时发布了LPU芯片、太空级芯片等多项重磅产品。黄仁勋还重点推介了开源向量数据库Milvus，将其列为AI基础设施的关键引擎。GTC释放的信号表明，AI算力军备竞赛正在加速升级。 From ↗

05 产品

OpenAI Codex子代理功能结束预览全面开放，支持并行任务分发

OpenAI宣布Codex的子代理（Subagents）功能正式GA，对所有开发者全面开放。该功能允许用户创建专用子代理并行处理不同任务，每个子代理拥有独立上下文窗口，既保持了主会话的清洁度，又显著提升了复杂工作流的执行效率。用户可通过窗口切换实时跟踪各子代理的执行状态。这是AI编程工具向多代理协作架构演进的重要一步。 From ↗

06 开源

Mistral开源119B参数MoE模型Small 4，Apache 2许可融合旗舰能力

Mistral发布全新开源模型Mistral Small 4，参数规模达119B，采用MoE（混合专家）架构和Apache 2许可。该模型融合了Mistral旗舰模型的核心能力，在保持开源可商用的同时实现了性能跃升。这是Mistral在开源大模型赛道的最新布局，119B参数的MoE设计在推理效率和能力之间寻求平衡，对标同期发布的其他开源模型。 From ↗