当日重点整理
GPT-5.4上线首周即揽10亿美元ARR,单次查询成本达80美元
GPT-5.4发布仅一周便创造了10亿美元的年度经常性收入,效率相比前代提升高达32倍。但与此同时,单次查询成本也飙升至80美元,凸显高端AI能力与使用成本之间的巨大张力。这一数据表明,顶级AI模型的商业化变现速度已远超市场预期,但高昂的推理成本可能成为企业大规模采用的瓶颈。 From ↗
Manus将AI代理从云端搬上桌面,My Computer应用支持本地文件操控
Manus正式发布桌面应用My Computer,将AI代理能力从云端迁移至用户本地设备,支持macOS和Windows系统。应用可直接利用本地计算资源执行整理照片、重命名发票、构建桌面应用等任务,无需将数据上传至云端。这标志着AI Agent正从远程服务器形态向个人桌面环境渗透,隐私保护和本地化执行成为新的产品差异化方向。 From ↗
Kimi发布创新注意力机制论文获马斯克点赞,社区已动手可视化解读
Kimi团队在arXiv发布了一篇提出新型注意力机制架构的论文,迅速引发社区关注并获得马斯克本人赞赏。论文核心创新在于对传统注意力计算方式的重新设计,社区成员随即使用K2.5工具对论文进行了可视化拆解。这篇来自中国团队的架构创新论文获得全球顶级AI人物的公开认可,反映了基础架构研究领域的竞争格局正在发生变化。 From ↗
黄仁勋GTC放言算力需求进入百万倍增长期,预测翻倍至万亿美元
在英伟达GTC大会上,黄仁勋提出算力需求已进入「百万倍增长」阶段,并将2027年前全球算力需求预测从此前水平翻倍至1万亿美元。大会同时发布了LPU芯片、太空级芯片等多项重磅产品。黄仁勋还重点推介了开源向量数据库Milvus,将其列为AI基础设施的关键引擎。GTC释放的信号表明,AI算力军备竞赛正在加速升级。 From ↗
OpenAI Codex子代理功能结束预览全面开放,支持并行任务分发
OpenAI宣布Codex的子代理(Subagents)功能正式GA,对所有开发者全面开放。该功能允许用户创建专用子代理并行处理不同任务,每个子代理拥有独立上下文窗口,既保持了主会话的清洁度,又显著提升了复杂工作流的执行效率。用户可通过窗口切换实时跟踪各子代理的执行状态。这是AI编程工具向多代理协作架构演进的重要一步。 From ↗
Mistral开源119B参数MoE模型Small 4,Apache 2许可融合旗舰能力
Mistral发布全新开源模型Mistral Small 4,参数规模达119B,采用MoE(混合专家)架构和Apache 2许可。该模型融合了Mistral旗舰模型的核心能力,在保持开源可商用的同时实现了性能跃升。这是Mistral在开源大模型赛道的最新布局,119B参数的MoE设计在推理效率和能力之间寻求平衡,对标同期发布的其他开源模型。 From ↗