Main Brief

当日重点整理

01 产业

OpenAI收购安全测试工具Promptfoo,将整合进Frontier智能体评估体系

OpenAI宣布完成对Promptfoo的收购,该工具的技术能力将被整合到OpenAI Frontier平台中,专门用于增强智能体(Agent)的安全测试与评估。值得注意的是,Promptfoo承诺保持开源并继续服务现有客户,这意味着OpenAI在强化自身安全能力的同时,也选择维护开源社区的信任。这是OpenAI在智能体安全基础设施上的关键布局——随着智能体能力快速提升,安全测试工具链已成为行业刚需。 From ↗

02 模型

谷歌发布Gemini Embedding 2:首个统一文本/图像/音频/视频的原生多模态嵌入模型

Google DeepMind发布Gemini Embedding 2,这是基于Gemini架构构建的首个原生多模态嵌入模型,能将文本、图像、音频、视频和PDF映射到同一语义空间。该模型通过Gemini API和Vertex AI提供预览,LlamaIndex随即发布了基于此模型创建多模态检索系统的教程。此前嵌入模型多为单模态或后融合方案,Gemini Embedding 2实现了真正的原生多模态统一嵌入——这将大幅简化多模态RAG和跨模态检索系统的构建。 From ↗

03 产业

Anthropic双线扩张:成立研究院推动AI公共对话,悉尼设亚太第四办公室

Anthropic同日宣布两项重大举措:成立Anthropic Institute推动关于强大AI的公共对话与研究,以及将业务拓展至澳大利亚和新西兰,在悉尼开设亚太地区第四个办事处。研究院的设立表明Anthropic正在从纯粹的技术公司向兼具公共影响力的方向演进,而澳新市场的拓展则显示其国际化步伐正在加速——亚太已成为AI公司必争之地。 From ↗

04 产品

Claude Code两大实用更新:/btw命令允许任务中插话,PR自动审查区分新旧bug

Claude Code上线两项重要功能。第一,新增/btw命令,允许用户在AI执行长任务时插入一次性提问而不中断主线程,解决了长时间等待期无法交互的痛点,适用于灵感记录、临时代码审查等场景。第二,自动代码审查功能上线:用户在GitHub提交PR时,系统自动派出一组Agent并行审查代码并在代码行级别留评,且能区分新引入的bug与历史遗留问题。不过单次审查成本可能高达15美元。 From ↗

05 基础设施

NVIDIA与Thinking Machines签约部署1GW级Vera Rubin系统,刷新AI算力基础设施规模

NVIDIA宣布与Thinking Machines达成合作,将部署至少1吉瓦(GW)的NVIDIA Vera Rubin系统用于前沿AI模型训练。1GW的规模相当于一座中型核电站的发电量,这是迄今公开披露的最大规模AI训练算力部署之一。该合作标志着AI基础设施军备竞赛进入新量级——前沿模型的训练成本和资源需求正在以指数级速度膨胀。 From ↗

06 融资

LeCun新公司成立两月半获10亿美元融资,谢赛宁加盟估值35亿美元

据量子位报道,Yann LeCun创办的新公司成立仅两个半月便获得10亿美元投资,估值达35亿美元。更引人注目的是,谢赛宁确认加入该公司。LeCun作为图灵奖得主和Meta前首席AI科学家,其创业动向本身就是行业风向标——如此短时间内获得如此巨额融资,既反映了顶级AI人才的稀缺溢价,也表明资本对AI基础设施和新一代架构方向的强烈押注。 From ↗