AI 日报｜2026-03-11

Main Brief

当日重点整理

01 产业

OpenAI收购安全测试工具Promptfoo，将整合进Frontier智能体评估体系

OpenAI宣布完成对Promptfoo的收购，该工具的技术能力将被整合到OpenAI Frontier平台中，专门用于增强智能体（Agent）的安全测试与评估。值得注意的是，Promptfoo承诺保持开源并继续服务现有客户，这意味着OpenAI在强化自身安全能力的同时，也选择维护开源社区的信任。这是OpenAI在智能体安全基础设施上的关键布局——随着智能体能力快速提升，安全测试工具链已成为行业刚需。 From ↗

02 模型

谷歌发布Gemini Embedding 2：首个统一文本/图像/音频/视频的原生多模态嵌入模型

Google DeepMind发布Gemini Embedding 2，这是基于Gemini架构构建的首个原生多模态嵌入模型，能将文本、图像、音频、视频和PDF映射到同一语义空间。该模型通过Gemini API和Vertex AI提供预览，LlamaIndex随即发布了基于此模型创建多模态检索系统的教程。此前嵌入模型多为单模态或后融合方案，Gemini Embedding 2实现了真正的原生多模态统一嵌入——这将大幅简化多模态RAG和跨模态检索系统的构建。 From ↗

03 产业

Anthropic双线扩张：成立研究院推动AI公共对话，悉尼设亚太第四办公室

Anthropic同日宣布两项重大举措：成立Anthropic Institute推动关于强大AI的公共对话与研究，以及将业务拓展至澳大利亚和新西兰，在悉尼开设亚太地区第四个办事处。研究院的设立表明Anthropic正在从纯粹的技术公司向兼具公共影响力的方向演进，而澳新市场的拓展则显示其国际化步伐正在加速——亚太已成为AI公司必争之地。 From ↗

04 产品

Claude Code两大实用更新：/btw命令允许任务中插话，PR自动审查区分新旧bug

Claude Code上线两项重要功能。第一，新增/btw命令，允许用户在AI执行长任务时插入一次性提问而不中断主线程，解决了长时间等待期无法交互的痛点，适用于灵感记录、临时代码审查等场景。第二，自动代码审查功能上线：用户在GitHub提交PR时，系统自动派出一组Agent并行审查代码并在代码行级别留评，且能区分新引入的bug与历史遗留问题。不过单次审查成本可能高达15美元。 From ↗

05 基础设施

NVIDIA与Thinking Machines签约部署1GW级Vera Rubin系统，刷新AI算力基础设施规模

NVIDIA宣布与Thinking Machines达成合作，将部署至少1吉瓦（GW）的NVIDIA Vera Rubin系统用于前沿AI模型训练。1GW的规模相当于一座中型核电站的发电量，这是迄今公开披露的最大规模AI训练算力部署之一。该合作标志着AI基础设施军备竞赛进入新量级——前沿模型的训练成本和资源需求正在以指数级速度膨胀。 From ↗

06 融资

LeCun新公司成立两月半获10亿美元融资，谢赛宁加盟估值35亿美元

据量子位报道，Yann LeCun创办的新公司成立仅两个半月便获得10亿美元投资，估值达35亿美元。更引人注目的是，谢赛宁确认加入该公司。LeCun作为图灵奖得主和Meta前首席AI科学家，其创业动向本身就是行业风向标——如此短时间内获得如此巨额融资，既反映了顶级AI人才的稀缺溢价，也表明资本对AI基础设施和新一代架构方向的强烈押注。 From ↗