AI 日报｜2026-03-16

Main Brief

当日重点整理

01 技术

Kimi提出Attention Residuals新架构，实现1.25倍计算效率提升

Kimi团队提出Attention Residuals架构，用输入依赖的注意力机制替代传统深度递归，允许模型选择性检索过往层的表征。在Kimi Linear架构上验证，实现1.25倍计算优势且推理延迟开销极小。同时发布的Scaling law实验表明，该优势在不同模型规模下保持一致，为长序列高效推理提供了新路径。 From ↗

02 产业

谷歌联手微软推出WebMCP标准，网站将能主动向AI Agent暴露能力

Google在Chrome 146中发布WebMCP标准草案，与微软联合推动，让网站以结构化工具形式向AI Agent暴露可调用能力，跳过传统截图识别环节。这意味着网站未来需同时适配人类浏览和AI调用两种模式，可能引发流量从人类用户向Agent迁移的结构性变化。 From ↗

03 技术

Simon Willison系统定义Agentic Engineering，发布首份实践模式指南

Simon Willison发布《Agentic Engineering Patterns》指南，首次将Agentic Engineering定义为'在编码Agent辅助下开发软件'的系统工程方法。文章梳理了编码Agent的核心概念、主流工具生态和关键实践模式，为快速兴起的Agent辅助开发领域提供了首个完整的方法论框架。 From ↗

04 开源

智谱同日发布GLM-5-Turbo高速模型与0.9B参数的GLM-OCR，后者登顶文档解析榜单

智谱AI同日发布两款模型：GLM-5-Turbo作为GLM-5的高速变体，已上线Coding Plan Max和OpenRouter，用量限制提升三倍（至4月30日），但确认为实验版本暂不开源，能力将整合进下一个开源版；GLM-OCR仅0.9B参数即在OmniDocBench V1.5上以94.62分排名第一，展示了小模型在文档解析领域的惊人潜力。 From ↗

05 产品

Claude上线百万token上下文窗口并启动两周用量翻倍，国内用户白天全时段受益

Anthropic为Claude Opus 4.6和Sonnet 4.6全面开放百万token上下文窗口，实行统一价格无长上下文附加费。同步启动两周用量翻倍活动：工作日非高峰时段及周末全天所有用户用量翻倍。由于时差换算，国内用户白天所有时段均可享受翻倍额度，显著降低了长文档处理和大规模Agent工作流的使用门槛。 From ↗

06 研究

1.4亿宝可梦玩家的300亿张街景图像被用于训练厘米级机器人导航

研究人员利用全球1.4亿宝可梦玩家在游戏过程中无意间采集的约300亿张高精度街景图像数据集，训练机器人实现了厘米级导航精度。这一案例展示了大规模游戏众包数据在物理世界AI应用中的巨大价值，也为机器人导航的数据获取提供了全新的低成本范式。 From ↗