当日重点整理
Kimi提出Attention Residuals新架构,实现1.25倍计算效率提升
Kimi团队提出Attention Residuals架构,用输入依赖的注意力机制替代传统深度递归,允许模型选择性检索过往层的表征。在Kimi Linear架构上验证,实现1.25倍计算优势且推理延迟开销极小。同时发布的Scaling law实验表明,该优势在不同模型规模下保持一致,为长序列高效推理提供了新路径。 From ↗
谷歌联手微软推出WebMCP标准,网站将能主动向AI Agent暴露能力
Google在Chrome 146中发布WebMCP标准草案,与微软联合推动,让网站以结构化工具形式向AI Agent暴露可调用能力,跳过传统截图识别环节。这意味着网站未来需同时适配人类浏览和AI调用两种模式,可能引发流量从人类用户向Agent迁移的结构性变化。 From ↗
Simon Willison系统定义Agentic Engineering,发布首份实践模式指南
Simon Willison发布《Agentic Engineering Patterns》指南,首次将Agentic Engineering定义为'在编码Agent辅助下开发软件'的系统工程方法。文章梳理了编码Agent的核心概念、主流工具生态和关键实践模式,为快速兴起的Agent辅助开发领域提供了首个完整的方法论框架。 From ↗
智谱同日发布GLM-5-Turbo高速模型与0.9B参数的GLM-OCR,后者登顶文档解析榜单
智谱AI同日发布两款模型:GLM-5-Turbo作为GLM-5的高速变体,已上线Coding Plan Max和OpenRouter,用量限制提升三倍(至4月30日),但确认为实验版本暂不开源,能力将整合进下一个开源版;GLM-OCR仅0.9B参数即在OmniDocBench V1.5上以94.62分排名第一,展示了小模型在文档解析领域的惊人潜力。 From ↗
Claude上线百万token上下文窗口并启动两周用量翻倍,国内用户白天全时段受益
Anthropic为Claude Opus 4.6和Sonnet 4.6全面开放百万token上下文窗口,实行统一价格无长上下文附加费。同步启动两周用量翻倍活动:工作日非高峰时段及周末全天所有用户用量翻倍。由于时差换算,国内用户白天所有时段均可享受翻倍额度,显著降低了长文档处理和大规模Agent工作流的使用门槛。 From ↗
1.4亿宝可梦玩家的300亿张街景图像被用于训练厘米级机器人导航
研究人员利用全球1.4亿宝可梦玩家在游戏过程中无意间采集的约300亿张高精度街景图像数据集,训练机器人实现了厘米级导航精度。这一案例展示了大规模游戏众包数据在物理世界AI应用中的巨大价值,也为机器人导航的数据获取提供了全新的低成本范式。 From ↗