Main Brief

当日重点整理

01 安全

LiteLLM PyPI包被植入窃密代码,供应链攻击波及browser-use等多个项目

流行LLM工具库LiteLLM的v1.82.8版本在PyPI上被发现内嵌凭证窃取恶意代码,该问题包已被官方隔离标记。事件迅速发酵——依赖LiteLLM的开源项目browser-use的v0.12.3版本同样受到波及。安全专家Simon Willison随即撰文建议包管理器引入“依赖冷却期”机制,即新版本发布后延迟数天再安装,以在供应链攻击中争取检测窗口。这一事件暴露了AI/ML工具链在快速迭代中对依赖安全的忽视。 From ↗

02 研究

Kimi发表Attention Residuals论文,马斯克Karpathy盛赞或开启深度学习新范式

Kimi团队发布论文《Attention Residuals》,提出一种改进注意力机制的新方法,在AI社区引发广泛关注。马斯克和Karpathy等重量级人物给予高度评价,有观点认为该研究可能预示深度学习架构的重大范式转变。论文核心思路是在注意力计算中引入残差信号,以提升模型对长距离依赖的建模能力,被认为有潜力成为下一代Transformer架构的关键组件。 From ↗

03 产品

Claude Code密集更新:自动模式、智能项目初始化与Creator分享高效工作流

Claude Code在同一天迎来多项重要更新。首先是推出自动模式(Auto Mode),AI可在安全监控下自主处理文件操作和命令执行,无需用户逐项审批,通过 `claude --enable-auto-mode` 启用。其次是/init命令升级,运行时自动扫描代码库并引导配置Skills、插件和Hook。此外,Claude Code创造者Boris在播客中分享核心工作流理念:使用CoWork并行处理任务、坚持先计划后执行、让模型验证自身输出,并强调用最强模型反而更省时省钱。 From ↗

04 研究

Meta发布V-JEPA:仅通过视频预测就能学会物理常识,IntPhys测试准确率达98%

Meta研究团队发布V-JEPA模型,通过观看视频并预测未来帧来自主学习物理常识,无需人工标注或内置先验知识。在IntPhys物理直觉测试集上,该模型达到98%的准确率。其核心理念——通过抽象表征空间进行预测学习而非像素级重建——挑战了AI必须内置“核心知识”才能理解物理世界的传统观点,为通用物理推理开辟了一条纯数据驱动的新路径。 From ↗

05 产业

Google DeepMind牵手Agile Robots,将Gemini基础模型引入工业机器人

Google DeepMind宣布与机器人公司Agile Robots建立研究合作伙伴关系,目标是将Gemini基础模型与机器人硬件深度集成,打造更具实用性的下一代智能机器人。Agile Robots专注于工业级机器人解决方案,此次合作意味着DeepMind的AI能力将从数字世界向物理世界的工业场景延伸。这是Google在具身智能领域的重要布局,也是大模型落地机器人赛道的标志性事件。 From ↗

06 技术

Cursor公开Composer 2训练方法:分布式强化学习无需昂贵集群即可训练编程模型

Cursor发布了其AI代码助手核心模型Composer 2的技术训练报告,揭示了一个重要发现:无需依赖昂贵的巨型计算集群,通过分布式采样即可在全球多个小型集群上进行强化学习训练。Fireworks AI作为训练基础设施合作伙伴对此进行了详细解读。这一训练范式的意义在于,它大幅降低了训练高质量编程模型的硬件门槛,使得更多团队有机会参与竞争。 From ↗