当日重点整理
Kimi K2.6发布:开源编码SOTA,支持12小时连续任务与300并行智能体
Kimi正式发布K2.6模型,在多项编码基准中取得开源最佳成绩。该模型的核心突破在于超长周期任务能力——支持超过4000次工具调用、12小时不间断执行,以及智能体集群架构,可同时协调300个并行子智能体。K2.6 API同步上线,定价为输入$0.95/M tokens(缓存命中$0.16)、输出$4.00/M tokens,支持原生多模态和256K上下文窗口。在实际演示中,K2.6用12小时自主重构了一个运行8年的金融撮合引擎,实现185%吞吐量提升;还用Zig语言在Mac上部署Qwen模型,速度超过LM Studio两成。Artificial Analysis将其评为当前开源SOTA,Baseten和Fireworks AI成为首批推理合作伙伴。 From ↗
亚马逊追加50亿美元投资Anthropic,锁定5吉瓦算力用于Claude训练
亚马逊宣布向Anthropic追加50亿美元投资,未来可能再追加200亿美元。双方合作确保高达5吉瓦的计算资源专门用于Claude模型的训练和部署,首批容量将在本季度上线。这是继此前多轮投资后两家公司关系的又一次重大升级——亚马逊正在用资本和算力双重锁定的方式深度绑定Anthropic,以确保在与微软-OpenAI联盟的竞争中拥有足够强大的模型供应。5吉瓦的算力规模也反映出前沿模型训练对能源需求的指数级增长。 From ↗
GPT image-2全量推送,用户实测一句话生成北京旅游攻略长图
多位用户确认OpenAI的GPT image-2图像模型已全量上线。新模型在图像生成质量上有显著提升,能根据文档自动生成解释性长图,且对内容尺度的限制有所放宽。社区实测中,用户仅用一句话提示即可生成完整的北京旅游攻略长图,信息密度和排版质量接近专业设计水准。这标志着OpenAI在多模态生成领域从文本图像对齐向复杂信息可视化方向的跃进。 From ↗
阿里发布Qwen3.6-Max-Preview旗舰预览版,强化智能体编码与世界知识
阿里巴巴发布Qwen3.6-Max-Preview旗舰模型预览版,在智能体编码、世界知识和指令遵循三项核心能力上相比Plus版本有明显提升,目标是提高复杂现实任务中的可靠性。同日,Qwen3.6 Plus在Code Arena评测中以1476分升至第七名,较预览版提升16分,推动通义实验室在编码实验室排名中升至第三。阿里在模型迭代节奏上的加速——Preview和Plus双线并进——显示出其在开源旗舰赛道上追赶闭源模型的决心。 From ↗
OpenAI为Codex推出Chronicle实验功能:截屏捕获构建编码记忆
OpenAI为Codex编码助手推出Chronicle实验性记忆功能。该功能通过后台代理持续捕获用户屏幕内容,自动构建上下文记忆,使模型能够理解「这个」或「那个」等模糊指代背后的文档、代码和Bug信息。截图数据存储在本地以保护隐私,目前仅向Pro用户开放。这一功能试图解决AI编码助手的核心痛点——缺乏对用户工作环境的持续感知——从而让编码对话从每次重新解释上下文进化为无缝延续的工作流。 From ↗
Devin上线多代理协作功能:主代理可调度多个独立子代理并行编码
Cognition旗下AI编程工具Devin推出多代理协作能力。主会话现在可以同时创建、协调和监控多个完整的Devin子代理实例,每个子代理拥有独立的虚拟机、终端、浏览器和测试环境。主代理负责将复杂任务分解为子任务分发给各子代理执行,最后汇总结果。这种架构让单个Devin会话能够并行处理原本需要串行完成的工作,在大型代码库重构、多模块联调等场景下有望显著提升效率。 From ↗