Main Brief

当日重点整理

01 产品

Anthropic发布Claude Design,支持从描述直接生成网页与演示文稿

Anthropic正式推出Claude Design设计工具,用户可通过自然语言描述生成网页、APP原型和PPT,并支持导出为PDF、PPT、HTML等多种格式。该工具还能接入Figma文件和GitHub代码库,生成的设计稿可直接交给Claude Code进行开发实现。社区体验反馈显示其产出质量已接近可直接使用的水平,标志着AI从代码生成向全流程产品设计的延伸。 From ↗

02 模型

Claude Opus 4.7登顶Arena代码榜,领先GPT-5.4约130分

Claude Opus 4.7在Arena代码竞技场评测中夺得第一,相比前代Opus 4.6提升37分,领先GPT-5.4和Gemini-3.1-Pro约130分。独立盲测中,由GPT-5.4、Gemini 3.1 Pro和DeepSeek V3.2担任评委的100组对比中,Opus 4.7赢得69场。不过Arena细项对比显示,4.7在整体和创意写作上超越4.6,但在商业管理、娱乐等领域仍有差距,表明模型能力提升并非全面均匀。 From ↗

03 产业

OpenAI产品VP Kevin Weil离职,公司同步解散科学部门

OpenAI产品副总裁Kevin Weil确认离职,公司同时解散了其科学部门。这是继此前多轮高管变动后,OpenAI内部组织架构的又一次重大调整。科学部门的解散引发了外界对OpenAI基础研究投入是否收缩的担忧——在竞争日益激烈的环境下,这家曾以研究驱动著称的公司似乎正加速向产品和商业化方向转型。 From ↗

04 产业

传DeepSeek启动首轮外部融资,目标估值百亿美元并将推万亿参数V4

据报道,DeepSeek正在寻求其成立以来的首轮外部融资,目标估值达100亿美元。与此同时,其下一代V4模型规划使用万亿参数规模,并计划搭载华为昇腾芯片以降低对英伟达GPU的依赖。如果融资落地,这将是中国AI创业公司中估值最高的新一轮融资之一,而芯片自主化的路线选择也折射出地缘政治对AI技术栈的深远影响。 From ↗

05 开源

阿里开源Qwen3.6-35B-A3B稀疏MoE,仅3B激活参数超越Gemma4-31B

阿里开源Qwen3.6-35B-A3B模型,采用稀疏MoE架构,总参数35B但推理时仅激活3B参数,在多项基准上超越Gemma4-31B。社区实测在CPU上以Q4量化运行可达22 tokens/s,常识推理HellaSwag准确率74.3%。此前的Qwen3.5-35B-A3B已被社区广泛用于微调各类专家模型。这一发布进一步巩固了阿里在开源高效模型领域的领先地位。 From ↗

06 技术

Kimi发布跨数据中心Prefill/Decode分离架构,吞吐提升1.54倍

Kimi团队提出Prefill与Decode跨数据中心分离方案,通过异构硬件协同解决了大模型推理中的KV缓存传输瓶颈。在20倍放大的Kimi Linear模型上验证,吞吐量提升1.54倍,P90首次令牌延迟降低64%,直接转化为更低的单位token推理成本。这一架构突破为超大规模模型的分布式部署提供了新的工程范式,有望推动推理成本进一步下探。 From ↗