Main Brief

当日重点整理

01 工具

英伟达OpenShell平台发布,为自主AI智能体建立安全治理框架

英伟达正式推出OpenShell平台,为快速发展的自主AI智能体提供内建的安全、隐私与治理控制机制。该平台旨在解决智能体部署过程中面临的安全合规挑战,将安全能力直接嵌入到智能体运行时中,而非作为外挂层。随着AI智能体从实验室走向生产环境,安全治理基础设施的缺失一直是企业落地的主要障碍之一,OpenShell的出现为这一问题提供了标准化的解法。 From ↗

02 产品

MiniMax推出跨模态统一订阅方案,文本/语音/视频一个Plan搞定

MiniMax发布Token Plan订阅方案,首次将文本、语音、音乐、视频和图像五大模态的API接入整合为统一费率体系。此前开发者调用不同模态需要分别计费和管理,现在通过单一订阅即可覆盖全部模态能力。这种"全家桶"式的定价策略降低了多模态应用的接入门槛,也可能倒逼其他API服务商重新审视定价结构。 From ↗

03 研究

Anthropic开设科学博客,Claude Opus 4.5加速理论物理研究获验证

Anthropic推出Science Blog专栏,首篇文章以哈佛物理学家使用Claude Opus 4.5完成研究生级别理论物理计算为案例,展示AI在科学推理中的加速效果。同时发布的研究还对比了单智能体与多智能体架构在长视野科学任务中的表现差异,发现并非所有复杂问题都适合拆解为多智能体协作。这一系列动作表明Anthropic正从产品层面主动引导AI向科研场景渗透。 From ↗

04 工具

Hugging Face联合ServiceNow发布EVA,语音智能体评估终于有了标准

Hugging Face与ServiceNow合作推出EVA评估框架,为语音智能体提供首个标准化的性能评测体系。语音AI领域长期缺乏统一的评估基准,开发者难以横向比较不同方案的优劣。EVA的出现填补了这一空白,有望加速语音智能体从Demo走向可量化的工程实践。 From ↗

05 研究

流式MoE权重加载实现突破,397B参数Qwen3.5首次在iPhone上运行

通过流式MoE(混合专家)权重技术,Qwen3.5-397B这一超大规模模型成功在iPhone上实现运行。该技术的核心思路是不将整个模型加载到内存,而是根据每个token的推理需求从SSD动态流式加载对应的专家子集权重。这一突破意味着万亿参数级MoE模型在消费级设备上运行不再是理论假设,对端侧AI部署的范式转变具有里程碑意义。 From ↗

06 产品

Anthropic上线Claude Computer Use,AI可直接操控用户电脑

Anthropic为Claude新增Computer Use功能,使其能够直接操控用户电脑执行点击、打字、打开应用等操作。该功能的定位是连接器和浏览器操作失败时的兜底方案,而非默认首选路径。一个有趣的用例场景是用户可以在手机上给Claude下达任务,由Claude在电脑端自主完成。这标志着AI助手从"对话问答"向"跨设备自主操作"的范式跃迁。 From ↗