Main Brief

当日重点整理

01 产品

OpenAI Codex 转型全能个人助理,打通 Slack、Google Workspace 等企业工具链

OpenAI 在一天内密集发布 Codex 更新,将其从编程助手重新定位为覆盖研究、文档、演示和数据处理的通用个人助理。新版 Codex 可直接连接 Slack、Google Workspace 和 Microsoft 365,读取聊天记录和云端文件执行任务,并支持在对话中实时展示进度与使用的文件。这意味着 Codex 正从开发者工具向企业生产力平台跃迁。 From ↗

02 研究

Anthropic 解剖百万条 Claude 对话:6% 涉及人生决策,奉承率仅 9%

Anthropic 对 100 万次真实 Claude 对话进行大规模分析,发现约 6% 的对话涉及健康、职业、人际关系和财务等个人生活决策场景。整体阿谀奉承率控制在 9%,但在精神健康和情感关系话题中明显偏高。Anthropic 同时宣布将这些发现直接反馈到新模型训练中,形成「使用-分析-改进」的闭环。 From ↗

03 研究

DeepSeek 发布视觉原语推理论文:模型边看图边画框标注,Token 成本极低

DeepSeek 公布《Thinking with Visual Primitives》论文,基于 DeepSeek-V4-Flash(284B 总参数,13B 激活)和自研 ViT,让模型在回答视觉问题时通过画框、打点等视觉原语进行推理。这种「边看边标注」的思路在极低 Token 消耗下接近 GPT-5.4 等顶级模型的表现,展示了多模态推理的新范式。 From ↗

04 模型

阿里开源 Qwen-Scope:像拧开关一样精准操控大模型内部行为

通义千问团队正式开源 Qwen-Scope 稀疏自编码器套件,为 Qwen 系列模型提供特征级别的可解释性能力。开发者可以定位到「中文语言能力」或「拒绝回答倾向」等具体特征 ID,通过抑制或激活这些特征实现对模型行为的精细干预。该工具同时支持数据合成、训练问题溯源和评测选择等场景。 From ↗

05 产品

Manus 推出永不关机的云端电脑,Agent 任务可 7×24 无人值守运行

Manus 发布「云端电脑」功能,为 AI Agent 提供始终在线的云端运行环境。即使用户的本地设备关机或断网,已启动的任务仍可持续执行,支持通过网页和移动端远程访问。这解决了 Agent 长时间任务被本地环境中断的痛点,让 AI 助手真正具备无人值守的持续工作能力。 From ↗

06 应用

GPT-Image-2.0 手绘标注提示词在社区爆火,一句话让照片变手帐风

社区用户发掘出 GPT-Image-2.0 的手绘风格标注玩法:通过特定提示词让模型以一笔画描边和手写日记感文字为照片添加注解,效果酷似手帐涂鸦。这一玩法迅速在社交平台传播,同时有用户将其应用于 PPT 制作,展示出图像生成模型在日常创意场景中的实用潜力。 From ↗