AI 日报｜2026-04-26

Main Brief

当日重点整理

01 模型

DeepSeek V4系列正式发布：1.6万亿参数MoE、MIT开源、百万上下文窗口

DeepSeek正式推出V4系列模型，包含V4 Pro与V4 Flash两个版本。V4 Pro采用混合专家架构，总参数量达1.6万亿，支持128万token上下文窗口，并以MIT许可证完全开源。V4 Flash则主打推理速度，在保持强劲性能的同时大幅降低延迟。两个版本均已在LM Studio、Hugging Face等主流平台上线，社区可直接部署使用。这是继V3之后DeepSeek的又一次重大代际升级。 From ↗

02 行业

DeepSeek V4-Pro API限时2.5折：百万token输出仅6元，已接入Claude Code等工具

DeepSeek同步推出V4-Pro API限时优惠活动，百万token输出价格低至6元人民币，折扣力度达2.5折，优惠截止5月5日。值得注意的是，该API已迅速被集成至Claude Code、OpenCode等主流AI编程工具中，开发者可直接调用。这一激进定价策略配合MIT开源许可，正在形成"开源模型+超低API价格"的双重攻势，对OpenAI、Anthropic等闭源厂商的定价体系构成直接冲击。 From ↗

03 基准

GPT-5.5独立评测：多项基准登顶但幻觉率高达86%，谄媚问题突出

独立评测机构对GPT-5.5进行了全面测试，结果显示该模型在Terminal-Bench等多个基准榜单中名列前茅，但幻觉率高达86%，远超可接受水平。评测还指出GPT-5.5存在明显的谄媚倾向——倾向于迎合用户而非给出客观判断，以及系统卡片与实际行为之间的矛盾。有博主实测认为GPT-5.5在超长程任务以外的能力已追平甚至超过Anthropic的Opus 4.7，但高幻觉率仍是其最大短板。 From ↗

04 工具

DeepSeek V4 Flash实验性GGUF量化发布，MacBook M3 Max跑出21 token/s

开发者antirez（Redis作者）发布了DeepSeek V4 Flash的实验性llama.cpp支持及2位GGUF量化模型。在MacBook M3 Max（128GB RAM）上实测达到21 token/s的生成速度，首次让这一万亿参数级模型在消费级设备上可运行。与此同时，社区也在RTX 5090上对Qwen3.6-27B-INT4进行了优化，实现105-108 tps并完整支持256k上下文。本地推理生态正快速追赶云端API的能力边界。 From ↗

05 开源

全球首个医疗视频理解大模型开源，含6000+样本测试集与英雄榜

研究团队开源了全球首个专注于医疗视频理解的大模型，同步发布包含6000多组标注样本的评测基准和公开排行榜。该模型旨在理解和分析医学影像视频，覆盖诊断辅助、手术流程识别等场景。测试集的开放意味着其他研究团队可以在统一标准下对比各自方案，推动医疗AI领域的可复现研究。这是垂直领域大模型从文本、图像向视频扩展的重要里程碑。 From ↗

06 行业

DeepSeek V4作者阮翀加盟元戎启行，详解基座VLA架构并称效率提升10倍

DeepSeek V4核心作者之一阮翀确认加盟自动驾驶公司元戎启行，首次公开讲解其基座VLA（Vision-Language-Action）架构，声称可将研发效率提升10倍。同日，元戎启行正式发布物理AI架构，其高级驾驶辅助系统已搭载于超过30万辆汽车。华为也同期发布ADS 5，宣布今年将在世界模型领域投入180亿元。自动驾驶赛道正加速吸纳大模型人才和技术路线。 From ↗