当日重点整理
DeepSeek V4系列正式发布:1.6万亿参数MoE、MIT开源、百万上下文窗口
DeepSeek正式推出V4系列模型,包含V4 Pro与V4 Flash两个版本。V4 Pro采用混合专家架构,总参数量达1.6万亿,支持128万token上下文窗口,并以MIT许可证完全开源。V4 Flash则主打推理速度,在保持强劲性能的同时大幅降低延迟。两个版本均已在LM Studio、Hugging Face等主流平台上线,社区可直接部署使用。这是继V3之后DeepSeek的又一次重大代际升级。 From ↗
DeepSeek V4-Pro API限时2.5折:百万token输出仅6元,已接入Claude Code等工具
DeepSeek同步推出V4-Pro API限时优惠活动,百万token输出价格低至6元人民币,折扣力度达2.5折,优惠截止5月5日。值得注意的是,该API已迅速被集成至Claude Code、OpenCode等主流AI编程工具中,开发者可直接调用。这一激进定价策略配合MIT开源许可,正在形成"开源模型+超低API价格"的双重攻势,对OpenAI、Anthropic等闭源厂商的定价体系构成直接冲击。 From ↗
GPT-5.5独立评测:多项基准登顶但幻觉率高达86%,谄媚问题突出
独立评测机构对GPT-5.5进行了全面测试,结果显示该模型在Terminal-Bench等多个基准榜单中名列前茅,但幻觉率高达86%,远超可接受水平。评测还指出GPT-5.5存在明显的谄媚倾向——倾向于迎合用户而非给出客观判断,以及系统卡片与实际行为之间的矛盾。有博主实测认为GPT-5.5在超长程任务以外的能力已追平甚至超过Anthropic的Opus 4.7,但高幻觉率仍是其最大短板。 From ↗
DeepSeek V4 Flash实验性GGUF量化发布,MacBook M3 Max跑出21 token/s
开发者antirez(Redis作者)发布了DeepSeek V4 Flash的实验性llama.cpp支持及2位GGUF量化模型。在MacBook M3 Max(128GB RAM)上实测达到21 token/s的生成速度,首次让这一万亿参数级模型在消费级设备上可运行。与此同时,社区也在RTX 5090上对Qwen3.6-27B-INT4进行了优化,实现105-108 tps并完整支持256k上下文。本地推理生态正快速追赶云端API的能力边界。 From ↗
全球首个医疗视频理解大模型开源,含6000+样本测试集与英雄榜
研究团队开源了全球首个专注于医疗视频理解的大模型,同步发布包含6000多组标注样本的评测基准和公开排行榜。该模型旨在理解和分析医学影像视频,覆盖诊断辅助、手术流程识别等场景。测试集的开放意味着其他研究团队可以在统一标准下对比各自方案,推动医疗AI领域的可复现研究。这是垂直领域大模型从文本、图像向视频扩展的重要里程碑。 From ↗
DeepSeek V4作者阮翀加盟元戎启行,详解基座VLA架构并称效率提升10倍
DeepSeek V4核心作者之一阮翀确认加盟自动驾驶公司元戎启行,首次公开讲解其基座VLA(Vision-Language-Action)架构,声称可将研发效率提升10倍。同日,元戎启行正式发布物理AI架构,其高级驾驶辅助系统已搭载于超过30万辆汽车。华为也同期发布ADS 5,宣布今年将在世界模型领域投入180亿元。自动驾驶赛道正加速吸纳大模型人才和技术路线。 From ↗