AI 日报｜2026-03-03

Main Brief

当日重点整理

01 模型

Qwen3.5小模型家族落地四大本地平台，9B仅需7GB即可跑多模态+工具调用

阿里通义千问发布Qwen3.5小模型系列（0.8B/2B/4B/9B），主打边缘部署与轻量智能体场景。发布当日即完成LM Studio、Ollama、MLX三大本地推理框架的适配，9B版本仅占约7GB存储，原生支持图像输入和工具调用。社区实测称其「9B干翻80B」，并展示了在iPhone上本地运行的视频，引发广泛关注。全系列Base版本已开源。 From ↗

02 产业

MiniMax上市后首份财报：营收7900万美元同比增159%，毛利率翻倍至25.4%

港交所上市公司MiniMax公布2025年度业绩，营收达7900万美元，同比增长159%，毛利率从12.2%跃升至25.4%，国际收入占比超过70%。用户规模突破2.36亿，企业客户达21.4万家。公司同时宣布战略转型方向：从纯模型公司转向聚焦编码、办公效率和多模态创作的AI平台。 From ↗

03 研究

Google提出深度思考比率DTR：与准确率强相关0.83，token越多反而越不准

Google发布论文《Think Deep, Not Just Long》，提出深度思考比率（DTR）指标来评估模型推理质量而非推理长度。关键发现：DTR与答案准确率的相关系数达0.83，而生成token数量与准确率反而呈负相关（-0.54），意味着更长的推理链并不等于更好的结果。该指标有望帮助筛选高质量推理输出，降低约一半推理成本。 From ↗

04 硬件

逆向工程拆解Apple ANE：宣传38 TOPS实为19 TFLOPS，本质是卷积引擎

开发者通过硬核逆向工程绕过CoreML，直接在Apple Neural Engine上执行训练操作。关键发现：ANE本质上是卷积引擎而非矩阵乘法引擎，苹果官方宣传的INT8 38 TOPS算力存在水分，实际峰值仅为19 TFLOPS FP16。项目还揭示ANE内部配备32MB SRAM，多算子链式提交可将利用率提升至94%。项目及博客均已开源。 From ↗

05 研究

AI Agent一周内独立完成菲尔兹奖成果形式化验证，公开20万行代码

一个AI Agent在一周时间内独立完成了对菲尔兹奖获奖成果的大规模形式化验证，并将全部20万行验证代码公开发布。这一成果展示了AI在自动定理证明领域的重大突破——从辅助人类证明到独立完成顶级数学成果的完整形式化，标志着AI数学能力的质变。 From ↗

06 开源

LangChain发布最终形态版本，AI应用框架进入成熟期

最流行的AI应用开发框架LangChain宣布重大架构演进，推出官方称为最终形态的新版本。这一里程碑式更新意味着该框架的API设计和架构已趋于稳定，对数以万计依赖LangChain构建AI应用的开发者来说，标志着从快速迭代期进入了可预期的长期维护阶段。 From ↗