Main Brief

当日重点整理

01 模型

Qwen3.5小模型家族落地四大本地平台,9B仅需7GB即可跑多模态+工具调用

阿里通义千问发布Qwen3.5小模型系列(0.8B/2B/4B/9B),主打边缘部署与轻量智能体场景。发布当日即完成LM Studio、Ollama、MLX三大本地推理框架的适配,9B版本仅占约7GB存储,原生支持图像输入和工具调用。社区实测称其「9B干翻80B」,并展示了在iPhone上本地运行的视频,引发广泛关注。全系列Base版本已开源。 From ↗

02 产业

MiniMax上市后首份财报:营收7900万美元同比增159%,毛利率翻倍至25.4%

港交所上市公司MiniMax公布2025年度业绩,营收达7900万美元,同比增长159%,毛利率从12.2%跃升至25.4%,国际收入占比超过70%。用户规模突破2.36亿,企业客户达21.4万家。公司同时宣布战略转型方向:从纯模型公司转向聚焦编码、办公效率和多模态创作的AI平台。 From ↗

03 研究

Google提出深度思考比率DTR:与准确率强相关0.83,token越多反而越不准

Google发布论文《Think Deep, Not Just Long》,提出深度思考比率(DTR)指标来评估模型推理质量而非推理长度。关键发现:DTR与答案准确率的相关系数达0.83,而生成token数量与准确率反而呈负相关(-0.54),意味着更长的推理链并不等于更好的结果。该指标有望帮助筛选高质量推理输出,降低约一半推理成本。 From ↗

04 硬件

逆向工程拆解Apple ANE:宣传38 TOPS实为19 TFLOPS,本质是卷积引擎

开发者通过硬核逆向工程绕过CoreML,直接在Apple Neural Engine上执行训练操作。关键发现:ANE本质上是卷积引擎而非矩阵乘法引擎,苹果官方宣传的INT8 38 TOPS算力存在水分,实际峰值仅为19 TFLOPS FP16。项目还揭示ANE内部配备32MB SRAM,多算子链式提交可将利用率提升至94%。项目及博客均已开源。 From ↗

05 研究

AI Agent一周内独立完成菲尔兹奖成果形式化验证,公开20万行代码

一个AI Agent在一周时间内独立完成了对菲尔兹奖获奖成果的大规模形式化验证,并将全部20万行验证代码公开发布。这一成果展示了AI在自动定理证明领域的重大突破——从辅助人类证明到独立完成顶级数学成果的完整形式化,标志着AI数学能力的质变。 From ↗

06 开源

LangChain发布最终形态版本,AI应用框架进入成熟期

最流行的AI应用开发框架LangChain宣布重大架构演进,推出官方称为最终形态的新版本。这一里程碑式更新意味着该框架的API设计和架构已趋于稳定,对数以万计依赖LangChain构建AI应用的开发者来说,标志着从快速迭代期进入了可预期的长期维护阶段。 From ↗