2025年12月2日星期二

AI 技术日报 - 2025年12月2日

今日重点：焦点头条：DeepSeek 再次“掀桌”，视频生成激战正酣

AILLM开发工具

作者: Jaguarliu

PixelAcademy AI 技术日报

2025年12月2日星期二

Generated by PixelAcademy · 2025/12/6

🚀 焦点头条：DeepSeek 再次“掀桌”，视频生成激战正酣

1. DeepSeek V3.2 正式发布：在“降智”潮中逆势降价就在 Google 和 Perplexity 因成本问题陷入“降级”争议（见下文）之时，DeepSeek 于昨日（12月1日）正式发布了 DeepSeek-V3.2 及其特别版 V3.2-Speciale。
- 技术突破：新版本整合了 9 月 V3.2-Exp 的实验成果，大幅强化了 Thinking Mode（思考模式），在代码生成与复杂逻辑推理上的表现逼近 OpenAI o1 水平。
- 市场宣战：得益于底层训练与推理效率（Inference Efficiency）的突破，DeepSeek 宣布 API 同步降价。这种在算力紧缺时代“加量不加价”的策略，被视为对硅谷巨头的一记重拳。
1. Runway Gen-4.5 盲测夺冠，120人团队“屠龙” Runway 凭借 120 人的精锐团队，其 Gen-4.5 模型在 Video Arena 盲测中击败了谷歌 Veo3 和 OpenAI Sora2Pro。核心护城河：采用自研时空混合 Transformer，让 AI 理解了物理世界的“因果律”（如重力、碰撞），大幅提升了视频生成的通过率，目前已开放全球商用。
1. 可灵 AI (Keling) O1 ：将“思维链”引入视频可灵 AI 发布 O1 视频大模型，首创将类似 LLM 的 Chain-of-Thought（思维链）引入视频生成。解决痛点：通过 MVL 统一架构先推理后生成，彻底解决了长镜头中的“特征漂移”（如主角中途换脸）问题。

信任危机：Perplexity 与 Gemini 的“诱饵调换” 与 DeepSeek 的降价形成鲜明对比，海外巨头正因“降本增效”遭遇信任危机：
- Perplexity 封号门：一名 Pro 用户因揭露其旗舰功能“深度研究”涉嫌虚假宣传（实际仅阅读少量来源且耗时极短）而被永久封禁。
- Gemini 3 动态降级：用户投诉付费的 Gemini 3 在处理长文档时，会自动“热切换”至廉价小模型，导致输出质量断崖式下跌。这表明在算力成本高企的当下，服务商正试图在后台牺牲体验以保利润。

英伟达发布 Alpamayo-R1：赋予自动驾驶“常识” 英伟达发布首个自动驾驶推理模型 Alpamayo-R1。不同于传统的感知模型，它基于 Cosmos-Reason 打造，具备类似人类的“常识推理”能力（例如预判遮挡物后的行人），代码已在 GitHub 开源。
英特尔开源 Gaudi 3 Linux 驱动为了在英伟达 CUDA 的包围圈中突围，英特尔宣布 Gaudi 3 AI 加速器的 Linux 内核驱动完全开源，旨在通过社区力量优化底层算力效率。

HuggingFace Omni Router x Claude Code： HuggingFace 将 Arch-Router 集成至 Claude Code，实现了“模型层面的负载均衡”——自动根据你的代码任务（Python 还是 C++）将请求路由给最擅长的模型（如 Grok 或 Mistral）。
CAELION 认知架构：一种新型的“人机协同”架构，旨在通过共享记忆和分布式决策，实现真正的混合集体智能。
野性实验：进化 AI：社区涌现激进构想——将带有痛觉反馈的机器人投入极端环境（高温、酸液），试图通过物理世界的优胜劣汰“进化”出 AI 的潜意识。