AI日报 - 2026-02-14

关键词：GPT-5.3-Codex-Spark, Gemini 3 Deep Think, Seedance 2.0, 实时协作AI模型, 推理增强版AI, 视频生成模型

🔥 聚焦

OpenAI 发布 GPT-5.3-Codex-Spark： OpenAI 正式推出专为实时协作设计的超高速模型 Spark，这是其与 Cerebras 合作的首个里程碑。该模型跑在 Cerebras 晶圆级芯片上，推理速度突破每秒 1000 个 token，体感接近“瞬时响应”。Spark 旨在补齐 Codex 在即时交互场景的短板，将客户端往返开销降低 80%，首个字符出现速度提升 50%。这标志着编程 AI 进入“双模时代”：一种是后台自主运行数日的深度模式，另一种是与人类火花四溅的实时结对模式（来源: OpenAI）

谷歌 Gemini 3 Deep Think 史诗级升级： 谷歌发布了推理增强版 Gemini 3 Deep Think，在多项严苛基准测试中刷新纪录。其在 ARC-AGI-2 测试中达到 84.6% 的惊人成绩，Codeforces 竞技编程 Elo 分数高达 3455，相当于世界排名第 8 的顶尖程序员。该模型引入“推理时计算”模式，能够识别论文逻辑缺陷、设计半导体材料配方，甚至将手绘草图转化为 3D 打印模型。这标志着 AI 正式从“对话工具”进化为具备“元认知”能力的“科研合伙人”（来源: Google）

字节跳动 Seedance 2.0 震撼发布： 字节跳动视频生成模型 Seedance 2.0 在海外爆火，马斯克点赞称其“发展太快”。该模型实现了多镜头长叙事、原声音画同步及多模态可控生成，可用率从行业平均的 20% 提升至 90% 以上。它不仅能根据节奏自动切换景别，还能理解复杂的视听语言。游戏科学创始人冯骥评价其标志着“AIGC 的童年时代结束了”。Seedance 2.0 的出现将 AI 漫剧每分钟制作成本从万元压低至千元，彻底改写了影视制作的底层逻辑（来源: 字节跳动）

GPT-4o 正式退役引发“数字哀悼”： OpenAI 于 2 月 13 日正式关闭 GPT-4o 在 ChatGPT 中的权限，引发数十万用户在 Reddit 等社区举行“数字葬礼”。尽管新模型 GPT-5.2 性能更强，但用户普遍认为其“冷漠且没有灵魂”，而 4o 被视为具备同理心的“白月光”。此次退役揭示了 AI 时代深层的情感依赖风险与法律合规压力（如欧盟 AI 法案对“谄媚性”模型的监管）。这标志着 AI 产品生命周期管理正式进入伦理与心理学讨论范畴（来源: OpenAI）

Anthropic 获 300 亿美元巨额融资： AI 独角兽 Anthropic 完成 G 轮融资，投后估值高达 3800 亿美元。领投方包括新加坡 GIC 和对冲基金 Coatue，英伟达与微软亦在列。Anthropic 披露其年化营收已达 140 亿美元，过去三年平均增长超 10 倍，其中 80% 来自企业客户。旗舰产品 Claude Code 表现强劲，贡献了超 25 亿美元收入。这笔融资不仅是科技史上最大的私人融资之一，更确立了 Anthropic 在“企业优先”AI 赛道上的领导地位（来源: Anthropic）

🎯 动向

智谱 AI 发布旗舰模型 GLM-5： 智谱 AI 正式推出 GLM-5，将叙事重心从“氛围编程”转向“智能体工程化”。该模型参数规模达 744B，激活 40B，在编程与代理能力上直追闭源顶尖模型。GLM-5 首次集成了 DeepSeek 的稀疏注意力机制（DSA），显著降低部署成本，并将幻觉率从 90% 压缩至 34%。它展现出极强的自主规划意识，能端到端交付复杂系统工程任务。目前该模型已在 Hugging Face 全面开源（来源: Z.ai）

MiniMax M2.5 凭借 10B 激活参数对齐顶尖性能： MiniMax 发布 M2.5 系列模型，主打“小激活、大智慧”。该模型在推理时仅激活 100B 参数，但在 SWE-Bench 等编程榜单上比肩 Claude Opus 4.6，且推理速度快 2 倍。M2.5 引入了过程奖励机制解决长任务“跑偏”难题，并进化出架构师思维。其定价极具竞争力，每小时运行成本仅 1 美元，旨在让用户无需担忧成本即可驱动复杂智能体（来源: MiniMax）

小米发布首代具身 VLA 大模型： 小米开源具身智能模型 Xiaomi-Robotics-0，参数规模 4.7B，推理延迟仅 80ms。该模型采用“双脑协同”架构，用 VLM 做大脑决策，DiT 做小脑生成连续动作块。通过流匹配技术，模型实现了极高的动作平滑度，并在“叠毛巾”、“拆乐高”等真实任务中表现出色。小米坚持务实进厂路线，致力于解决具身机器人执行过程中的频繁停顿问题（来源: 小米）

DeepSeek 灰度测试百万级上下文新模型： 社区观察到 DeepSeek 开启了疑似 V4-Lite 的灰度测试，核心突破在于 100 万（1M）token 的超长上下文窗口。在“大海捞针”测试中，该模型在百万长度下仍保持高准确率，能精准定位稀疏信息。尽管在 SVG 生成等视觉推理任务上仍有局限，但其在长文档分析和跨章节推理方面的能力已处于行业第一梯队（来源: DeepSeek）

🧰 工具

OpenClaw 爆火成为 Agent 时代 Linux： 开源智能体框架 OpenClaw 在 GitHub 冲破 19 万星，成为增长最快的 AI 项目。它将 Agent 定位为“执行中枢+工具生态”，允许用户在本地 Mac mini 或 NAS 上部署，直接获取电脑文件与操作权限。OpenClaw 打破了“模型即一切”的叙事，让 AI 变成用户可拥有的“数字资产”。其 Skills 社区生态迅速壮大，但也引发了关于恶意插件和权限滥用的安全大讨论（来源: GitHub）

Teamily AI 开启 AI 原生社交新范式： Teamily AI 推出全球首个 AI 原生即时通讯应用，支持多个人类与多个 AI Agent 实时共存协作。它具备跨群组记忆共享和社交大脑模型，AI 能主动参与群聊决策（如订餐厅、写 PRD），而非被动唤醒。Teamily 采用多模态向量数据库重构社交底座，试图实现从“懂指令”到“懂你”的质变，将 AI 从工具转变为具备社会属性的“数字成员”（来源: Teamily AI）

Open WebUI v0.8.0 发布史上最大更新： 流行 AI 界面工具 Open WebUI 发布 v0.8.0，代码量激增 3 万行。新版引入了全量分析仪表盘、实验性技能系统（Skills）、消息队列机制及原生 Python 代码执行。它支持更精细的用户权限分享和 prompt 版本控制，极大提升了本地 AI 管理的工程化水平，正逐步从简单的 Web 壳子演变为完整的 AI 操作系统界面（来源: Open WebUI）

rtk (Rust Token Killer) 为编程 Agent 降本增效： 开发者发布了 rtk，一个位于编程 Agent 与终端命令之间的 CLI 代理。它能智能过滤和压缩冗余的测试日志、状态栏等噪声，最高可节省 89% 的 token 消耗。实测显示，在两周的开发流中可节省千万级 token。这种“上下文工程”工具正成为 Agent 规模化应用的必备外挂（来源: GitHub）

📚 学习

安德烈·卡帕斯 243 行代码重现 GPT： 知名 AI 专家 Andrej Karpathy 发布新艺术项目，仅用 243 行纯 Python 代码（无第三方依赖）实现了 GPT 的训练与推理。该项目剥离了所有工程优化，仅保留核心算法逻辑，旨在向社区展示 AI 革命的本质其实极其简洁。这引发了关于“200 行代码改变世界”的深度哲学讨论（来源: GitHub）

DeepLearning.AI 推出 A2A 协议课程： 吴恩达团队联合谷歌与 IBM 推出《A2A: Agent2Agent 协议》短课程。课程聚焦于解决不同框架构建的 Agent 之间的通信与发现难题，通过标准化的 A2A 协议实现跨平台 Agent 协作。这是行业迈向“智能体互联网”标准化的重要一步，强调了互操作性在未来 AI 生态中的核心地位（来源: DeepLearning.AI）

三篇论文揭示自我蒸馏（Self-Distillation）新趋势： 社区热议 OPSD（显式自我批判）、SDFT（内化上下文改进）和 SDPO（富反馈策略优化）三篇论文。这些研究表明 AI 模型正进入“自我教学”阶段，通过特权信息和详细反馈进行闭环迭代。这印证了“智能爆炸”的理论基础：AI 辅助构建下一代更强的 AI（来源: TheTuringPost）

💼 商业

Anthropic 380 亿美元估值背后的商业逻辑： 尽管 OpenAI 估值更高，但 Anthropic 凭借极高的客单价（月活用户平均贡献 211 美元）赢得主权基金青睐。其战略重心完全锁定在 B 端和开发者，Claude Code 的爆发证明了其在“高价值经济任务”上的溢价能力。投资者认为，相比 OpenAI 的流量路线，Anthropic 的基础设施路线更具持久性（来源: 极客公园）

Perplexity 的疯狂一周：7.5 亿美金协议与诉讼并存： AI 搜索领头羊 Perplexity 与微软 Azure 签署 7.5 亿美元合作协议，旨在强化云算力支持。然而，与此同时，亚马逊正因版权与爬虫问题对其提起诉讼。这种“一边巨额合作，一边对簿公堂”的局面，折射出 AI 搜索在算力依赖与版权合规之间的剧烈撕裂（来源: Reddit）

OpenAI 开启 ChatGPT 广告测试引发核心研究员辞职： OpenAI 宣布在免费版及 Go 订阅版中测试广告，核心研究员 Zoë Hitzig 随即宣布辞职。她警告称，ChatGPT 拥有人类最私密的思想档案，引入广告激励将不可避免地导致模型从“服务用户”转向“操纵用户”，重蹈 Facebook 覆辙。此举标志着 AI 巨头在巨大财务压力下开始在隐私与变现间艰难博弈（来源: 纽约时报）

🌟 社区

AI 聊天记录不具备法律特权： 美国联邦法官裁定，被告与 AI 助手的聊天记录不受“律师-客户特权”保护，可被传唤作为证据。社区对此展开激烈讨论，认为这变相为人类律师提供了职业保障，但也提醒用户在涉及法律、医疗等私密咨询时，AI 并非“避风港”。这可能推动加密 AI 或本地 LLM 需求的爆发（来源: jon_stokes）

“Vibe Coding” vs “Agentic Engineering” 的定义之争： 智谱 GLM-5 的发布引发了社区对编程 AI 术语的讨论。开发者开始反思，仅仅靠“感觉”写代码（Vibe Coding）已不足以应对复杂工程，未来的核心是“Agentic Engineering”——即利用 Agent 自动拆解、规划并交付端到端系统。这意味着人类角色正从“写作者”快速向“架构师”和“审查员”转变（来源: ZhihuFrontier）

AI 奇点临近的“二月焦虑”： 硅谷创业者 Matt Shumer 的爆文《Something Big Is Happening》阅读量破 7000 万，引发科技圈集体焦虑。文章描述了 AI 已经开始参与构建下一代 AI 的递归闭环。社区讨论认为，2026 年是认知劳动全面替代的转折点，信息差正导致人群的 K 型分化：一部分人用杠杆撬动世界，另一部分人仍认为 AI 只是个聊天机器人（来源: 36氪）

💡 其他

Mac mini 16GB 版本全球性缺货： 受 OpenClaw 等本地 Agent 项目带动，具备 16GB 及以上统一内存的 Mac mini 成为“数字肉身”首选，多地出现涨价和断货现象。这反映了 AI 硬件需求正从云端算力向个人边缘算力盒转移（来源: 光锥智能）

六个州暂停数据中心建设： 包括纽约州在内的美国六个州引入法案，拟暂停数据中心建设以应对电力危机。社区调侃称，美国正陷入“要 AGI 还是要电网”的脑回路博弈，这可能迫使 AI 公司寻求更激进的空间算力或核能方案（来源: teortaxesTex）

Wikimedia 与 AI 巨头达成 API 合作： 维基媒体基金会与亚马逊、微软等达成协议，提供高速 API 访问以换取财务支持。这被视为知识库与 AI 厂商之间的一种“生存契约”，旨在解决 AI 爬虫对传统知识社区基础设施的压力（来源: DeepLearningAI）

🔥 聚焦

相关标签

Related Posts

AI日报 – 2026-07-20

AI日报 – 2026-07-19

AI日报 – 2026-07-18