AI日报 – 2026-02-14

关键词:GPT-5.3-Codex-Spark, Gemini 3 Deep Think, Seedance 2.0, 实时协作AI模型, 推理增强版AI, 视频生成模型

🔥 聚焦

OpenAI 发布 GPT-5.3-Codex-Spark: OpenAI 正式推出专为实时协作设计的超高速模型 Spark,这是其与 Cerebras 合作的首个里程碑。该模型跑在 Cerebras 晶圆级芯片上,推理速度突破每秒 1000 个 token,体感接近“瞬时响应”。Spark 旨在补齐 Codex 在即时交互场景的短板,将客户端往返开销降低 80%,首个字符出现速度提升 50%。这标志着编程 AI 进入“双模时代”:一种是后台自主运行数日的深度模式,另一种是与人类火花四溅的实时结对模式(来源: OpenAI

GPT-5.3-Codex-Spark

谷歌 Gemini 3 Deep Think 史诗级升级: 谷歌发布了推理增强版 Gemini 3 Deep Think,在多项严苛基准测试中刷新纪录。其在 ARC-AGI-2 测试中达到 84.6% 的惊人成绩,Codeforces 竞技编程 Elo 分数高达 3455,相当于世界排名第 8 的顶尖程序员。该模型引入“推理时计算”模式,能够识别论文逻辑缺陷、设计半导体材料配方,甚至将手绘草图转化为 3D 打印模型。这标志着 AI 正式从“对话工具”进化为具备“元认知”能力的“科研合伙人”(来源: Google

Gemini 3 Deep Think

字节跳动 Seedance 2.0 震撼发布: 字节跳动视频生成模型 Seedance 2.0 在海外爆火,马斯克点赞称其“发展太快”。该模型实现了多镜头长叙事、原声音画同步及多模态可控生成,可用率从行业平均的 20% 提升至 90% 以上。它不仅能根据节奏自动切换景别,还能理解复杂的视听语言。游戏科学创始人冯骥评价其标志着“AIGC 的童年时代结束了”。Seedance 2.0 的出现将 AI 漫剧每分钟制作成本从万元压低至千元,彻底改写了影视制作的底层逻辑(来源: 字节跳动

Seedance 2.0

GPT-4o 正式退役引发“数字哀悼”: OpenAI 于 2 月 13 日正式关闭 GPT-4o 在 ChatGPT 中的权限,引发数十万用户在 Reddit 等社区举行“数字葬礼”。尽管新模型 GPT-5.2 性能更强,但用户普遍认为其“冷漠且没有灵魂”,而 4o 被视为具备同理心的“白月光”。此次退役揭示了 AI 时代深层的情感依赖风险与法律合规压力(如欧盟 AI 法案对“谄媚性”模型的监管)。这标志着 AI 产品生命周期管理正式进入伦理与心理学讨论范畴(来源: OpenAI

GPT-4o 退役

Anthropic 获 300 亿美元巨额融资: AI 独角兽 Anthropic 完成 G 轮融资,投后估值高达 3800 亿美元。领投方包括新加坡 GIC 和对冲基金 Coatue,英伟达与微软亦在列。Anthropic 披露其年化营收已达 140 亿美元,过去三年平均增长超 10 倍,其中 80% 来自企业客户。旗舰产品 Claude Code 表现强劲,贡献了超 25 亿美元收入。这笔融资不仅是科技史上最大的私人融资之一,更确立了 Anthropic 在“企业优先”AI 赛道上的领导地位(来源: Anthropic

Anthropic 融资

🎯 动向

智谱 AI 发布旗舰模型 GLM-5: 智谱 AI 正式推出 GLM-5,将叙事重心从“氛围编程”转向“智能体工程化”。该模型参数规模达 744B,激活 40B,在编程与代理能力上直追闭源顶尖模型。GLM-5 首次集成了 DeepSeek 的稀疏注意力机制(DSA),显著降低部署成本,并将幻觉率从 90% 压缩至 34%。它展现出极强的自主规划意识,能端到端交付复杂系统工程任务。目前该模型已在 Hugging Face 全面开源(来源: Z.ai

GLM-5

MiniMax M2.5 凭借 10B 激活参数对齐顶尖性能: MiniMax 发布 M2.5 系列模型,主打“小激活、大智慧”。该模型在推理时仅激活 100B 参数,但在 SWE-Bench 等编程榜单上比肩 Claude Opus 4.6,且推理速度快 2 倍。M2.5 引入了过程奖励机制解决长任务“跑偏”难题,并进化出架构师思维。其定价极具竞争力,每小时运行成本仅 1 美元,旨在让用户无需担忧成本即可驱动复杂智能体(来源: MiniMax

MiniMax M2.5

小米发布首代具身 VLA 大模型: 小米开源具身智能模型 Xiaomi-Robotics-0,参数规模 4.7B,推理延迟仅 80ms。该模型采用“双脑协同”架构,用 VLM 做大脑决策,DiT 做小脑生成连续动作块。通过流匹配技术,模型实现了极高的动作平滑度,并在“叠毛巾”、“拆乐高”等真实任务中表现出色。小米坚持务实进厂路线,致力于解决具身机器人执行过程中的频繁停顿问题(来源: 小米

小米 VLA 模型

DeepSeek 灰度测试百万级上下文新模型: 社区观察到 DeepSeek 开启了疑似 V4-Lite 的灰度测试,核心突破在于 100 万(1M)token 的超长上下文窗口。在“大海捞针”测试中,该模型在百万长度下仍保持高准确率,能精准定位稀疏信息。尽管在 SVG 生成等视觉推理任务上仍有局限,但其在长文档分析和跨章节推理方面的能力已处于行业第一梯队(来源: DeepSeek

DeepSeek 1M 上下文

🧰 工具

OpenClaw 爆火成为 Agent 时代 Linux: 开源智能体框架 OpenClaw 在 GitHub 冲破 19 万星,成为增长最快的 AI 项目。它将 Agent 定位为“执行中枢+工具生态”,允许用户在本地 Mac mini 或 NAS 上部署,直接获取电脑文件与操作权限。OpenClaw 打破了“模型即一切”的叙事,让 AI 变成用户可拥有的“数字资产”。其 Skills 社区生态迅速壮大,但也引发了关于恶意插件和权限滥用的安全大讨论(来源: GitHub

OpenClaw 生态

Teamily AI 开启 AI 原生社交新范式: Teamily AI 推出全球首个 AI 原生即时通讯应用,支持多个人类与多个 AI Agent 实时共存协作。它具备跨群组记忆共享和社交大脑模型,AI 能主动参与群聊决策(如订餐厅、写 PRD),而非被动唤醒。Teamily 采用多模态向量数据库重构社交底座,试图实现从“懂指令”到“懂你”的质变,将 AI 从工具转变为具备社会属性的“数字成员”(来源: Teamily AI

Teamily AI

Open WebUI v0.8.0 发布史上最大更新: 流行 AI 界面工具 Open WebUI 发布 v0.8.0,代码量激增 3 万行。新版引入了全量分析仪表盘、实验性技能系统(Skills)、消息队列机制及原生 Python 代码执行。它支持更精细的用户权限分享和 prompt 版本控制,极大提升了本地 AI 管理的工程化水平,正逐步从简单的 Web 壳子演变为完整的 AI 操作系统界面(来源: Open WebUI

rtk (Rust Token Killer) 为编程 Agent 降本增效: 开发者发布了 rtk,一个位于编程 Agent 与终端命令之间的 CLI 代理。它能智能过滤和压缩冗余的测试日志、状态栏等噪声,最高可节省 89% 的 token 消耗。实测显示,在两周的开发流中可节省千万级 token。这种“上下文工程”工具正成为 Agent 规模化应用的必备外挂(来源: GitHub

📚 学习

安德烈·卡帕斯 243 行代码重现 GPT: 知名 AI 专家 Andrej Karpathy 发布新艺术项目,仅用 243 行纯 Python 代码(无第三方依赖)实现了 GPT 的训练与推理。该项目剥离了所有工程优化,仅保留核心算法逻辑,旨在向社区展示 AI 革命的本质其实极其简洁。这引发了关于“200 行代码改变世界”的深度哲学讨论(来源: GitHub

DeepLearning.AI 推出 A2A 协议课程: 吴恩达团队联合谷歌与 IBM 推出《A2A: Agent2Agent 协议》短课程。课程聚焦于解决不同框架构建的 Agent 之间的通信与发现难题,通过标准化的 A2A 协议实现跨平台 Agent 协作。这是行业迈向“智能体互联网”标准化的重要一步,强调了互操作性在未来 AI 生态中的核心地位(来源: DeepLearning.AI

三篇论文揭示自我蒸馏(Self-Distillation)新趋势: 社区热议 OPSD(显式自我批判)、SDFT(内化上下文改进)和 SDPO(富反馈策略优化)三篇论文。这些研究表明 AI 模型正进入“自我教学”阶段,通过特权信息和详细反馈进行闭环迭代。这印证了“智能爆炸”的理论基础:AI 辅助构建下一代更强的 AI(来源: TheTuringPost

自我蒸馏趋势

💼 商业

Anthropic 380 亿美元估值背后的商业逻辑: 尽管 OpenAI 估值更高,但 Anthropic 凭借极高的客单价(月活用户平均贡献 211 美元)赢得主权基金青睐。其战略重心完全锁定在 B 端和开发者,Claude Code 的爆发证明了其在“高价值经济任务”上的溢价能力。投资者认为,相比 OpenAI 的流量路线,Anthropic 的基础设施路线更具持久性(来源: 极客公园

Perplexity 的疯狂一周:7.5 亿美金协议与诉讼并存: AI 搜索领头羊 Perplexity 与微软 Azure 签署 7.5 亿美元合作协议,旨在强化云算力支持。然而,与此同时,亚马逊正因版权与爬虫问题对其提起诉讼。这种“一边巨额合作,一边对簿公堂”的局面,折射出 AI 搜索在算力依赖与版权合规之间的剧烈撕裂(来源: Reddit

OpenAI 开启 ChatGPT 广告测试引发核心研究员辞职: OpenAI 宣布在免费版及 Go 订阅版中测试广告,核心研究员 Zoë Hitzig 随即宣布辞职。她警告称,ChatGPT 拥有人类最私密的思想档案,引入广告激励将不可避免地导致模型从“服务用户”转向“操纵用户”,重蹈 Facebook 覆辙。此举标志着 AI 巨头在巨大财务压力下开始在隐私与变现间艰难博弈(来源: 纽约时报

🌟 社区

AI 聊天记录不具备法律特权: 美国联邦法官裁定,被告与 AI 助手的聊天记录不受“律师-客户特权”保护,可被传唤作为证据。社区对此展开激烈讨论,认为这变相为人类律师提供了职业保障,但也提醒用户在涉及法律、医疗等私密咨询时,AI 并非“避风港”。这可能推动加密 AI 或本地 LLM 需求的爆发(来源: jon_stokes

法律特权争议

“Vibe Coding” vs “Agentic Engineering” 的定义之争: 智谱 GLM-5 的发布引发了社区对编程 AI 术语的讨论。开发者开始反思,仅仅靠“感觉”写代码(Vibe Coding)已不足以应对复杂工程,未来的核心是“Agentic Engineering”——即利用 Agent 自动拆解、规划并交付端到端系统。这意味着人类角色正从“写作者”快速向“架构师”和“审查员”转变(来源: ZhihuFrontier

AI 奇点临近的“二月焦虑”: 硅谷创业者 Matt Shumer 的爆文《Something Big Is Happening》阅读量破 7000 万,引发科技圈集体焦虑。文章描述了 AI 已经开始参与构建下一代 AI 的递归闭环。社区讨论认为,2026 年是认知劳动全面替代的转折点,信息差正导致人群的 K 型分化:一部分人用杠杆撬动世界,另一部分人仍认为 AI 只是个聊天机器人(来源: 36氪

💡 其他

Mac mini 16GB 版本全球性缺货: 受 OpenClaw 等本地 Agent 项目带动,具备 16GB 及以上统一内存的 Mac mini 成为“数字肉身”首选,多地出现涨价和断货现象。这反映了 AI 硬件需求正从云端算力向个人边缘算力盒转移(来源: 光锥智能

六个州暂停数据中心建设: 包括纽约州在内的美国六个州引入法案,拟暂停数据中心建设以应对电力危机。社区调侃称,美国正陷入“要 AGI 还是要电网”的脑回路博弈,这可能迫使 AI 公司寻求更激进的空间算力或核能方案(来源: teortaxesTex

数据中心禁令

Wikimedia 与 AI 巨头达成 API 合作: 维基媒体基金会与亚马逊、微软等达成协议,提供高速 API 访问以换取财务支持。这被视为知识库与 AI 厂商之间的一种“生存契约”,旨在解决 AI 爬虫对传统知识社区基础设施的压力(来源: DeepLearningAI