AI日报 – 2026-02-11

关键词:AI视频, 智能体革命, 大模型, Seedance 2.0, OpenClaw, GLM-5架构

🔥 聚焦

字节跳动发布Seedance 2.0:AI视频进入“叙事逻辑”时代 : 字节跳动正式发布Seedance 2.0视频模型,标志着AI视频从OpenAI Sora式的“物理模拟派”向“叙事逻辑派”的范式转移。该模型不再执着于完美的物理反馈,而是通过自分镜和自运镜技术,让AI具备导演思维,支持音画同步生成和极高的人物一致性。Tim(影视飓风)等博主实测认为其在运镜和叙事连贯性上具有质的飞跃。字节计划在2026年投入1600亿元用于AI基建,试图利用抖音生态的“网感”数据,在视频赛道实现对OpenAI的平视甚至超越(来源:36氪

字节跳动发布Seedance 2.0

OpenClaw(小龙虾)引爆个人智能体革命 : 由独立开发者Peter Steinberger发起的开源项目OpenClaw(原名Clawdbot)在GitHub狂揽17万星标。它通过获取系统权限,让AI能够直接操作用户的电脑、处理文件并具备基于Markdown的长期记忆。社区掀起了“Mac mini隔离部署”热潮,将其视为通往AGI的初级阶段。尽管其主动性(心跳机制)和执行力令人惊艳,但随之而来的隐私泄露、误删文件及恶意插件风险也引发了安全界对“高权限代理”控制权的激烈辩论(来源:新智元

OpenClaw引爆个人智能体革命

GPT-5.3-Codex vs Claude Opus 4.6:编程模型巅峰对决 : OpenAI与Anthropic在编程领域展开正面硬刚。GPT-5.3-Codex在WeirdML等推理榜单上表现强劲,用户量增长50%,被认为更像“高效承包商”,追求执行速度和确定性。而Claude Opus 4.6则被视为“资深合伙人”,在复杂UI设计和长逻辑分析中更具连贯性,但其极高的Token消耗(平均32k)和昂贵的“快速模式”也引发了用户对成本的吐槽。目前两者在GitHub提交量中的占比正在快速重塑软件开发生态(来源:Reddit

GPT-5.3-Codex vs Claude Opus 4.6

智谱GLM-5架构细节曝光:DeepSeek同款稀疏注意力 : 智谱AI下一代旗舰模型GLM-5的架构细节通过vLLM的PR申请流出。GLM-5总参数量达745B,采用类似DeepSeek-V3的MLA(多头潜在注意力)和DSA(稀疏注意力)机制,支持200k上下文。社区普遍认为OpenRouter上表现惊艳的匿名模型“Pony Alpha”即为GLM-5的测试版。该模型在创意写作和逻辑推理上的出色表现,带动智谱相关概念在资本市场连续大涨(来源:量子位

智谱GLM-5架构细节曝光

🎯 动向

OpenAI正式在ChatGPT中测试广告功能 : OpenAI宣布在美国地区的免费版及Go版用户中测试广告,以支持庞大的算力开支。广告以“赞助内容”链接形式出现,OpenAI承诺广告不会干预模型回答的独立性,且对话内容不会共享给广告主。此举遭到Anthropic在超级碗广告中的公开嘲讽,后者坚持“AI对话不应有广告”。这标志着大模型商业化路径正式分化为“广告流量派”与“纯净订阅派”(来源:36氪

OpenAI正式在ChatGPT中测试广告功能

阿里千问接入零售生态,开启AI购物压力测试 : 阿里千问App通过“春节30亿大免单”活动,将AI助手深度融入淘宝、饿了么、高德等生活场景,上线9小时订单量破千万。这不仅是一次营销,更是对“AI驱动的下一代消费OS”的压力测试。市场观察认为,阿里正利用全栈AI能力(芯片+云+模型)构建类似谷歌的闭环生态,通过AI直接介入交易环节,试图重定义电商入口(来源:36氪

阿里千问接入零售生态

Kimi K2.5海外收入反超国内,主打“工程稳定性” : 月之暗面披露Kimi海外收入已超越国内,付费用户增长4倍。Kimi K2.5凭借在长上下文下的极高记忆稳定性和对OpenClaw等Agent框架的友好支持,成为海外开发者首选的国产模型。杨植麟表示公司账面现金超100亿,短期不急于上市,将重心转向“Anthropic+Manus”式的生产力智能体布局(来源:36氪

Kimi K2.5海外收入反超国内

字节发布Seedream 5.0:支持检索生图与4K增强 : 继视频模型后,字节图像模型Seedream 5.0上线。新版本首次支持联网知识整合生图,显著提升了对复杂提示词的理解和文本渲染能力。尽管在艺术感上仍略逊于谷歌Nano Banana Pro,但其在信息图生成、多子图一致性及中文语义理解上的实用性大幅增强,正从“艺术玩具”向“生产力工具”进化(来源:36氪

字节发布Seedream 5.0

xAI联合创始人吴宇怀离职,核心团队持续动荡 : 马斯克旗下xAI的5位华人创始成员之一吴宇怀宣布离职。吴曾师从辛顿,主导了Grok 3在数学推理上的突破。这是继杨格(因病离职)后,xAI在一个月内流失的第二位华人联创。外界猜测离职可能与SpaceX收购xAI后的架构重组有关,这为马斯克构建“世界模拟器”的宏大愿景增添了人才流失的隐忧(来源:智东西

xAI联合创始人吴宇怀离职

🧰 工具

Cursor发布Composer 1.5:强化学习驱动的端到端编码 : Cursor推出的Composer 1.5模型通过20倍规模的强化学习训练,在智能与速度间取得了新平衡。它引入了“自摘要”能力,能在上下文耗尽时自动提炼关键逻辑,支持更长周期的工程开发。开发者反馈其在处理复杂Bug修复时比GPT-5.2更具前瞻性,已成为许多硅谷工程师的每日主力(来源:ZhaiAndrew

Cursor发布Composer 1.5

Skywork Desktop:首个支持Windows的系统级AI助手 : 昆仑天工推出的Skywork Desktop填补了Anthropic Cowork暂无Windows版的空白。它深度集成于操作系统,能自动分析本地文件、重命名设计稿,并预置了100多个精选Skill(如视频下载、文档转换)。该工具支持自由切换调用Gemini、Claude等主流模型,为Windows办公族提供了真正的“数字员工”体验(来源:op7418

Skywork Desktop

LobsterX:基于LlamaIndex的文档处理智能体 : LlamaIndex推出的LobsterX是针对文档工作流优化的OpenClaw变体。它利用LlamaCloud进行高精度文档解析,能从带扫描件和复杂图表的PDF中提取100%准确的上下文。为保证安全,它运行在AgentFS虚拟文件系统上,防止AI执行危险的Shell指令,是处理企业级敏感文档的理想方案(来源:jerryjliu0

Transformers.js v4发布:WebGPU加速实现100%本地AI : Hugging Face发布Transformers.js v4预览版,采用全新C++编写的WebGPU运行时。它支持在浏览器、Node.js、Deno中直接运行GPT-OSS 20B等大型模型,速度提升达4倍。该更新实现了真正的全离线支持,让开发者能构建不依赖云端API、隐私极度安全的AI应用(来源:HuggingFace

Transformers.js v4发布

Izwi:基于Rust的本地语音推理引擎 : Izwi是一个完全运行在本地的音频AI栈,支持TTS、ASR及语音克隆。它利用Rust(Candle/MLX)实现Apple Silicon硬件加速,提供OpenAI兼容接口。对于追求极致隐私和低延迟的语音交互开发者来说,Izwi提供了一个无需数据离机的SOTA级解决方案(来源:Reddit

Izwi

📚 学习

Recursive Language Models (RLM):2026年的新范式 : 论文《Recursive Language Models》提出让模型将自身Prompt视为外部可操作对象,通过递归调用实现无限长上下文处理。实验证明,RLM在处理如《科学怪人》全书角色提取等超长任务时,表现远超传统编码Agent。这种“自引用”机制被认为将开启从“推理模型”向“递归模型”的跨越(来源:lateinteraction

RLM

InftyThink+:通过迭代摘要实现无限视界推理 : 针对长链条思维(CoT)成本随长度指数增长的问题,InftyThink+框架教模型在推理过程中进行“分段总结”。模型在每个阶段生成自我总结并清空冗余上下文,从而在保持推理深度(AIME24准确率提升21%)的同时,将推理延迟降低32.8%,实现了计算成本与推理长度的脱钩(来源:dair_ai

InftyThink+

F-GRPO:防止强化学习中的“平庸化” : 针对RLVR(带验证奖励的强化学习)中大组采样成本过高导致模型偏向平庸解的问题,F-GRPO引入了难度感知的优势缩放系数。它通过下调高成功率提示的权重,强迫模型关注稀有且正确的解法,在不增加算力的情况下显著提升了Qwen2.5等模型在复杂数学任务上的表现(来源:_akhaliq

F-GRPO

STLE框架:教AI学会说“我不知道” : 针对AI普遍存在的“过度自信”和幻觉问题,STLE框架利用集值理论明确建模知识边界。通过计算“可达性”得分,AI在面对未见过的医疗或驾驶场景时能明确给出“仅40%确信”的反馈并主动移交人工处理。实验显示其在OOD(分布外)检测上达到了67%的准确率(来源:Reddit

STLE框架

AgentArk:将多智能体辩论能力蒸馏至单模型 : 研究表明多智能体辩论能提升逻辑,但推理成本随Agent数量线性增长。AgentArk通过离线运行多Agent辩论生成高质量推理轨迹,再将其蒸馏至Qwen3等单模型中。这种方法让单模型在数学和TruthfulQA任务上获得了4.8%至30%的性能提升,实现了“多Agent的智力,单Agent的成本”(来源:dair_ai

AgentArk

💼 商业

SpaceX正式官宣收购xAI,马斯克构建AI+航天闭环 : 马斯克宣布SpaceX完成对xAI的收购,旨在将Grok的推理能力深度集成于星舰设计、火星殖民规划及星链网络优化。此次合并使xAI获得了更稳定的算力与资金支持,同时也引发了关于“AI驱动的硬科技帝国”垄断地位的广泛讨论(来源:menhguin

法律AI独角兽Harvey融资2亿美元,估值达110亿美元 : Harvey AI正以110亿美元的估值进行新一轮融资,其ARR已达1.9亿美元,服务超过10万名律师。Harvey的成功证明了垂直领域Agent在解决高价值、高流程化任务上的巨大商业潜力,也预示着传统SaaS模式正向“Agent代劳”模式转型(来源:Dorialexander

Harvey AI

穹彻智能获数亿元融资,加速具身大脑规模化落地 : 国内具身智能企业穹彻智能完成A轮融资,由C资本领投。其核心产品Noematrix Brain已在智慧药房、酒店洗衣房等场景实现闭环部署。公司通过自研外骨骼设备积累了数十万小时真机数据,正试图通过“数据-模型-场景”的闭环,在物理AI赛道卡位(来源:36氪

穹彻智能

🌟 社区

AI疲惫(AI Fatigue)成为开发者共鸣话题 : 社区热议“AI提高了生产力,但我更累了”。开发者发现自己从“创造者”退化为“代码保姆”,需要处理AI生成的碎片化任务并进行无休止的逐行审查。这种非确定性带来的焦虑和决策疲劳,正促使行业反思:AI提效是否正在透支人类的精力上限(来源:36氪

AI疲惫

韩国国家AI赛事抄袭风波:6成企业套皮中国模型 : 韩国自主AI模型评选爆出丑闻,Upstage、SK电讯等多家晋级企业被指核心代码与智谱AI、DeepSeek、通义千问高度雷同。韩国网友对此“技术优越感碎一地”,该事件揭示了中等国家在追求“主权AI”时面临的技术空心化与对中美开源生态的深度依赖(来源:36氪

韩国国家AI赛事抄袭风波

Vibe Coding捞到第一桶金:00后大学生的致富经 : 社区出现大量“一人公司”神话,大学生通过Vibe Coding工具快速构建应用并利用账号共享赚取月入数万。虽然技术门槛降低,但社区也开始意识到“品味(Taste)”和“商业洞察”正成为新的过滤器,平庸的AI作品正迅速沦为数字垃圾(来源:36氪

Vibe Coding致富

Anthropic 2026趋势报告:程序员将转型为“指挥官” : Anthropic发布18页重磅报告,认为2026年是“智能体军团”元年。软件开发正经历图形界面以来最大的范式转移:工程师将从写代码转向编排AI Agent,非技术专家(如律师、HR)将通过自然语言直接构建复杂系统,编程将彻底民主化(来源:36氪

Anthropic 2026趋势报告

OpenClaw引发的“Mac mini”硬件溢价 : 随着OpenClaw的爆火,二手市场上的Mac mini(尤其是M4版本)价格应声上涨。极客们认为物理隔离是运行高权限Agent的唯一安全解法。这种“一机一Agent”的部署模式正成为AI发烧友的标准配置,甚至催生了专门的Agent专用硬件赛道(来源:36氪

💡 其他

MechaEpstein-8000:争议性的本地微调模型 : 开发者利用爱泼斯坦公开邮件训练了一个名为MechaEpstein的Qwen3-8B微调模型,并发布在HuggingFace上。该模型能模拟特定人物的对话风格,引发了社区关于“数字生命”伦理、数据版权以及AI是否应被允许模拟争议性真实人物的激烈讨论(来源:karminski3

MechaEpstein

GeoSpy AI:照片泄露地理位置引发隐私恐慌 : 一款名为GeoSpy的AI工具能通过社交媒体照片的微小细节(如植被、建筑风格)精准定位拍摄者的坐标。尽管在寻人等方面有益,但社区对其沦为大规模监控工具表示极大担忧,再次敲响了AI时代个人生物及环境信息隐私的警钟(来源:Reddit

GeoSpy AI

Isaac Newton与AI的跨时空关联 : 社区热议“所有未来进步归于AI,但AI归于牛顿”。讨论认为没有牛顿奠定的经典力学和微积分基础,现代物理和计算科学将不复存在。随着AI智商被预测将突破190,人类正面临“无限个牛顿”共同协作的新纪元(来源:Reddit