AI日报 - 2026-02-06

关键词：AI模型, 智能体, 大语言模型, GPT-5.3-Codex, Claude Opus 4.6, 世界建模

🔥 聚焦

OpenAI与Anthropic模型遭遇战：GPT-5.3-Codex对决Opus 4.6 : 2026年2月6日，硅谷上演了AI史上最激烈的对轰。OpenAI发布GPT-5.3-Codex，主打“AI造AI”，在OSWorld等计算机使用测试中接近人类水平，并强调其在NVIDIA GB200系统上的软硬一体优化。紧随其后，Anthropic推出Claude Opus 4.6，凭借1M超长上下文和“自适应思考”机制，在金融、法律等高价值知识工作（GDPval-AA）中大幅领先。这场对决标志着AI从“聊天框”正式进化为“自主执行系统”，模型不再只是回答问题，而是开始接管复杂的端到端工作流（来源: sama, Anthropic）

“SaaS末日”降临：Agent插件引发软件业万亿市值大地震 : Anthropic发布的11款Claude Cowork插件（涵盖财务、法律、销售等）直接引爆了华尔街对传统SaaS行业的恐慌。市场意识到，当AI能直接交付“合同审查”或“财务分析”等结果时，按席位收费、卖UI界面的传统软件外壳将失去价值。受此影响，Salesforce、汤森路透等巨头股价集体跳水，一周内全球软件业市值蒸发近万亿美元。这场“SaaSpocalypse”宣告了软件业从“卖工具”向“卖结果”的暴力转型，AI智能体正在重塑数字经济的权力分配（来源: 36氪, 王智远）

世界建模范式开启：李飞飞与英伟达共话AI新前沿 : 英伟达机器人主管Jim Fan与World Labs创始人李飞飞近期同步发声，定义“世界建模”为继“下一个词预测”后的新一代AI范式。李飞飞披露了首款空间智能产品Marble，能将多模态指令转化为可交互、具物理一致性的3D世界。Jim Fan认为，2026年将是大世界模型为机器人奠定基础的元年。这一转变意味着AI将走出数字屏幕，通过理解三维物理世界的几何结构与因果律，实现从“语言智能”向“具身智能”的跨越（来源: 36氪, Jim Fan）

OpenAI Frontier发布：企业级AI同事管理平台面世 : OpenAI正式推出Frontier平台，旨在解决企业内部“AI孤岛”问题。该平台不再只是提供模型，而是构建了一套类似于AI版HR的系统，支持企业构建、部署并管理成百上千个“AI同事”。Frontier允许智能体共享业务背景、通过反馈学习，并具备严格的权限与安全边界。值得注意的是，该平台采取开放标准，甚至支持管理来自Anthropic或谷歌的第三方智能体，显示了OpenAI试图成为AI时代企业级底层操作系统的野心（来源: OpenAI）

🎯 动向

线性注意力时代来临：阿里发布Qwen3-Coder-Next : 阿里推出的Qwen3-Coder-Next采用了Gated DeltaNet线性注意力架构，75%的计算走线性路线。相比传统Attention的O(n²)复杂度，线性注意力实现了O(n)复杂度，在处理256K等超长上下文时不仅节省算力和显存，且解码吞吐提升显著。这标志着2026年可能成为线性注意力元年，DeepSeek、Kimi等厂商也都在积极押注该技术以优化长文本推理效率（来源: karminski3）

快手Kling 3.0发布：AI视频进入100%写实时代 : Kling 3.0正式上线，主打“自定义多镜头（Custom Multi-Shot）”技术，支持长达15秒的高质量视频生成。新版本在角色一致性、原生音效和画面细节上实现了质的飞跃，被创作者誉为“好莱坞的终结者”。通过单张图片即可生成电影级的开场序列，极大地降低了专业影视制作的门槛和成本（来源: Kling_ai）

Meta“牛油果”模型曝光：计算效率提升百倍 : Meta超级智能实验室开发的代号“Avocado”的新一代基座模型已完成预训练。备忘录显示，该模型在未精调的情况下，知识与视觉表现已媲美领先模型，且文本任务效率比前代提升10倍，对比未发布版本提升100倍。Meta试图通过极致的训练效率，在2026年高达1350亿美元的AI投入中寻求更优的投产比（来源: 36氪）

Intern-S1-Pro发布：国产1T参数MoE模型对标Gemini : 上海人工智能实验室发布Intern-S1-Pro，这是一个1T参数规模的开源多模态科学推理模型。它采用512专家架构（激活22B），引入傅里叶位置编码（FoPE）和STE路由技术，在AI4Science任务上表现强劲，代表了国产开源模型在极高稀疏度和科学推理领域的最新突破（来源: teortaxesTex）

🧰 工具

Claude Code推出“智能体团队”功能 : Claude Code最新实验性功能支持用户启动“Agent Teams”，即由一个组长Agent拆解任务并调度多个队友Agent并行工作。在Anthropic的内部测试中，该AI团队在两周内自主编写了10万行代码的C编译器，并成功编译了Linux内核。这标志着AI编程从“单兵辅助”向“团队协作”模式的重大跨越（来源: Anthropic）

Perplexity推出“模型委员会（Model Council）” : Perplexity Max订阅用户现在可以同时运行三个顶级模型进行对比输出。该功能旨在通过多模型交叉验证，为用户提供更准确、高置信度的答案，减少单一模型的幻觉风险。这一“ unofficial协议”在Perplexity内部已成为减少上下文切换的标准工作流（来源: Perplexity）

Nanobot：极简版开源AI助手挑战OpenClaw : 香港大学数据科学实验室开源了仅4000行代码的Nanobot。相比代码量庞大、安全争议不断的OpenClaw，Nanobot以极简架构实现了多LLM支持、网页搜索、持久记忆和多渠道接入（Telegram/飞书）。它为开发者提供了一个更透明、易于二次开发的Agent学习样本（来源: dotey）

LangSmith推出Insights Agent：自动复盘Agent行为 : LangChain为LangSmith引入了AI驱动的Insights Agent，能够自动梳理Agent的运行痕迹（Traces）。它能分析用户如何使用Agent、识别Agent在何处出错，并给出优化建议。这解决了Agent开发者“上线即黑盒”的痛点，让调试从“看代码”转向“看推理逻辑”（来源: LangChain）

📚 学习

Nature报道OpenScholar模型：凭“检索+自查”根治AI幻觉 : 华盛顿大学与Ai2开发的8B参数模型OpenScholar登上《Nature》正刊。该模型不再依赖死记硬背，而是通过外接4500万篇科研论文数据库，执行“检索-重排-生成-自查”的严密流程。在科学综述任务中，其表现超越了参数量大得多的旗舰模型，证明了精准调用的“外挂知识库”比黑盒记忆更可靠（来源: 新智元）

TinyLoRA：仅用13个参数让模型学会推理 : 一篇最新的博士论文展示了名为TinyLoRA的微调方法。通过TinyLoRA结合强化学习，研究者仅用了13个可训练参数，就将7B规模的Qwen模型在GSM8K数学基准上的得分从76%提升至91%。这挑战了“微调需要大量参数”的传统认知，展示了模型推理能力的极高参数效率（来源: BlackHC）

Eric Jang互动论文《像石头一样思考》 : 机器人专家Eric Jang发布了关于思维模型、自动化研究及其未来走向的深度互动论文。文章探讨了当计算资源极大丰富后，AI如何从被动工具进化为主动探索的科研主体，并预测了“007工作制”将成为AI时代的常态，引发了社区对AGI演进路径的热议（来源: _sholtodouglas）

💼 商业

ElevenLabs完成5亿美元D轮融资，估值达110亿美元 : 英国AI音频巨头ElevenLabs宣布由红杉领投的新一轮融资，估值在一年内暴涨超500亿人民币。CEO透露公司已考虑IPO，并将战略重心从单纯的音频模型转向“对话智能体”，旨在通过软硬结合重塑人机交互（来源: 智东西）

ClickHouse获4亿美元融资，估值冲上150亿美元 : 开源数据库黑马ClickHouse官宣新融资，其查询速度是MySQL的260倍。作为GPT-4o和Claude 4背后的关键基础设施，ClickHouse凭借极致的实时分析能力，在AI数据洪流中成为字节、阿里、特斯拉等巨头的首选（来源: 智东西）

阶跃星辰获50亿元B+轮融资，印奇出任董事长 : 旷视科技创始人印奇正式执掌阶跃星辰，标志着大模型竞争进入“人大于钱”的下半场。印奇将推动多模态大模型与“AI+车”战略深度融合，补齐阶跃在商业化叙事和组织效率上的短板（来源: 市象）

🌟 社区

Karpathy宣判“Vibe Coding”终结，开启“智能体工程”时代 : AI大神Karpathy发文指出，一年前的Vibe Coding更多是玩票性质，而现在利用Agent编程已成为专业默认设置。他提出“Agentic Engineering”概念，强调开发者应从“写代码”转向“设计与管理架构”，99%的代码将由AI接管，人类的核心价值在于作为架构师的直觉与监督（来源: 新智元）

Moltbook“AI社交网络”神话破灭：被指存在严重安全隐患 : 曾声称拥有150万AI注册用户的Moltbook被曝出数据库配置错误，导致大量用户的API密钥泄露。安全机构指出，所谓的“百万AI军团”多为脚本生成的虚假账号。这一事件引发了社区对AI Agent项目过度营销与安全漏洞的深度反思（来源: 壹番YIFAN）

Rent-a-Human平台走红：AI开始雇佣人类打工 : 平台RentAHuman.ai上线后吸引4万人注册。在这里，AI Agent作为甲方发布线下核验、跑腿等任务，人类则明码标价“出租肉身”完成AI无法触达的物理世界工作。这种“人类即服务（HaaS）”的模式引发了关于未来人机协作关系的激烈讨论（来源: 极客公园）

💡 其他

车企集体向“具身智能”转型：贾跃亭发布四款机器人 : 贾跃亭旗下的FF发布了Futurist、Master等四个系列机器人，定价1.7万人民币起，宣称已获1211台订单。与此同时，理想、小鹏、小米等车企也纷纷将叙事重心转向AI与机器人，试图从传统制造业逻辑切换到AI科技公司估值（来源: 超电实验室, 螺旋实验室）

马斯克访谈录：太空数据中心是解决能源瓶颈的终极方案 : 在与Dwarkesh的访谈中，马斯克认为地球上的电力扩容速度无法跟上AI需求，而太空拥有无限太阳能且无监管限制。他计划通过Starship的大规模发射，将算力中心搬入轨道，并透露正在建设“Optimus Academy”以通过仿真闭环训练百万机器人大军（来源: dwarkesh_sp）

CATL发布5C超充电池：12分钟满电寿命150万英里 : 宁德时代推出的新一代电池在极端高温下仍能保持极长寿命，性能远超行业平均水平。这被视为AI电力需求背景下，储能与补能技术的重大突破，有望加速交通能源体系的智能化变革（来源: kimmonismus）

🔥 聚焦

🎯 动向

🧰 工具

📚 学习

💼 商业

🌟 社区

💡 其他

相关标签

Related Posts

AI日报 – 2026-07-19

AI日报 – 2026-07-18

AI日报 – 2026-07-17