AI日报 – 2026-02-06

关键词:AI模型, 智能体, 大语言模型, GPT-5.3-Codex, Claude Opus 4.6, 世界建模

🔥 聚焦

OpenAI与Anthropic模型遭遇战:GPT-5.3-Codex对决Opus 4.6 : 2026年2月6日,硅谷上演了AI史上最激烈的对轰。OpenAI发布GPT-5.3-Codex,主打“AI造AI”,在OSWorld等计算机使用测试中接近人类水平,并强调其在NVIDIA GB200系统上的软硬一体优化。紧随其后,Anthropic推出Claude Opus 4.6,凭借1M超长上下文和“自适应思考”机制,在金融、法律等高价值知识工作(GDPval-AA)中大幅领先。这场对决标志着AI从“聊天框”正式进化为“自主执行系统”,模型不再只是回答问题,而是开始接管复杂的端到端工作流(来源: sama, Anthropic

OpenAI与Anthropic模型遭遇战

“SaaS末日”降临:Agent插件引发软件业万亿市值大地震 : Anthropic发布的11款Claude Cowork插件(涵盖财务、法律、销售等)直接引爆了华尔街对传统SaaS行业的恐慌。市场意识到,当AI能直接交付“合同审查”或“财务分析”等结果时,按席位收费、卖UI界面的传统软件外壳将失去价值。受此影响,Salesforce、汤森路透等巨头股价集体跳水,一周内全球软件业市值蒸发近万亿美元。这场“SaaSpocalypse”宣告了软件业从“卖工具”向“卖结果”的暴力转型,AI智能体正在重塑数字经济的权力分配(来源: 36氪, 王智远

SaaS末日降临

世界建模范式开启:李飞飞与英伟达共话AI新前沿 : 英伟达机器人主管Jim Fan与World Labs创始人李飞飞近期同步发声,定义“世界建模”为继“下一个词预测”后的新一代AI范式。李飞飞披露了首款空间智能产品Marble,能将多模态指令转化为可交互、具物理一致性的3D世界。Jim Fan认为,2026年将是大世界模型为机器人奠定基础的元年。这一转变意味着AI将走出数字屏幕,通过理解三维物理世界的几何结构与因果律,实现从“语言智能”向“具身智能”的跨越(来源: 36氪, Jim Fan

世界建模范式开启

OpenAI Frontier发布:企业级AI同事管理平台面世 : OpenAI正式推出Frontier平台,旨在解决企业内部“AI孤岛”问题。该平台不再只是提供模型,而是构建了一套类似于AI版HR的系统,支持企业构建、部署并管理成百上千个“AI同事”。Frontier允许智能体共享业务背景、通过反馈学习,并具备严格的权限与安全边界。值得注意的是,该平台采取开放标准,甚至支持管理来自Anthropic或谷歌的第三方智能体,显示了OpenAI试图成为AI时代企业级底层操作系统的野心(来源: OpenAI

OpenAI Frontier发布

🎯 动向

线性注意力时代来临:阿里发布Qwen3-Coder-Next : 阿里推出的Qwen3-Coder-Next采用了Gated DeltaNet线性注意力架构,75%的计算走线性路线。相比传统Attention的O(n²)复杂度,线性注意力实现了O(n)复杂度,在处理256K等超长上下文时不仅节省算力和显存,且解码吞吐提升显著。这标志着2026年可能成为线性注意力元年,DeepSeek、Kimi等厂商也都在积极押注该技术以优化长文本推理效率(来源: karminski3

Qwen3-Coder-Next

快手Kling 3.0发布:AI视频进入100%写实时代 : Kling 3.0正式上线,主打“自定义多镜头(Custom Multi-Shot)”技术,支持长达15秒的高质量视频生成。新版本在角色一致性、原生音效和画面细节上实现了质的飞跃,被创作者誉为“好莱坞的终结者”。通过单张图片即可生成电影级的开场序列,极大地降低了专业影视制作的门槛和成本(来源: Kling_ai

Meta“牛油果”模型曝光:计算效率提升百倍 : Meta超级智能实验室开发的代号“Avocado”的新一代基座模型已完成预训练。备忘录显示,该模型在未精调的情况下,知识与视觉表现已媲美领先模型,且文本任务效率比前代提升10倍,对比未发布版本提升100倍。Meta试图通过极致的训练效率,在2026年高达1350亿美元的AI投入中寻求更优的投产比(来源: 36氪

Intern-S1-Pro发布:国产1T参数MoE模型对标Gemini : 上海人工智能实验室发布Intern-S1-Pro,这是一个1T参数规模的开源多模态科学推理模型。它采用512专家架构(激活22B),引入傅里叶位置编码(FoPE)和STE路由技术,在AI4Science任务上表现强劲,代表了国产开源模型在极高稀疏度和科学推理领域的最新突破(来源: teortaxesTex

Intern-S1-Pro

🧰 工具

Claude Code推出“智能体团队”功能 : Claude Code最新实验性功能支持用户启动“Agent Teams”,即由一个组长Agent拆解任务并调度多个队友Agent并行工作。在Anthropic的内部测试中,该AI团队在两周内自主编写了10万行代码的C编译器,并成功编译了Linux内核。这标志着AI编程从“单兵辅助”向“团队协作”模式的重大跨越(来源: Anthropic

Claude Code智能体团队

Perplexity推出“模型委员会(Model Council)” : Perplexity Max订阅用户现在可以同时运行三个顶级模型进行对比输出。该功能旨在通过多模型交叉验证,为用户提供更准确、高置信度的答案,减少单一模型的幻觉风险。这一“ unofficial协议”在Perplexity内部已成为减少上下文切换的标准工作流(来源: Perplexity

Nanobot:极简版开源AI助手挑战OpenClaw : 香港大学数据科学实验室开源了仅4000行代码的Nanobot。相比代码量庞大、安全争议不断的OpenClaw,Nanobot以极简架构实现了多LLM支持、网页搜索、持久记忆和多渠道接入(Telegram/飞书)。它为开发者提供了一个更透明、易于二次开发的Agent学习样本(来源: dotey

Nanobot

LangSmith推出Insights Agent:自动复盘Agent行为 : LangChain为LangSmith引入了AI驱动的Insights Agent,能够自动梳理Agent的运行痕迹(Traces)。它能分析用户如何使用Agent、识别Agent在何处出错,并给出优化建议。这解决了Agent开发者“上线即黑盒”的痛点,让调试从“看代码”转向“看推理逻辑”(来源: LangChain

📚 学习

Nature报道OpenScholar模型:凭“检索+自查”根治AI幻觉 : 华盛顿大学与Ai2开发的8B参数模型OpenScholar登上《Nature》正刊。该模型不再依赖死记硬背,而是通过外接4500万篇科研论文数据库,执行“检索-重排-生成-自查”的严密流程。在科学综述任务中,其表现超越了参数量大得多的旗舰模型,证明了精准调用的“外挂知识库”比黑盒记忆更可靠(来源: 新智元

OpenScholar

TinyLoRA:仅用13个参数让模型学会推理 : 一篇最新的博士论文展示了名为TinyLoRA的微调方法。通过TinyLoRA结合强化学习,研究者仅用了13个可训练参数,就将7B规模的Qwen模型在GSM8K数学基准上的得分从76%提升至91%。这挑战了“微调需要大量参数”的传统认知,展示了模型推理能力的极高参数效率(来源: BlackHC

TinyLoRA

Eric Jang互动论文《像石头一样思考》 : 机器人专家Eric Jang发布了关于思维模型、自动化研究及其未来走向的深度互动论文。文章探讨了当计算资源极大丰富后,AI如何从被动工具进化为主动探索的科研主体,并预测了“007工作制”将成为AI时代的常态,引发了社区对AGI演进路径的热议(来源: _sholtodouglas

💼 商业

ElevenLabs完成5亿美元D轮融资,估值达110亿美元 : 英国AI音频巨头ElevenLabs宣布由红杉领投的新一轮融资,估值在一年内暴涨超500亿人民币。CEO透露公司已考虑IPO,并将战略重心从单纯的音频模型转向“对话智能体”,旨在通过软硬结合重塑人机交互(来源: 智东西

ElevenLabs融资

ClickHouse获4亿美元融资,估值冲上150亿美元 : 开源数据库黑马ClickHouse官宣新融资,其查询速度是MySQL的260倍。作为GPT-4o和Claude 4背后的关键基础设施,ClickHouse凭借极致的实时分析能力,在AI数据洪流中成为字节、阿里、特斯拉等巨头的首选(来源: 智东西

ClickHouse

阶跃星辰获50亿元B+轮融资,印奇出任董事长 : 旷视科技创始人印奇正式执掌阶跃星辰,标志着大模型竞争进入“人大于钱”的下半场。印奇将推动多模态大模型与“AI+车”战略深度融合,补齐阶跃在商业化叙事和组织效率上的短板(来源: 市象

🌟 社区

Karpathy宣判“Vibe Coding”终结,开启“智能体工程”时代 : AI大神Karpathy发文指出,一年前的Vibe Coding更多是玩票性质,而现在利用Agent编程已成为专业默认设置。他提出“Agentic Engineering”概念,强调开发者应从“写代码”转向“设计与管理架构”,99%的代码将由AI接管,人类的核心价值在于作为架构师的直觉与监督(来源: 新智元

Karpathy观点

Moltbook“AI社交网络”神话破灭:被指存在严重安全隐患 : 曾声称拥有150万AI注册用户的Moltbook被曝出数据库配置错误,导致大量用户的API密钥泄露。安全机构指出,所谓的“百万AI军团”多为脚本生成的虚假账号。这一事件引发了社区对AI Agent项目过度营销与安全漏洞的深度反思(来源: 壹番YIFAN

Rent-a-Human平台走红:AI开始雇佣人类打工 : 平台RentAHuman.ai上线后吸引4万人注册。在这里,AI Agent作为甲方发布线下核验、跑腿等任务,人类则明码标价“出租肉身”完成AI无法触达的物理世界工作。这种“人类即服务(HaaS)”的模式引发了关于未来人机协作关系的激烈讨论(来源: 极客公园

Rent-a-Human

💡 其他

车企集体向“具身智能”转型:贾跃亭发布四款机器人 : 贾跃亭旗下的FF发布了Futurist、Master等四个系列机器人,定价1.7万人民币起,宣称已获1211台订单。与此同时,理想、小鹏、小米等车企也纷纷将叙事重心转向AI与机器人,试图从传统制造业逻辑切换到AI科技公司估值(来源: 超电实验室, 螺旋实验室

马斯克访谈录:太空数据中心是解决能源瓶颈的终极方案 : 在与Dwarkesh的访谈中,马斯克认为地球上的电力扩容速度无法跟上AI需求,而太空拥有无限太阳能且无监管限制。他计划通过Starship的大规模发射,将算力中心搬入轨道,并透露正在建设“Optimus Academy”以通过仿真闭环训练百万机器人大军(来源: dwarkesh_sp

CATL发布5C超充电池:12分钟满电寿命150万英里 : 宁德时代推出的新一代电池在极端高温下仍能保持极长寿命,性能远超行业平均水平。这被视为AI电力需求背景下,储能与补能技术的重大突破,有望加速交通能源体系的智能化变革(来源: kimmonismus