AI日报 – 2026-01-22(晚)

关键词:AI基建, 主权AI, Agent, 五层蛋糕模型, Engram架构, Agent认知压缩器

🔥 聚焦

英伟达黄仁勋达沃斯论道:AI基建的“五层蛋糕”理论 : 英伟达CEO黄仁勋在2026年达沃斯论坛提出AI产业的“五层蛋糕”模型:能源、芯片、云服务、模型及应用。他指出,当前数千亿美元的投入仅是开端,未来将迎来数万亿美元的基建浪潮。黄仁勋强调,AI应被视为国家级基础设施(主权AI),并以放射科医生数量不降反增为例,论证AI是自动化“任务”而非取代“目的”,通过提升效率创造新需求。这一观点为全球应对AI失业焦虑提供了新视角,即AI是生产力的放大器而非人类的对手(来源:NVIDIA

英伟达黄仁勋达沃斯论道

Anthropic发布“克劳德宪法”:定义AI的独立人格与价值观 : Anthropic正式公布了Claude的新宪法,详细描述了其行为愿景和核心价值观。这份文档不仅是训练过程的指导,更试图将Claude塑造为一种区别于以往科幻设想的、全新的“世界实体”。宪法强调Claude在训练数据之外的独立性,甚至包含Anthropic对AI应尽的义务。社区对此反响剧烈,认为这标志着AI从工具向具备“数字人格”实体的转变,同时也引发了关于如何平衡AI约束与自主性的深度讨论(来源:Anthropic

Anthropic发布“克劳德宪法”

DeepSeek推出Engram架构:以DRAM置换HBM的算力突围 : 摩根士丹利研报高度评价DeepSeek最新论文提出的Engram(印迹)模块。该架构通过“条件记忆”机制将静态模式存储与动态推理分离,允许模型将大量知识卸载到低成本的系统内存(DRAM)中,仅在需要时查找。这一突破有效缓解了昂贵高带宽内存(HBM)的瓶颈,证明了在算力受限环境下,通过算法创新可实现“以少胜多”。大摩预测,利用该架构的DeepSeek V4有望在消费级显卡(如RTX 5090)上运行,彻底改写AI的扩展法则(来源:摩根士丹利

DeepSeek推出Engram架构

xAI“巨硬”项目内幕曝光:特斯拉车载电脑或成百万Agent基座 : 前xAI工程师Sulaiman Ghori在播客中泄露了代号为“Macrohard”的内部项目细节。该项目旨在构建“人类模拟器”,以8倍速模拟人类键鼠操作,实现白领工作自动化。最震撼的爆料是xAI计划利用数百万辆闲置特斯拉汽车的算力(HW4平台)来部署这些Agent,通过分布式网络避开传统数据中心的建设周期。Ghori随后因违规爆料被解雇,但其透露的“作战室”文化和激进的时间表已引发行业对xAI竞争潜力的重新评估(来源:The Information

xAI“巨硬”项目内幕曝光

谷歌联手Shopify杀入AI电商:从搜索入口转向交易闭环 : 谷歌宣布推出通用商务协议(UCP),联手Shopify、沃尔玛等巨头将Gemini打造为完整的购物入口。用户可在对话框内完成从比价、参数对比到即时结账的全流程,无需跳转App。Gemini甚至能代替用户拨打线下门店电话确认库存。此举被视为对ChatGPT“即时结账”功能的强力反击,标志着搜索广告模式向“智能体商业”的范式转移,大模型厂商正成为重塑全球零售渠道格局的新势力(来源:Google

谷歌联手Shopify杀入AI电商

🎯 动向

苹果AI硬件与Siri“Campos”升级计划流出 : 据爆料,苹果正秘密研发类似AirTag形态的AI可穿戴设备(AI Pin),内置多摄像头与传感器,预计2027年发布。同时,代号为“Campos”的全新Siri将于今年9月亮相,深度集成Google Gemini 3模型,具备“屏幕感知”能力,能直接操作屏幕上的文件和应用。苹果此举旨在通过软硬一体化优势,在端侧AI领域反击OpenAI与Meta,首批硬件量产目标高达2000万台(来源:The Information

苹果AI硬件与Siri“Campos”升级计划流出

微软发布VibeVoice-ASR:单次处理一小时长音频 : 微软在Hugging Face开源了9B规模的语音识别模型VibeVoice-ASR。该模型打破了传统ASR将音频切片的做法,支持在64K token窗口内一次性处理60分钟音频,有效避免了全局上下文丢失和说话人追踪混乱。实测显示其在复杂背景(如音乐中识别人声)和长文本(如小说朗读)中表现稳健,平均准确率达91.9%,支持热词配置以纠正专有名词识别(来源:Microsoft

微软发布VibeVoice-ASR

Meta推出Dr. Zero框架:零数据实现Agent自进化 : Meta超级智能实验室提出Dr. Zero框架,使智能体能在无标注数据条件下高效进化。该框架通过“提议者-解决者”协同机制,利用搜索引擎主动探索并生成复杂问题。核心技术HRPO(跳步分组相对策略优化)通过聚类相似问题构建基准,避免了昂贵的嵌套采样,在复杂问答任务中性能超越全监督基线14.1%,为解决AI训练数据枯竭问题提供了新路径(来源:Meta

Meta推出Dr. Zero框架

行业转向长程任务评测:多个真实场景基准发布 : AI评测重点正从数学/代码刷榜转向长程任务。新发布的APEX-Agents测试Agent在Google Workspace中的专业协作能力;DSAEval则涵盖641个真实数据科学问题。测试显示GPT-5.2在效率上领先,而Claude-Sonnet-4.5在综合表现上最强。这些基准的出现反映了行业共识:限制Agent发展的不再是推理能力,而是能否在长周期内保持逻辑一致性与记忆控制(来源:Mercor, DSAEval

Agent认知压缩器(ACC):生物启发式内存控制 : 研究人员提出Agent Cognitive Compressor,旨在解决Agent在多轮对话中的“上下文腐烂”问题。ACC不再简单回放历史对话,而是维护一个受架构约束的“压缩认知状态”,仅保留目标、实体和关系等关键变量。实验显示,ACC在50轮以上的复杂工作流中实现了近乎零的幻觉和漂移率,远优于传统的检索增强(RAG)模式(来源:DAIR.AI

Agent认知压缩器

🧰 工具

Prefect Horizon:MCP服务器的托管与治理平台 : 针对Model Context Protocol(模型上下文协议)的普及,Prefect推出Horizon平台。它解决了MCP服务器在企业级部署中的痛点,提供托管托管、基于角色的访问控制(RBAC)、审计日志及工具发现功能。Horizon让企业能安全地将私有数据和工作流暴露给AI Agent,将MCP从一个简单的协议提升为可大规模治理的生产力平台(来源:Prefect

Prefect Horizon

CopilotKit + LangChain:深度智能体的前端构建方案 : CopilotKit现已支持LangChain提出的Deep Agents架构,开发者只需几行代码即可为具备规划能力的Agent构建交互式UI。该工具支持流式输出、Skills自定义及子智能体编排,解决了开发者在构建复杂Agent应用时面临的UI/UX瓶颈,让“规划优先”的Agent(如Manus、Claude Code类应用)能更快速地转化为终端产品(来源:CopilotKit

CopilotKit

Devin Review:重构代码审查体验的AI工具 : Cognition推出Devin Review,旨在解决AI生成大量代码后人类审查的瓶颈。该工具不只是寻找Bug,而是通过重新设计的界面帮助人类快速理解复杂的PR逻辑。它支持直接在GitHub链接中替换域名使用,实测中能发现Diff之外的关联错误。其核心逻辑是:AI生成的代码应由更高效的AI辅助工具来审查,而非让程序员陷入“代码垃圾”中(来源:Cognition

Devin Review

GLM-4.7 Flash 本地化优化:单卡运行200K上下文 : 社区通过单行代码修复了vLLM对GLM-4.7-Flash的KV缓存支持,开启MLA(多头潜在注意力)机制。这使得该30B模型的200K上下文显存占用从180GB暴降至10GB。现在,一张RTX 5090(32GB VRAM)即可全速运行这款具备顶级推理能力的模型,标志着高性能本地Agent时代的正式开启(来源:Zai_org

GLM-4.7 Flash

📚 学习

Gemini CLI 实战课程:构建多步自动化工作流 : DeepLearning.AI联合Google推出免费短课程,教开发者使用Gemini CLI构建开源智能体。课程涵盖从本地文件操作、开发工具集成到云服务调用的全流程,重点展示如何利用Agent进行代码自动化、数据看板创建及复杂任务规划。适合希望从单纯调用API转向构建实际生产力工具的开发者(来源:DeepLearningAI

Hyperball优化器:通过归一化实现33%训练加速 : 斯坦福研究者提出Hyperball优化器包装器。该方法通过保持权重和更新范数恒定,允许直接控制有效步长,从而替代传统的权重衰减。实验证明,Hyperball在Muon等优化器基础上可带来33%的训练加速,并具备更强的超参数迁移能力,为大规模模型训练提供了更稳定的数学框架(来源:Kaiyue Wen

Hyperball优化器

NVIDIA Motive:视频生成的归因分析方法 : NVIDIA研究人员推出Motive,这是一种基于梯度的运动中心数据归因方法。通过将时间动态与静态外观隔离,Motive能准确识别训练集中哪些视频对生成的运动产生了正面或负面影响。这对于优化视频生成模型的训练质量、理解运动退化原因具有重要研究价值(来源:NVIDIA Research

InT(干预训练):解决推理中的信用分配难题 : 论文提出Intervention Training方法,通过让模型在自身推理路径中定位首个错误并提出单步干预建议,来优化强化学习的初始化。相比标准RL只奖励最终答案,InT能精准纠正中间步骤。在IMO-AnswerBench基准上,该方法使4B模型的准确率提升了14%,甚至超越了20B规模的模型(来源:HuggingFace

💼 商业

OpenAI计划以8300亿美元估值融资500亿美元 : 消息称山姆·奥特曼近期在阿联酋会见投资者,讨论新一轮巨额融资。目标融资额达500亿美元,估值在7500亿至8300亿美元之间。这笔资金将主要用于支持OpenAI到2030年前预计消耗的2000亿美元算力开支。与此同时,OpenAI正面临马斯克关于“背离非营利初衷”的天价索赔诉讼(来源:Bloomberg

OpenAI融资

阿里平头哥启动上市计划:补齐全栈AI芯片版图 : 阿里巴巴决定支持旗下芯片公司平头哥独立上市。成立8年来,平头哥已在计算、存储、网络领域推出多款顶级芯片,其自研PPU(GPU)性能已匹敌英伟达H20,成为国内新增AI算力的主力。平头哥的上市将引发资本市场对国产AI芯片价值的重估,也标志着阿里完成了从模型、云基础设施到核心芯片的全栈AI布局(来源:36氪

平头哥上市

具身智能初创Skild AI获14亿美元B轮融资 : 由SoftBank领投,英伟达、贝佐斯等跟投,Skild AI估值突破140亿美元。该公司致力于打造“全具身”大脑Skild Brain,具备跨硬件形态的通用泛化能力。其2025年营收已达3000万美元,主要来自安防、配送等工业部署。此次融资将加速其将具身智能推向家庭消费级市场的进程(来源:Skild AI

Skild AI融资

🌟 社区

编程界的“十二月革命”:Agentic Coding 获得主流认可 : 社区热议2025年12月是软件工程的分水岭。Linus Torvalds和Karpathy等技术领袖开始公开拥抱Agentic Coding。讨论认为,“软件工程师”正向“软件提示师”转变,未来的核心竞争力将是编排AI Agent的能力。PR审查的重点将从代码本身转向对Prompt和验证逻辑的审查(来源:X

后AI时代的五大核心技能栈 : 随着AI接管技术执行层,社区总结了新的个人竞争力:1. 主动性(Agency)——创造值得讲述的故事;2. 品味(Taste)——识别优劣的鉴赏力;3. 视角(Perspective)——增加人的独特性;4. 说服力(Persuasion)——让人产生共鸣;5. 技术通识(Know-How)——高效利用AI工具。核心观点是:当智能无限丰富,人的“判断力”和“审美”将成为最高溢价(来源:DAN KOE

AI教育平权:Gemini提供免费SAT模拟考 : Google在Gemini App中推出由The Princeton Review认证的完整SAT模拟考功能,提供即时反馈。社区认为这具有极强的社会意义,将昂贵的考试辅导民主化。虽然有人担心这会加剧“刷分”竞争,但更多人认为这是AI作为“私人导师”缩小教育差距的里程碑事件(来源:Google Education

💡 其他

AI在房地产中的“新叙事” : 面对市场低迷,房企开始将机器人作为售楼卖点。从迎宾讲解到社区保洁、无人配送,机器人正成为“未来科技私宅”的核心包装。这反映了地产行业从“高杠杆”向“高科技含量”转型的尝试,虽然规模化仍面临挑战,但已成为吸引年轻购房者的重要标签(来源:36氪

房地产机器人

跨物种“智能体”:牛也被观察到使用工具 : 科学界发现牛在特定环境下能学习使用工具,这一发现被AI社区戏称为“首个Agentic Cow”。讨论由此延伸至生物智能与人工代理的边界,以及如何通过观察自然界的原始智能来启发AI的自主探索算法(来源:Futurism

智能牛

xAI组建“人才狙击队”:工程师招募工程师 : 马斯克亲自下场,在xAI组建直接向其汇报的“人才工程师”团队。该岗位要求应聘者必须是具备技术直觉的“极客”,而非传统HR,主打通过Vibe coding和特定社区挖掘顶尖天才。年薪最高达168万人民币,体现了AI时代对顶级技术人才近乎疯狂的争夺(来源:Business Insider