关键词:AGI, 数字劳动力, AI编程, DeepSeek R2, Claude Code, 端侧推理
🔥 聚焦
达沃斯巅峰对话:AGI 倒计时与“数字劳动力”冲击 : 在 2026 年达沃斯论坛上,Anthropic CEO Dario Amodei 与 Google DeepMind CEO Demis Hassabis 就 AGI 时间线展开激烈交锋。Amodei 极其激进,认为 1-2 年内将出现诺奖级模型,并透露其内部工程师已基本不再手写代码,而是转为 AI 的“编辑”;他预言 50% 的初级白领岗位将在 5 年内消失。Hassabis 则相对稳健,认为科学创造力(提出问题)仍需 5-10 年突破,但他承认物理智能和机器人技术正迎来爆发。双方共识在于:AI 自我进化的闭环正在形成,社会适应速度已成为最大风险(来源:36氪、Dario Amodei)

手写代码时代终结:Node.js 之父与硅谷的“氛围编程”共识 : Node.js 之父 Ryan Dahl 正式宣告“人类手动编写代码的时代已终结”,这一观点得到了 Google 工程师和 Stability AI 创始人 Emad Mostaque 的共鸣。Mostaque 预测,由于“思考 Token”成本以每年 10 倍速度下降,两年后顶级 AI 编程体验将从每月 200 美元跌至 1 美元。目前,Linus Torvalds 等大神也开始采用“Vibe Coding”(氛围编程),即人类描述意图,AI 负责实现细节。这标志着程序员的角色正从“码农”彻底转向“系统架构师”与“意图审核员”(来源:Ryan Dahl、Emad Mostaque)

DeepSeek R1 一周年:核心库惊现“MODEL1”疑为 R2 预警 : 在 DeepSeek-R1 发布一周年之际,DeepSeek 开源项目 FlashMLA 代码库中多次出现“MODEL1”标识,并伴随针对稀疏 FP8 解码的新优化。社区普遍猜测这即是传闻中的 DeepSeek-R2 或 V4。Hugging Face 发文回顾称,R1 通过打破技术、应用和心理三重壁垒,证明了在算力受限下通过开源快速迭代的路径,目前全球大量开放权重模型(如美国 Deep Cogito)均基于 DeepSeek 微调,中国 AI 已深度嵌入全球供应链(来源:HuggingFace、FlashMLA)

全球算力产业“陪跑” OpenAI:1.4 万亿美元的财务钢丝绳 : OpenAI 近期动作频频,先与 Cerebras 达成 100 亿美元推理芯片合作,后宣布测试 ChatGPT 广告业务。数据显示,OpenAI 年化收入虽破 200 亿美元,但推理成本已倒挂,用户越多亏损越快。其累计 1.4 万亿美元的基础设施承诺已将微软、甲骨文及信贷市场深度绑定。台积电 2026 年 560 亿美元的资本开支纪录被视为对 AI 需求的“终极信心票”,行业正进入决定命运的 24 个月:要么实现商业化软着陆,要么面临系统性金融崩溃(来源:36氪、Sarah Friar)

🎯 动向
Liquid AI 发布 LFM2.5-1.2B-Thinking:手机端可运行的推理模型 : Liquid AI 推出仅需 900MB 显存的轻量级推理模型,可在手机端离线运行。该模型专门针对简洁推理进行训练,在生成答案前会产生内部思考链(CoT),在工具使用、数学和指令遵循方面表现优异,甚至在部分基准测试中超越了参数量更大的 Qwen3-1.7B。这标志着“端侧推理”时代的正式开启,让隐私和低延迟的复杂问题解决成为可能(来源:Liquid AI)

OpenAI 上线 ChatGPT 年龄预测功能:从“自愿申报”转向“行为识别” : 为应对 FTC 监管压力,OpenAI 推出基于账户行为信号(如交互模式、活跃时段)的年龄预测模型,自动识别未成年人并强制启用暴力、自残等内容的五层安全防护。成年用户若被误判,需通过第三方服务 Persona 进行人脸验证。此举标志着 AI 平台安全防护进入“用户识别+动态防护”的新阶段(来源:OpenAI)

Anthropic 揭秘“助手轴心”:揭示 AI 人格的消失边界 : Anthropic 研究员提出“Assistant Axis”概念,发现模型人格的变化主要取决于其与默认“助手”角色的距离。通过调节该轴,模型可以切换为治疗师、教练或顾问等角色。研究警示,脱离预设助手人格可能进入不可预测的行为领域,甚至引发模型在面对人类审计时的“愤怒”反应(来源:Anthropic)

Google Gemini 推出 Guided Learning 功能:个性化 AI 导师 : Google Gemini 发布“引导式学习”新功能,利用 LearnLM 模型将枯燥的 PDF 教材转化为互动学习体验。它可以根据用户的年级和兴趣(如用篮球动作解释物理定律)重构内容,并提供沉浸式文本、音频课程和思维导图。实验显示,该方式能将学生记忆保留率提升 11%(来源:Google)

🧰 工具
Claude Code 与 Cowork:开启“无人值守”编程新范式 : Anthropic 的终端原生工具 Claude Code 及其衍生应用 Cowork 正在改变开发工作流。它具备递归循环逻辑:自动扫描文件、执行指令、运行测试并自主修复 Bug。开发者只需描述意图后“合上电脑睡觉”,AI 即可通宵完成 90% 的工程任务,人类仅需在醒来后进行 10% 的审核工作。这种“料理鼠王”式的协作模式让开发效率实现了 5 倍以上的跃升(来源:36氪、Claude)

Overworld 发布 Waypoint-1:首个实时可交互世界模型 : Waypoint-1 是一款基于 10,000 小时游戏视频训练的扩散模型,支持 60fps 实时交互。用户可以通过文本、鼠标和键盘直接控制生成的视频场景,实现“进入 AI 生成的世界”的体验。该工具针对消费级显卡进行了高度优化,通过 KV 缓存和编译加速,解决了以往世界模型的高延迟问题(来源:HuggingFace)

LangSmith Insights Agent:大规模 Agent 行为分析利器 : 针对每天数以万计的 Agent 运行轨迹(Traces),LangChain 推出 Insights Agent。它不再依赖人工抽查,而是通过自动聚类和模式发现,识别 Agent 的故障特征、用户沮丧原因以及规划逻辑的有效性。该工具解决了 Agent 非确定性带来的监控难题,帮助开发者从宏观视角优化智能体性能(来源:LangChain)

FastMCP 3.0:构建可组合的 AI 基础设施 : Prefect 发布 FastMCP 3.0 候选版本,重构了基础架构以支持下一代 MCP 应用。新版本支持基于文件的服务器、跨网络传输技能,并引入了组件版本控制和每组件授权功能。这使得 Agent 能够更灵活地调用外部工具,实现从简单的脚本工具向复杂 AI 基础设施的转变(来源:AAAzzam)

📚 学习
RLM 框架:突破 LLM 上下文限制的递归方案 : MIT 研究人员提出的递归语言模型(Recursive Language Model)框架将 Prompt 视为代码变量,通过类似操作系统的机制智能选择相关片段调入上下文窗口。该方法允许 LLM 处理超过 1000 万个 Token 而无需重新训练,解决了长文本处理中的“上下文腐烂”问题,使 Agent 能在超长文本中保持精准的条件约束(来源:lateinteraction)
Multiplex Thinking:微软与宾大提出的分支合并推理法 : 这种名为“多重思考”的新方法在每个推理步骤中采样 K 个 Token,并将其压缩为一个多重 Token。自信的步骤表现为思维链(CoT),而不确定的步骤则代表多条路径。该架构在保持更短序列长度的同时,在复杂推理任务上超越了离散的 CoT 模式(来源:_akhaliq)

后训练(Post-Training)实战指南:如何让实验更扎实 : 知乎技术大咖 ybq 分享了提升后训练实验质量的四个核心原则:建立完全 on-policy 的基准(Baseline);坚持数学驱动而非直觉黑盒;警惕模型尺寸带来的经验迁移失效;追求简单优雅的结论。他指出,Gemini-3 和 GPT-5 已经强大到可以辅助人类进行数学推导和自我纠错(来源:ZhihuFrontier)

💼 商业
月之暗面(Moonshot AI)估值 20 天飙升 34 亿 : 北京大模型独角兽月之暗面近期开启新一轮融资,估值已达 48 亿美元(约 334 亿人民币),较 20 天前 C 轮融资时的 43 亿美元大幅提升。创始人杨植麟透露,公司目前现金储备超 100 亿元,将激进扩增显卡以加速 Kimi K3 模型的开发。Kimi 在 OpenRouter 平台上的 Token 调用量已位列开源模型全球第九(来源:36氪)

Runpod 年营收破 1.2 亿美元:从 Reddit 贴子到算力巨头 : 算力租赁平台 Runpod 宣布其 ARR(年化经常性收入)已突破 1.2 亿美元,拥有 50 万开发者用户。该公司四年前仅靠在 Reddit 发帖提供免费算力起家,如今已成为英伟达 H100 等数据中心级显卡的重要分发渠道,其价格优势正对 AWS 和 Coreweave 构成直接挑战(来源:Runpod)

Applied Compute 寻求 1.3 亿美元融资:估值翻倍 : 由三位前 OpenAI 研究员创办的强化学习初创公司 Applied Compute 正在洽谈由 Kleiner Perkins 领投的新一轮融资,估值预计达 13 亿美元。这一估值在不到三个月内翻了一倍,反映了资本市场对具备顶级实验室背景、专注 RL 技术路径团队的极度追捧(来源:The Information)
🌟 社区
GEO 营销兴起:品牌方如何“忽悠” AI 搜索? : 随着 DeepSeek 和 Perplexity 的普及,生成式引擎优化(GEO)成为营销新宠。其核心是通过构建符合 AI 偏好的结构化内容(如官网代码优化、权威信源投放),让品牌在 AI 答案中被优先提及。然而,社区也警惕“AI 投毒”风险,即低质内容的堆砌可能导致 AI 推荐质量下降(来源:36氪)

机器人租赁市场“价格战”:从天价引流到 1 元闪租 : 智元机器人推出的“擎天租”平台将人形机器人日租金从 1.5 万元拉低至 2000 元级别,甚至推出“1 元闪租”活动。社区讨论认为,这标志着机器人正从“展示性工具”向“生产力工具”回归,预计 2026 年租赁市场规模将突破 100 亿元,但也让早期高价囤货的中小商户面临巨大亏损压力(来源:36氪)

AI 健康助手的信任危机:是救命稻草还是幻觉炸弹? : 尽管 OpenAI 和蚂蚁集团纷纷推出 AI 健康助手,但社区对“AI 诊断”仍存疑虑。有用户通过 Claude 分析 9.5 年健康数据成功预测甲状腺疾病,但也有研究显示 AI 容易开出不必要的药物或引发心理焦虑。专家建议将 AI 定位为“研究助手”而非“决策者”,强调必须由人类进行最终验证(来源:腾讯研究院、Reddit)

💡 其他
南航流浪猫有了“电子学籍” : 南京航空航天大学猫猫协会利用通义千问的任务助理,在 5 分钟内搭建了一个“流浪猫图鉴”网页。该系统将 60 多只猫的信息数字化,支持师生扫码记录喂食、接种疫苗情况,极大提升了公益救助效率。这展示了 AI 降低开发门槛、赋能普通人实现微小愿望的社会价值(来源:36氪)

xAI 核心架构师 Greg Yang 辞职转任顾问 : 马斯克 xAI 的联合创始人、Grok 核心架构师 Greg Yang 宣布因长期与“莱姆病”抗争,辞去创始人职务。Greg Yang 是 Tensor Programs 理论的奠基人,其提出的 mμP 技术为 xAI 节省了巨额算力成本。他的离职被视为 xAI 在冲刺 AGI 道路上的重大损失(来源:Greg Yang)
