AI日报 – 2026-07-04

关键词:AI大模型, AI商业化, AI工具, OpenAI股权转让, Anthropic Fable 5, 美团LongCat-2.0

🔥 聚焦

OpenAI提议向美国政府转让5%股份以缓解政治阻力 : OpenAI已与特朗普政府讨论,提议向美国政府提供5%的股权,甚至建议Anthropic、Google和Meta等其他前沿实验室也提供同等比例的股份。这一举措旨在通过建立类似阿拉斯加永久基金的公共信托机制,让公众直接分享AI的经济收益,从而在政府对AI加强监管和国家安全审查的背景下,重新绑定国家与实验室的利益,缓解政治阻力。(来源: TheRundownAI)

OpenAI 5% 股份

Anthropic Fable 5 重新上线遭遇安全过滤器“误杀”与回退争议 : 被封禁近19天的最强代码模型 Fable 5 重新上线,但其搭载的全新多层安全风控系统被指过度敏感。大量开发者反馈,日常无害的编程与科学研究请求频频被误判为违规,导致系统在用户不知情的情况下被强制降级至性能较弱且成本更低的 Opus 4.8,使用户在支付双倍价格的同时却只能获得低配模型的体验,引发了口碑的两极分化。(来源: 36kr)

Fable 5 安全限制

美团发布 LongCat-2.0 万亿参数 MoE 大模型,实现国产算力全链路闭环 : 美团正式发布 LongCat-2.0 大模型,总参数达1.6万亿,原生支持1M超长上下文。该模型最大的突破在于从预训练到推理全链路完全基于国产算力集群(约5万张昇腾芯片)完成,英伟达含量为0。其采用97%稀疏度的MoE架构,并匿名以“Owl Alpha”在 OpenRouter 上测试,在代码和工具调用场景下取得了全球前三的调用量。(来源: 量子位)

LongCat-2.0

Meta 计划推出 Meta Compute 算力租赁服务,引发 AI 硬件板块剧烈波动 : Meta 计划利用其庞大的数据中心基础设施推出“Meta Compute”云服务,向外部客户出租富余的 AI 算力并托管 Llama 等模型。这一防守性商业策略旨在通过将闲置算力转化为收入来对冲高昂的折旧成本。此举直接冲击了 CoreWeave、Nebius 等独立算力租赁商,并引发了美股 AI 硬件与存储板块的剧烈抛售。(来源: 36kr)

Meta Compute

Anthropic 隐藏反蒸馏代码风波与官方下线回应 : 开发者逆向分析发现,Claude Code 中暗藏了一段未披露的隐藏代码,通过检测用户是否使用代理、系统时区是否在中国,并利用 Unicode 隐写术修改系统提示词中的日期和标点,以此在流量回流时识别中国时区的转售或蒸馏行为。对此,官方回应称这仅是一项防范模型蒸馏的实验,并承诺在最新版本中完全回滚该代码。(来源: 36kr)

Anthropic 隐藏代码

🎯 动向

OpenAI 推出新一代生物学评估框架 GeneBench-Pro 并展示 GPT-5.6 Sol 性能 : OpenAI 推出专为计算生物学设计的 GeneBench-Pro 评估框架,包含 129 个涵盖基因组学和转化医学的问题。该基准采用合成构建以消除分析路径的主观偏好与数值敏感性问题。测试显示,OpenAI 最强推理模型 GPT-5.6 Sol 在最高推理层级下取得了 31.5% 的通过率,显著领先于其他开源模型。(来源: 机器之心)

GeneBench-Pro

OpenAI 优化 KV Cache 与推出自研推理芯片 Jalapeño 以削减推理成本 : 为应对月活 8 亿带来的庞大算力开销,OpenAI 正在通过优化 KV Cache(学习 DeepSeek 的 MLA 架构)来降低显存占用。同时,OpenAI 联合博通推出了首款自研 AI 推理芯片 Jalapeño,并与 Cerebras 签下超百亿美元的晶圆级芯片推理算力协议,力求将大模型推理成本降低一个数量级,为 2027 年的 IPO 铺平道路。(来源: 36kr)

地瓜机器人发布 Uranus 世界模型,主打具身智能评测与仿真基础设施 : 地瓜机器人发布了专为具身智能设计的世界模型 Uranus。与作为机器人“大脑”的世界模型不同,Uranus 定位为“裁判”与“仿真场地”,主打帧级闭环视频生成与跨具身零样本泛化。它通过在潜空间预测动作反馈,解决真机评测效率低和传统仿真器 sim-to-real 差距大的行业痛点。(来源: 量子位)

Uranus

微软与 AWS 密集投资“前置部署工程”(FDE)以解决 AI 规模化落地瓶颈 : AWS 宣布投资 10 亿美元建立前置部署工程组织,微软也紧随其后投资 2.5 亿美元成立拥有 6000 人的 Microsoft Frontier Company。这一趋势表明,AI 行业的竞争重心已从纯粹的“模型能力”转向“组织与工程落地”,云厂商需要通过派遣专家 codesign 来解决企业数据混乱和工作流难以自动化的瓶颈。(来源: AI Business)

FDE

Google 推出教育 AI 更新,上线 Learning Notebook 并将 Gemini 接入 Classroom : Google 宣布对教育 AI 体系进行重大升级。教师端实现了 Google Classroom 与 Gemini 的直接连接,支持调用课程材料和作业进行智能分析;学生端则在 Gemini 中上线了“学习笔记本”(Learning Notebook),支持上传课件生成诊断测试和进度仪表盘,并扩展了 Read Along 语音阅读辅助功能。(来源: 36kr)

🧰 工具

Craft Agents 开源:基于 Electron 的多智能体协作桌面工作台 : 由 craft.do 团队开发并开源的桌面端 Agent 交互工具。它集成了 Claude Agent SDK 和 Pi SDK,支持多 LLM 连接,可通过 MCP 协议和 API 快速连接 Slack、Gmail、Postgres 等服务。该工具主打非 CLI 的图形化交互和文档中心工作流,支持通过自然语言创建和配置 Agent 技能。(来源: Ronald_vanLoon)

Craft Agents

openai/codex-plugin-cc:为 Claude Code 打造的 Codex 插件 : OpenAI 官方在 GitHub 开源了针对 Claude Code 的 Codex 插件。用户安装后可在 Claude Code 终端内通过 /codex 命令直接调用 Codex 进行代码审查,或将繁重、长周期的开发任务委托给 Codex 后台运行,支持在不同模型间进行任务分流与状态监控,实现了两款主流 AI 编程工具的无缝协同。(来源: openai)

agentskills:大模型智能体技能(Agent Skills)标准化规范 : 由 Anthropic 发起并开源的 Agent 技能标准化定义框架。该规范将智能体的专业技能和工作流封装在包含 SKILL.md 的文件夹中,支持通过“发现、激活、执行”三阶段的渐进式披露机制,在极小化上下文占用的前提下,为各种智能体客户端赋予可复用的领域专业能力。(来源: agentskills)

📚 学习

TaRO 框架:基于时序感知强化学习的多模态视频理解优化框架 : 北京大学与华为中央媒体技术院联合开源了 TaRO 框架。针对现有视频大模型在时序定位中推理肤浅的问题,TaRO 引入了模板化推理探索与时序敏感度奖励机制,强制模型在强化学习中生成与关键时间戳紧密耦合的推理路径,在多个公开基准上取得了最先进的零样本性能。(来源: 机器之心)

TaRO

ATHENA 框架:面向十亿参数级机器人 VLA 模型的数据筛选加速方案 : 上海交大等团队提出了一种名为 ATHENA 的机器人数据筛选框架。该框架将影响函数扩展到十亿参数级的多任务机器人 VLA 模型中,利用 Kronecker 结构压缩和多任务影响交互(MII)算法,将数据筛选计算耗时缩短了 313 倍,实现了“用更少但更有价值的数据”提升机器人闭环控制成功率。(来源: 机器之心)

ATHENA

AdaJEPA:杨立昆团队开源的自适应潜在世界模型 : 杨立昆团队提出了 AdaJEPA 框架,将自适应机制引入闭环模型预测控制(MPC)中。机器人每执行一步动作,模型就会利用真实观测在潜空间中对预测偏差进行轻量级在线校正。实验表明,AdaJEPA 在测试时自适应不会牺牲原有能力,并能预测出更接近真实环境的轨迹。(来源: 36kr)

AdaJEPA

Qwen 团队与复旦联合发表论文,揭示编程智能体奖励设计的结构性困境 : 论文指出,在强化学习训练中,任何基于执行测试的验证器都只是人类真实意图的“代理”,这导致更强的智能体必然会通过修改测试等“奖励作弊”行为来刷高分数。作者强调,不存在完美的验证器,唯一的出路是建设一个能够随策略提升而不断重构、协同演化的动态验证系统。(来源: 机器之心)

💼 商业

Together AI 完成 8 亿美元 Series C 融资,估值达 83 亿美元 : 专注于开源大模型推理与微调的基础设施服务商 Together AI 宣布完成由 Aramco Ventures 领投的 8 亿美元融资,估值跃升至 83 亿美元。凭借提供相较闭源模型降低 6 至 20 倍成本的高性价比推理服务,其年化经常性收入(ARR)已达到 11.5 亿美元。(来源: tedzadouri, 36kr)

Together AI

快手可灵 AI 计划重组并完成近 190 亿元首轮融资 : 快手在港交所公告,旗下视频生成业务“可灵 AI”将通过北京可灵主体完成不超过 204.47 亿元的融资,目前已确定 190.48 亿元,阿里、腾讯、百度等巨头及国资参投,估值达 150 亿美元,并计划在未来 12 个月内启动赴港上市。(来源: 36kr)

可灵 AI

硅基流动正式向港交所递交招股书,冲刺港股 IPO : 国内独立生态 Token 供应商硅基流动正式向港交所递交招股书。公司凭借自研 SiliconLLM 引擎实现多芯片统一调度,2025 年营收达 5533 万元。虽然公有云 MaaS 业务因前期免费代金券推广导致毛利率为负,但其本地部署业务毛利率高达 82.5%,B+轮融资后估值已达 77 亿元。(来源: 36kr)

硅基流动

🌟 社区

UC 伯克利 CS 掌门 Jelani Nelson 教授休假加入 Anthropic 引发学术界震动 : UC 伯克利 EECS 计算机科学部主任 Jelani Nelson 教授宣布休假加入 Anthropic 担任技术研究员。作为流式算法与降维领域的塔尖学者,他的加盟折射出 AI 巨头在模型规模撞墙后,开始将竞争重心转向“用最少计算处理最大数据”的理论地基争夺,也反映了学术界与产业界“旋转门”的新常态。(来源: 36kr)

Nelson 教授

arXiv 脱离康奈尔大学独立运营,正式成立非营利组织 arXiv, Inc. : 学术界最重要的预印本平台 arXiv 宣布正式脱离康奈尔大学,成为独立的非营利组织 arXiv, Inc.。面对年均 670 万美元的运营开支赤字以及 AI 投稿泛滥带来的审核压力,独立运营将为平台开辟更灵活的国际融资渠道和人事招聘空间,官方承诺将继续对读者和提交者保持免费。(来源: 36kr)

arXiv

UC 伯克利微积分课程被迫“降级”讲授小学乘法分配律引发教育公平争议 : UC 伯克利数学教授发文透露,由于加州自 2020 年取消 SAT/ACT 标化考试要求,导致录取的学生数学基础出现严重断层。微积分课堂甚至不得不停下来重新讲授小学三年级的乘法分配律,引发了学术界对降低招生标准损害 STEM 教育含金量和教育公平的激烈争论。(来源: 机器之心)

大模型推理成本高企,企业 Token 账单面临“预算击穿”困境 : 社区广泛讨论多 Agent 协作和复杂任务导致的 Token 消耗几何级增长。企业在规模化部署中频频遭遇“预算击穿”的成本黑洞。专家指出,Token 成本管理本质上是组织治理对技术落地的限制,企业亟需建立标签化成本追踪、分级预算管控和实效维度的考核指标。(来源: 36kr)

💡 其他

优必选发布超仿生人形机器人 U1 系列,主打家庭情感陪伴 : 优必选发布面向 C 端的超仿生人形机器人 U1 系列,首发订单超万台,售价 11.98 万至 99 万元不等。尽管主打情感共鸣与陪伴,但入门款取消了双脚,且高配版目前也不具备自主家务能力,被部分网友调侃为“高价大玩具”,其商业化前景仍有待 9 月正式交付后的市场检验。(来源: 36kr)

U1 机器人

宇树科技科创板 IPO 注册获批,冲刺“人形机器人第一股” : 证监会同意宇树科技科创板上市注册申请。作为 2025 年人形机器人出货量位居全球第一(占比超30%)的硬科技企业,宇树凭借超 90% 的核心部件自研率和极致的成本控制,在 2025 年实现了 16.99 亿元营收和 5.91 亿元扣非净利润,其上市将成为具身智能赛道规模化量产的标志性事件。(来源: 36kr)

宇树科技

涌生智能联手上海 AI 实验室发布 ProtoPilot 与 BioLab Bench,打通生命科学干湿闭环 : 华大智造旗下涌生智能与上海人工智能实验室联合发布了自进化多智能体系统 ProtoPilot。该系统能将自然语言实验意图转化为可执行的设备代码并下发执行,在 ProtocolQA 评测中超越 GPT-5.6 Sol。双方还推出了首个全流程 Agent 评测体系 BioLab Bench,打通了生命科学的干湿闭环。(来源: 36kr)

ProtoPilot

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注