AI日报 - 2025-12-12(晚)

关键词：GPT-5.2, OpenAI, AI模型, 专业工作能力, Agent工具调用, 视觉能力, 上下文窗口, 知识库更新, GPT-5.2 Thinking模型, GDPval基准测试, SWE-Bench Pro记录, ARC-AGI-1突破, 统计学习理论

🔥 聚焦

OpenAI发布GPT-5.2系列模型，专业工作能力显著提升 : OpenAI推出GPT-5.2 Instant、Thinking、Pro三款模型，旨在解决高难度知识型工作。在OpenAI的GDPval基准测试中，GPT-5.2 Thinking在44种职业任务中70.9%的情况下超越或持平人类专家，效率提升11倍，成本低于1%。模型在通用智能、超长文本理解、Agent工具调用及视觉能力上全面进化，知识库更新至2025年8月31日，并支持40万上下文窗口。其在SWE-Bench Pro上创下55.6%的新纪录，在ARC-AGI-1上首次突破90%大关，并在科学研究中辅助解决了统计学习理论的开放性问题。虽然价格上涨40%，但OpenAI强调其更高Token效率带来的性价比。（来源：36氪, 36氪, 36氪, 36氪, 36氪, 36氪, 36氪, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ArtificialInteligence）

迪士尼与OpenAI达成10亿美元合作，Sora获200+IP授权 : 迪士尼宣布向OpenAI投资10亿美元并签署三年期授权协议，允许Sora和ChatGPT Images使用200多个迪士尼、皮克斯、漫威和星球大战的标志性IP角色（仅限动画/插画版本，不含真人肖像/声音）生成短视频和图像。部分UGC内容未来有望登上Disney+平台。此举标志着AI在内容创作领域从工具走向平台，迪士尼旨在通过负责任的AI使用扩大叙事影响力，同时也是对AI版权挑战的积极应对。（来源：kylebrussell, dotey, 36氪, 36氪, 36氪, 36氪, Reddit r/ChatGPT）

谷歌Deep Research Agent升级并开放API，DeepMind与英国政府合作推动AI治国 : 谷歌发布全新Gemini Deep Research Agent，基于Gemini 3 Pro模型，优化了网页搜索功能并能以更低成本生成深度研究报告，在HLE测试中得分46.4%，略高于GPT-5.2。同时开源DeepSearchQA基准测试，包含900个因果链任务，评估Agent在复杂网络研究中的全面性。推出Interactions API，统一Agent与模型交互，支持服务器端状态管理和远程MCP工具。此外，DeepMind与英国政府合作，利用AI解决城市规划（Project Extract）和加速科学发现（自动化AI科学实验室）等公共行政问题。（来源：omarsar0, osanseviero, GoogleAIStudio, demishassabis, 36氪, 36氪, 36氪）

Meta内部“权力游戏”升级，AI发展路线面临分歧 : 纽约时报报道Meta内部围绕AI发展方向爆发冲突，扎克伯格的得意门生Alexandr Wang领导的TBD Lab团队，与首席产品官Chris Cox和首席技术官Andrew Bosworth等老将，在AGI愿景与产品商业化之间存在分歧。TBD Lab倾向于开发“神一般的AI超级智能”，而老将们则希望AI优化社交媒体推荐算法和广告业务。为支持AI雄心，Meta计划大幅削减Reality Labs（元宇宙）部门预算。此外，图灵奖得主Yann LeCun因理念不合离职，凸显Meta在AI战略转型中的阵痛。（来源：36氪, 36氪, 36氪, 36氪）

AI基础设施新范式：MCP协议捐赠Linux基金会，端云协同OpenCloudOS成AI时代优先选项 : Anthropic宣布将Model Context Protocol (MCP) 正式捐赠给新成立的Agentic AI基金会，由Linux基金会托管，旨在为AI智能体建立开放互联协议。MCP已成为Agent类产品的事实标准，获得VS Code、OpenAI、Google、阿里、字节、腾讯等广泛集成。同时，OpenCloudOS操作系统生态大会发布“OpenCloudOS Infra智能基座”，旨在构建统一AI算力底座，实现全栈AI基础设施体系，解决AI训练与推理规模爆发带来的基础设施割裂问题，支持全球主流GPU与AI框架“开箱即用”。（来源：AnthropicAI, 36氪, 36氪）

🎯 动向

英伟达发布8B Orchestrator模型，重构AGI生产力 : 英伟达推出80亿参数的Orchestrator模型，通过强化学习和多轮执行机制，作为轻量调度中枢指挥异构能力工具集，实现AI任务的降本增效。在HLE基准测试中，Orchestrator以37.1%的准确率超越GPT-5（35.1%），同时效率提升2.5倍，成本

AI日报 – 2025-12-12(晚)

🔥 聚焦

🎯 动向

发表回复取消回复

🔥 聚焦

🎯 动向

相关标签

Related Posts

AI日报 – 2025-12-12(早)

AI日报 – 2025-12-11(早)

AI日报 – 2025-12-10(早)

发表回复 取消回复

发表回复取消回复