关键词:GPT-5.2, OpenAI, AI模型, 专业工作能力, Agent工具调用, 视觉能力, 上下文窗口, 知识库更新, GPT-5.2 Thinking模型, GDPval基准测试, SWE-Bench Pro记录, ARC-AGI-1突破, 统计学习理论

🔥 聚焦

OpenAI发布GPT-5.2系列模型,专业工作能力显著提升 : OpenAI推出GPT-5.2 Instant、Thinking、Pro三款模型,旨在解决高难度知识型工作。在OpenAI的GDPval基准测试中,GPT-5.2 Thinking在44种职业任务中70.9%的情况下超越或持平人类专家,效率提升11倍,成本低于1%。模型在通用智能、超长文本理解、Agent工具调用及视觉能力上全面进化,知识库更新至2025年8月31日,并支持40万上下文窗口。其在SWE-Bench Pro上创下55.6%的新纪录,在ARC-AGI-1上首次突破90%大关,并在科学研究中辅助解决了统计学习理论的开放性问题。虽然价格上涨40%,但OpenAI强调其更高Token效率带来的性价比。(来源:36氪, 36氪, 36氪, 36氪, 36氪, 36氪, 36氪, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ArtificialInteligence

GPT-5.2来了,首个“专家级”AI复仇成功,牛马打工人终于得救了

迪士尼与OpenAI达成10亿美元合作,Sora获200+IP授权 : 迪士尼宣布向OpenAI投资10亿美元并签署三年期授权协议,允许Sora和ChatGPT Images使用200多个迪士尼、皮克斯、漫威和星球大战的标志性IP角色(仅限动画/插画版本,不含真人肖像/声音)生成短视频和图像。部分UGC内容未来有望登上Disney+平台。此举标志着AI在内容创作领域从工具走向平台,迪士尼旨在通过负责任的AI使用扩大叙事影响力,同时也是对AI版权挑战的积极应对。(来源:kylebrussell, dotey, 36氪, 36氪, 36氪, 36氪, Reddit r/ChatGPT

GPT-5.2 上线,迪士尼投出 10 亿美元:AI 不止提效,还要讲故事

谷歌Deep Research Agent升级并开放API,DeepMind与英国政府合作推动AI治国 : 谷歌发布全新Gemini Deep Research Agent,基于Gemini 3 Pro模型,优化了网页搜索功能并能以更低成本生成深度研究报告,在HLE测试中得分46.4%,略高于GPT-5.2。同时开源DeepSearchQA基准测试,包含900个因果链任务,评估Agent在复杂网络研究中的全面性。推出Interactions API,统一Agent与模型交互,支持服务器端状态管理和远程MCP工具。此外,DeepMind与英国政府合作,利用AI解决城市规划(Project Extract)和加速科学发现(自动化AI科学实验室)等公共行政问题。(来源:omarsar0, osanseviero, GoogleAIStudio, demishassabis, 36氪, 36氪, 36氪

谷歌最新版「深度研究」反击GPT-5.2

Meta内部“权力游戏”升级,AI发展路线面临分歧 : 纽约时报报道Meta内部围绕AI发展方向爆发冲突,扎克伯格的得意门生Alexandr Wang领导的TBD Lab团队,与首席产品官Chris Cox和首席技术官Andrew Bosworth等老将,在AGI愿景与产品商业化之间存在分歧。TBD Lab倾向于开发“神一般的AI超级智能”,而老将们则希望AI优化社交媒体推荐算法和广告业务。为支持AI雄心,Meta计划大幅削减Reality Labs(元宇宙)部门预算。此外,图灵奖得主Yann LeCun因理念不合离职,凸显Meta在AI战略转型中的阵痛。(来源:36氪, 36氪, 36氪, 36氪

Meta「内战」升级:做「神一般的AI」,还是守住「社交帝国」?

AI基础设施新范式:MCP协议捐赠Linux基金会,端云协同OpenCloudOS成AI时代优先选项 : Anthropic宣布将Model Context Protocol (MCP) 正式捐赠给新成立的Agentic AI基金会,由Linux基金会托管,旨在为AI智能体建立开放互联协议。MCP已成为Agent类产品的事实标准,获得VS Code、OpenAI、Google、阿里、字节、腾讯等广泛集成。同时,OpenCloudOS操作系统生态大会发布“OpenCloudOS Infra智能基座”,旨在构建统一AI算力底座,实现全栈AI基础设施体系,解决AI训练与推理规模爆发带来的基础设施割裂问题,支持全球主流GPU与AI框架“开箱即用”。(来源:AnthropicAI, 36氪, 36氪

AI版「互联网协议」面世,豆包手机们再也不怕被「封禁」了?

🎯 动向

英伟达发布8B Orchestrator模型,重构AGI生产力 : 英伟达推出80亿参数的Orchestrator模型,通过强化学习和多轮执行机制,作为轻量调度中枢指挥异构能力工具集,实现AI任务的降本增效。在HLE基准测试中,Orchestrator以37.1%的准确率超越GPT-5(35.1%),同时效率提升2.5倍,成本

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注