关键词:Gemini 3 Flash, GPT-5.2, AI模型, SAM Audio, 人形机器人, MiMo-V2-Flash, 腾讯大模型, 多模态推理, 音频编辑AI, 具身机器人产能, 开源大模型, AI健康大模型
🔥 聚焦
谷歌发布Gemini 3 Flash : 谷歌发布Gemini 3 Flash,以极低成本提供前沿智能,价格仅为Pro版25%,但在MMMU-Pro、SWE-bench Verified等核心基准测试中超越Gemini 3 Pro,速度更是快3倍。该模型专为迭代式开发打造,具备接近Gemini 3 Pro的编程性能和低延迟,支持多模态推理,可用于视频分析、数据提取和视觉问答。Gemini 3 Flash已全面开放,普通用户可在Gemini应用和谷歌搜索AI模式中使用,开发者可通过API集成,有望将AI更广泛地嵌入日常应用和商业系统。(来源:36氪, 36氪)

OpenAI发布GPT-5.2系列模型 : OpenAI发布GPT-5.2系列模型,包括Pro、Thinking和Instant,以应对谷歌Gemini 3的竞争。GPT-5.2在ARC-AGI-1和ARC-AGI-2等抽象视觉谜题基准测试中创下新高,尤其在计算效率上显著提升,成本降至GPT-5.1的1/390。模型提供可调节的推理级别(包括x-high),并支持上下文摘要以扩展输入限制。此次发布旨在提升专业任务效率,如代码生成、电子表格和演示文稿制作,并强调在面对复杂推理任务时,其经济可行性大幅提高。(来源:DeepLearning.AI Blog)

AI模型自主解决开放数学问题 : GPT-5首次自主解决了一个提交到IMProofBench基准测试的开放数学问题,并给出了完整且正确的证明,无需人类提示或干预。这一突破是对枚举几何学的一个虽小但新颖的贡献,标志着AI模型在复杂数学推理和问题解决能力上的重大进展。这一事件引发了社区对AI在数学研究中潜力的广泛讨论,预示着AI未来可能在更多科学领域扮演更积极的发现角色。(来源:SebastienBubeck, kevinweil, gdb, OfirPress, SebastienBubeck)

Meta发布SAM Audio : Meta推出SAM Audio,这是首个统一的AI模型,允许用户从复杂的音频混合中隔离和编辑声音。该模型能够像Photoshop抠图一样“抠声音”,通过文本、视觉和时间跨度提示,实现隔离歌曲中的吉他、过滤交通噪音或去除播客中的狗叫声等功能。这一创新有望彻底改变音频编辑流程,使其像处理文本和图片一样简单,降低专业混音知识门槛,推动音频内容创作的普及和效率提升。(来源:ylecun, ylecun, dotey)
🎯 动向
云澎科技发布AI+健康新品 : 云澎科技与帅康、创维合作,发布AI+健康新品,包括“数智化未来厨房实验室”和搭载AI健康大模型的智能冰箱。AI健康大模型能优化厨房设计与运营,智能冰箱通过“健康助手小云”提供个性化健康管理。这标志着AI在日常健康管理和智能家居领域的深入应用,有望通过智能设备提供定制化健康服务,提升生活质量。(来源:36氪)

人形机器人行业面临产能困局 : 2025年具身机器人行业经历从爆火到降温,订单额超35亿元,但交付量不足千台,凸显产能困局。智元、优必选等头部企业订单激增,但量产能力仍处于百台级向千台级爬坡阶段。C端市场落地艰难,实用场景单一,价格高企,销量止步千台以内。行业面临炫技有余、实用不足的尴尬,如马拉松比赛中机器人表现出的稳定性短板。尽管挑战重重,政策支持和资本看好,行业正从“技术可行”走向“可靠商品”的转型期。(来源:36氪, 36氪)

美图公司AI转型与挑战 : 美图公司在AI浪潮下回归工具主线,通过美图秀秀、美颜相机等C端产品和美图设计室、开拍等B端生产力工具实现转型。RoboNeo作为AI Agent平台,集成第三方模型与自研Miracle Vision,旨在通过“AI生成+手动修正”解决AI落地痛点。然而,RoboNeo用户留存不佳,尤其在谷歌Nano Banana等竞品冲击下,海外B端市场增长不确定性加剧。尽管如此,美图凭借2亿MAU的流量基础和团队创新活力,在垂类SaaS领域仍有生存空间,未来将深耕技术与产品融合,应对大模型竞争。(来源:36氪)

小米发布MiMo-V2-Flash大模型 : 小米正式开源MiMo-V2-Flash大模型,以309B参数规模跻身开源第一梯队,实现2.6倍推理加速并兼顾顶尖模型效果与部署成本。该模型在SWE-Bench Verified代码评测中斩获73.4%高分,超越DeepSeek-V3.2和Kimi-K2 Thinking,并在Agent能力方面表现卓越。其采用5:1混合注意力机制、可学习注意力汇聚偏置、MTP多层Token预测及MOPD多教师在线策略蒸馏等技术,显著提升效率和长文本理解。MiMo-V2-Flash在真实编程场景中展现出极高完成度,并具备高情商的人文交互能力,标志着小米向“物理世界AGI”转型的野心。(来源:36氪)

腾讯大模型研发架构调整 : 腾讯调整大模型研发架构,任命OpenAI前研究员姚顺雨为“CEO/总裁办公室”首席AI科学家,直接向总裁刘炽平汇报,并兼任AI Infra部及大语言模型部负责人。此举旨在强化腾讯在算力、数据、工程化能力上的综合竞争力,改变此前在大模型研发上相对滞后的局面。姚顺雨的加入和新部门的设立,标志着腾讯将AI提升至公司核心战略地位,致力于构建以基础模型为核心的研发体系,以应对字节跳动、阿里巴巴等竞争对手在AI应用和模型能力上的挑战。(来源:36氪, 36氪, [36氪](https://www.36kr.com