AI日报 - 2025-12-18(晚)

关键词：Gemini 3 Flash, GPT-5.2, AI模型, SAM Audio, 人形机器人, MiMo-V2-Flash, 腾讯大模型, 多模态推理, 音频编辑AI, 具身机器人产能, 开源大模型, AI健康大模型

🔥 聚焦

谷歌发布Gemini 3 Flash : 谷歌发布Gemini 3 Flash，以极低成本提供前沿智能，价格仅为Pro版25%，但在MMMU-Pro、SWE-bench Verified等核心基准测试中超越Gemini 3 Pro，速度更是快3倍。该模型专为迭代式开发打造，具备接近Gemini 3 Pro的编程性能和低延迟，支持多模态推理，可用于视频分析、数据提取和视觉问答。Gemini 3 Flash已全面开放，普通用户可在Gemini应用和谷歌搜索AI模式中使用，开发者可通过API集成，有望将AI更广泛地嵌入日常应用和商业系统。（来源：36氪, 36氪）

OpenAI发布GPT-5.2系列模型 : OpenAI发布GPT-5.2系列模型，包括Pro、Thinking和Instant，以应对谷歌Gemini 3的竞争。GPT-5.2在ARC-AGI-1和ARC-AGI-2等抽象视觉谜题基准测试中创下新高，尤其在计算效率上显著提升，成本降至GPT-5.1的1/390。模型提供可调节的推理级别（包括x-high），并支持上下文摘要以扩展输入限制。此次发布旨在提升专业任务效率，如代码生成、电子表格和演示文稿制作，并强调在面对复杂推理任务时，其经济可行性大幅提高。（来源：DeepLearning.AI Blog）

AI模型自主解决开放数学问题 : GPT-5首次自主解决了一个提交到IMProofBench基准测试的开放数学问题，并给出了完整且正确的证明，无需人类提示或干预。这一突破是对枚举几何学的一个虽小但新颖的贡献，标志着AI模型在复杂数学推理和问题解决能力上的重大进展。这一事件引发了社区对AI在数学研究中潜力的广泛讨论，预示着AI未来可能在更多科学领域扮演更积极的发现角色。（来源：SebastienBubeck, kevinweil, gdb, OfirPress, SebastienBubeck）

Meta发布SAM Audio : Meta推出SAM Audio，这是首个统一的AI模型，允许用户从复杂的音频混合中隔离和编辑声音。该模型能够像Photoshop抠图一样“抠声音”，通过文本、视觉和时间跨度提示，实现隔离歌曲中的吉他、过滤交通噪音或去除播客中的狗叫声等功能。这一创新有望彻底改变音频编辑流程，使其像处理文本和图片一样简单，降低专业混音知识门槛，推动音频内容创作的普及和效率提升。（来源：ylecun, ylecun, dotey）

🎯 动向

云澎科技发布AI+健康新品 : 云澎科技与帅康、创维合作，发布AI+健康新品，包括“数智化未来厨房实验室”和搭载AI健康大模型的智能冰箱。AI健康大模型能优化厨房设计与运营，智能冰箱通过“健康助手小云”提供个性化健康管理。这标志着AI在日常健康管理和智能家居领域的深入应用，有望通过智能设备提供定制化健康服务，提升生活质量。（来源：36氪）

人形机器人行业面临产能困局 : 2025年具身机器人行业经历从爆火到降温，订单额超35亿元，但交付量不足千台，凸显产能困局。智元、优必选等头部企业订单激增，但量产能力仍处于百台级向千台级爬坡阶段。C端市场落地艰难，实用场景单一，价格高企，销量止步千台以内。行业面临炫技有余、实用不足的尴尬，如马拉松比赛中机器人表现出的稳定性短板。尽管挑战重重，政策支持和资本看好，行业正从“技术可行”走向“可靠商品”的转型期。（来源：36氪, 36氪）

美图公司AI转型与挑战 : 美图公司在AI浪潮下回归工具主线，通过美图秀秀、美颜相机等C端产品和美图设计室、开拍等B端生产力工具实现转型。RoboNeo作为AI Agent平台，集成第三方模型与自研Miracle Vision，旨在通过“AI生成+手动修正”解决AI落地痛点。然而，RoboNeo用户留存不佳，尤其在谷歌Nano Banana等竞品冲击下，海外B端市场增长不确定性加剧。尽管如此，美图凭借2亿MAU的流量基础和团队创新活力，在垂类SaaS领域仍有生存空间，未来将深耕技术与产品融合，应对大模型竞争。（来源：36氪）

小米发布MiMo-V2-Flash大模型 : 小米正式开源MiMo-V2-Flash大模型，以309B参数规模跻身开源第一梯队，实现2.6倍推理加速并兼顾顶尖模型效果与部署成本。该模型在SWE-Bench Verified代码评测中斩获73.4%高分，超越DeepSeek-V3.2和Kimi-K2 Thinking，并在Agent能力方面表现卓越。其采用5:1混合注意力机制、可学习注意力汇聚偏置、MTP多层Token预测及MOPD多教师在线策略蒸馏等技术，显著提升效率和长文本理解。MiMo-V2-Flash在真实编程场景中展现出极高完成度，并具备高情商的人文交互能力，标志着小米向“物理世界AGI”转型的野心。（来源：36氪）

腾讯大模型研发架构调整 : 腾讯调整大模型研发架构，任命OpenAI前研究员姚顺雨为“CEO/总裁办公室”首席AI科学家，直接向总裁刘炽平汇报，并兼任AI Infra部及大语言模型部负责人。此举旨在强化腾讯在算力、数据、工程化能力上的综合竞争力，改变此前在大模型研发上相对滞后的局面。姚顺雨的加入和新部门的设立，标志着腾讯将AI提升至公司核心战略地位，致力于构建以基础模型为核心的研发体系，以应对字节跳动、阿里巴巴等竞争对手在AI应用和模型能力上的挑战。（来源：36氪, 36氪, [36氪](https://www.36kr.com

🔥 聚焦

🎯 动向

相关标签

Related Posts

AI日报 – 2026-07-20

AI日报 – 2026-07-19

AI日报 – 2026-07-18