Diario de IA – 2025-12-18(Edición vespertina)

Palabras clave:Gemini 3 Flash, GPT-5.2, Modelo de IA, SAM Audio, Robot humanoide, MiMo-V2-Flash, Modelo grande de Tencent, Razonamiento multimodal, IA de edición de audio, Capacidad de producción de robots encarnados, Modelo grande de código abierto, Modelo grande de IA para la salud

🔥 En Foco

Google lanza Gemini 3 Flash: Google ha lanzado Gemini 3 Flash, que ofrece inteligencia de vanguardia a un costo extremadamente bajo, solo el 25% del precio de la versión Pro, pero superando a Gemini 3 Pro en benchmarks clave como MMMU-Pro y SWE-bench Verified, y siendo 3 veces más rápido. Este modelo está diseñado para el desarrollo iterativo, con un rendimiento de programación cercano al de Gemini 3 Pro y baja latencia. Soporta inferencia multimodal, lo que permite su uso en análisis de video, extracción de datos y preguntas y respuestas visuales. Gemini 3 Flash ya está completamente disponible; los usuarios comunes pueden usarlo en la aplicación Gemini y en el modo AI de la Búsqueda de Google, y los desarrolladores pueden integrarlo a través de API, lo que promete una integración más amplia de la IA en aplicaciones cotidianas y sistemas comerciales. (Fuente: 36氪, 36氪)

谷歌甩出“价格屠夫”,Gemini 3 Flash超Pro,成本仅1/4,速度如“闪电”

OpenAI lanza la serie de modelos GPT-5.2: OpenAI ha lanzado la serie de modelos GPT-5.2, que incluye Pro, Thinking e Instant, para competir con Gemini 3 de Google. GPT-5.2 ha establecido nuevos récords en benchmarks de rompecabezas visuales abstractos como ARC-AGI-1 y ARC-AGI-2, destacando por una mejora significativa en la eficiencia computacional, con un costo reducido a 1/390 del de GPT-5.1. El modelo ofrece niveles de inferencia ajustables (incluido x-high) y soporta resumen de contexto para extender los límites de entrada. Este lanzamiento tiene como objetivo mejorar la eficiencia en tareas profesionales, como la generación de código, hojas de cálculo y presentaciones, y enfatiza que su viabilidad económica ha mejorado considerablemente al enfrentar tareas de razonamiento complejas. (Fuente: DeepLearning.AI Blog)

OpenAI’s Answer to Gemini 3, Runway’s Interactive Worlds, Disney’s Alliance With OpenAI, Adapting LLMs for Low-Data Domains

Modelo de IA resuelve de forma autónoma un problema matemático abierto: GPT-5 ha resuelto por primera vez de forma autónoma un problema matemático abierto presentado en el benchmark IMProofBench, proporcionando una prueba completa y correcta sin necesidad de indicaciones o intervención humana. Este avance es una contribución pequeña pero novedosa a la geometría enumerativa y marca un progreso significativo en la capacidad de los modelos de IA para el razonamiento matemático complejo y la resolución de problemas. Este evento ha provocado una amplia discusión en la comunidad sobre el potencial de la IA en la investigación matemática, presagiando que la IA podría desempeñar un papel más activo en el descubrimiento en más campos científicos en el futuro. (Fuente: SebastienBubeck, kevinweil, gdb, OfirPress, SebastienBubeck)

AI模型自主解决开放数学问题

Meta lanza SAM Audio: Meta ha presentado SAM Audio, el primer modelo de IA unificado que permite a los usuarios aislar y editar sonidos de mezclas de audio complejas. Este modelo puede “recortar sonidos” como Photoshop recorta imágenes, utilizando indicaciones de texto, visuales y de lapso de tiempo para aislar una guitarra en una canción, filtrar el ruido del tráfico o eliminar ladridos de perro en un podcast. Esta innovación promete revolucionar los procesos de edición de audio, haciéndolos tan sencillos como procesar texto e imágenes, reduciendo la barrera del conocimiento profesional de mezcla y promoviendo la popularización y eficiencia de la creación de contenido de audio. (Fuente: ylecun, ylecun, dotey)

🎯 Tendencias

Yunpeng Technology lanza nuevos productos de IA+salud: Yunpeng Technology, en colaboración con Shuaikang y Skyworth, ha lanzado nuevos productos de IA+salud, incluyendo el “Laboratorio de Cocina del Futuro Digitalizado” y un refrigerador inteligente equipado con un gran modelo de IA para la salud. El gran modelo de IA para la salud puede optimizar el diseño y la operación de la cocina, mientras que el refrigerador inteligente, a través del “Asistente de Salud Xiaoyun”, ofrece gestión de salud personalizada. Esto marca una aplicación profunda de la IA en la gestión diaria de la salud y en el ámbito del hogar inteligente, con el potencial de proporcionar servicios de salud personalizados a través de dispositivos inteligentes y mejorar la calidad de vida. (Fuente: 36氪)

云澎科技发布AI+健康新品

La industria de robots humanoides enfrenta un dilema de capacidad de producción: En 2025, la industria de robots encarnados experimentó un paso de la euforia a la moderación, con pedidos que superaron los 3.500 millones de yuanes, pero con menos de mil unidades entregadas, lo que subraya un dilema de capacidad de producción. Empresas líderes como Zhiyuan y Ubtech vieron un aumento masivo de pedidos, pero su capacidad de producción aún está en la fase de escalar de cientos a miles de unidades. El mercado de consumo (C-end) enfrenta dificultades para su implementación, con escenarios de uso únicos, precios elevados y ventas que no superan las mil unidades. La industria se enfrenta a la vergüenza de mostrar mucha tecnología pero poca practicidad, como las deficiencias de estabilidad mostradas por los robots en carreras de maratón. A pesar de los desafíos, el apoyo político y el optimismo del capital indican que la industria está en un período de transición de “técnicamente factible” a “producto confiable”. (Fuente: 36氪, 36氪)

人形机器人的尴尬生意:订单超35亿,交付不足千台

Transformación y desafíos de Meitu en IA: Meitu, en medio de la ola de la IA, regresa a su línea principal de herramientas, logrando una transformación a través de productos para el consumidor (C-end) como Meitu Xiuxiu y Meiyan Camera, y herramientas de productividad para empresas (B-end) como Meitu Design Studio y Kaipai. RoboNeo, como plataforma de AI Agent, integra modelos de terceros con su propio Miracle Vision, con el objetivo de resolver los puntos débiles de la implementación de la IA mediante la “generación de IA + corrección manual”. Sin embargo, la retención de usuarios de RoboNeo no es buena, y la incertidumbre sobre el crecimiento del mercado B-end en el extranjero se intensifica, especialmente con el impacto de competidores como Google Nano Banana. A pesar de esto, Meitu, con su base de tráfico de 200 millones de MAU y la vitalidad innovadora de su equipo, aún tiene espacio para sobrevivir en el campo del SaaS vertical. En el futuro, profundizará en la integración de tecnología y productos para enfrentar la competencia de los grandes modelos. (Fuente: 36氪)

美图:AI席卷,“垂类SaaS”有活路吗?”

Xiaomi lanza el gran modelo MiMo-V2-Flash: Xiaomi ha lanzado oficialmente el gran modelo de código abierto MiMo-V2-Flash, que con 309B parámetros se posiciona en el primer nivel de modelos de código abierto, logrando una aceleración de inferencia de 2.6 veces y combinando efectos de modelos de primera línea con costos de implementación. Este modelo obtuvo una alta puntuación del 73.4% en la evaluación de código SWE-Bench Verified, superando a DeepSeek-V3.2 y Kimi-K2 Thinking, y demostrando capacidades excepcionales de Agent. Utiliza tecnologías como el mecanismo de atención híbrida 5:1, el sesgo de agrupación de atención aprendible, MTP (Multi-layer Token Prediction) y MOPD (Multi-teacher Online Policy Distillation), lo que mejora significativamente la eficiencia y la comprensión de textos largos. MiMo-V2-Flash muestra un alto grado de finalización en escenarios de programación reales y posee una alta inteligencia emocional en la interacción humana, lo que marca la ambición de Xiaomi de transformarse hacia la “AGI del mundo físico”. (Fuente: 36氪)

小米大模型“杀”进第一梯队:代码能力开源第一,智商情商全在线

Tencent ajusta la arquitectura de I+D de grandes modelos: Tencent ha ajustado su arquitectura de I+D de grandes modelos, nombrando a Yao Shunyu, ex investigador de OpenAI, como Científico Jefe de IA para la “Oficina del CEO/Presidente”, reportando directamente al Presidente Liu Chiping, y asumiendo también el cargo de director del departamento de AI Infra y del departamento de Grandes Modelos de Lenguaje. Esta medida tiene como objetivo fortalecer la competitividad integral de Tencent en capacidad de cómputo, datos y capacidades de ingeniería, cambiando la situación anterior de relativo retraso en la investigación y desarrollo de grandes modelos. La incorporación de Yao Shunyu y la creación de nuevos departamentos marcan que Tencent eleva la IA a una posición estratégica central de la empresa, dedicándose a construir un sistema de I+D centrado en modelos fundamentales para enfrentar los desafíos de ByteDance, Alibaba y otros competidores en aplicaciones de IA y capacidades de modelos. (Fuente: 36氪, 36氪, 36氪)