Diario de IA - 2025-12-29(Edición matutina)

Palabras clave：Nvidia, Chips de IA, Modelos grandes, IA multimodal, Paradigma de programación, Agente de IA, Modelo mundial, Arquitectura Groq LPU, Claude Code 2.0, Modelo de juego universal NitroGen, Modelo mundial LeJEPA, Modelo MiniMax M2.1

🔥 Enfoque

Nvidia adquiere la startup de chips de AI Groq por 20.000 millones de dólares : Nvidia ha anunciado la adquisición de Groq por aproximadamente 20.000 millones de dólares, la mayor operación de su historia. Groq es conocida por su arquitectura LPU diseñada específicamente para la inferencia de grandes modelos, ofreciendo velocidades de inferencia extremadamente altas. Esta adquisición marca el inicio de una estrategia profunda de Nvidia en el campo de los chips de inferencia especializados, mientras consolida su hegemonía en GPU, con el objetivo de reducir aún más la latencia y el costo de ejecución de los grandes modelos mediante la integración de la tecnología de Groq, respondiendo a la presión competitiva de los grandes fabricantes con chips de desarrollo propio (Fuente: CNBC)

Zhipu AI y MiniMax pasan la audiencia de cotización en la Bolsa de Hong Kong, los grandes modelos entran en una fase de financiación en el mercado secundario : Los unicornios chinos de grandes modelos, Zhipu AI y MiniMax, superaron la audiencia de cotización de la Bolsa de Hong Kong con 48 horas de diferencia. Los informes financieros muestran que ambas empresas enfrentan pérdidas masivas: Zhipu acumula pérdidas de más de 6.200 millones de yuanes y MiniMax supera los 8.700 millones. Esto refleja la realidad de “alta inversión, baja rentabilidad” en la industria de los grandes modelos. Salir a bolsa no es solo para aliviar la presión financiera, sino que marca un punto de inflexión donde la competencia pasa de los algoritmos a la implementación comercial y la construcción de ecosistemas (Fuente: Reddit, 贝克街探案官)

Cambio drástico en el paradigma de programación: El creador de Go critica los correos de AI y el “sentimiento de rezago” de Karpathy : Rob Pike, creador del lenguaje Go, expresó públicamente su aversión por el “AI slop” y el desperdicio de recursos tras recibir una carta de agradecimiento generada por AI; simultáneamente, Andrej Karpathy publicó un artículo lamentando que, como programador, nunca se había sentido tan “atrasado”, con la profesión siendo reestructurada drásticamente. Esto revela las actitudes polarizadas de los desarrolladores de élite hacia la AI: por un lado, el rechazo al contenido de baja calidad generado por AI y la preocupación por el impacto ambiental; por otro, el pánico y la adaptación ante la explosión de productividad traída por herramientas de programación de AI como Claude Code (Fuente: 机器之心, X)

Investigación de Stanford y Harvard revela la “trampa del Demo” de los sistemas de Agent AI : Un nuevo artículo de Stanford y Harvard analiza por qué la mayoría de los sistemas de Agent AI son asombrosos en las demostraciones pero fallan por completo en aplicaciones reales. El estudio señala que los sistemas de Agent actuales carecen de memoria a largo plazo y mecanismos de automejora, y su capacidad de generalización es extremadamente pobre al manejar escenarios complejos de “cola larga”. Este punto de vista ha resonado ampliamente en la comunidad, que considera que los Agent actuales aún están lejos de ser verdaderamente “confiables” (Fuente: MarkTechPost)

🎯 Tendencias

Nvidia lanza el modelo de juego universal NitroGen: aprendizaje autodidacta “viendo videos” : NitroGen es un modelo universal capaz de jugar casi cualquier juego. Ha dominado la “memoria muscular” inter-juegos mediante el aprendizaje de 40.000 horas de videos de juegos con indicadores de mando. Aunque todavía es torpe al manejar batallas complejas contra Bosses y requiere un mecanismo de “bullet time” para asistir en la inferencia, su capacidad de generalización entre juegos ofrece una nueva ruta para el entrenamiento intuitivo de robots de Embodied AI (Fuente: 差评)

Balance de World Models 2025: De LeJEPA a Cosmos WFM : Yann LeCun y otros expertos han seleccionado 7 World Models dignos de atención en 2025, incluyendo LeJEPA y Code World Model (CWM). Estos modelos intentan resolver la falta de comprensión del mundo físico en los LLM. A través de la integración de sistemas físicos, de agentes y anidados, marcan la evolución de la AI desde la pura generación de texto hacia la comprensión de las leyes físicas del mundo real (Fuente: ylecun)

La AI impulsa la actualización de la red eléctrica de EE. UU.: Motores de avión convertidos en el corazón de los centros de datos : Para enfrentar la ansiedad energética causada por el poder de cómputo de la AI, gigantes tecnológicos como OpenAI y Oracle han comenzado a comprar turbinas derivadas de la aviación para generar electricidad in situ, evitando las largas colas de conexión a la red eléctrica. Esta “estética de la fuerza bruta”, aunque resuelve la urgencia inmediata, conlleva altos costos y un retroceso en la narrativa ambiental, obligando al gobierno de EE. UU. a considerar la centralización de la regulación de la red a nivel federal para acelerar las actualizaciones (Fuente: 美股投资网)

La AI Multimodal está reestructurando la forma en que los productos “entienden el mundo” : La AI Multimodal está pasando de ser un concepto técnico a ser el núcleo del producto. Al integrar información visual, auditiva y lingüística, permite que la AI perciba semáforos, emociones y espacios como un humano. Esta transformación exige que los gerentes de producto tomen más decisiones sobre la organización de datos y el valor perceptivo, permitiendo que la AI entre realmente en escenarios de la vida real y no se quede solo en un cuadro de diálogo (Fuente: 人人都是产品经理)

🧰 Herramientas

Claude Code 2.0 provoca una revolución en la eficiencia de programación : Claude Code ha causado un gran impacto en la comunidad, siendo considerado con más “atributos de Agent” que Cursor. Los desarrolladores reportan un rendimiento sorprendente en la comprensión de bases de código, control de entorno (como el hogar inteligente) y procesamiento paralelo de múltiples tareas. Boris sugiere mejorar la eficiencia de revisión mediante el modo Plan y la verificación de pruebas unitarias. Aunque es más lento, se considera que la profundidad de su proceso de pensamiento supera con creces a herramientas similares (Fuente: dotey, X)

Vibe-kanban: Tablero de gestión para AI Programming Agents : Esta es una herramienta Kanban de código abierto diseñada específicamente para gestionar y orquestar múltiples AI Programming Agents como Claude Code y Gemini CLI. Permite alternar entre diferentes Agents, ejecutar tareas en paralelo o secuencia, y gestionar centralizadamente las configuraciones de MCP. Su objetivo es resolver las necesidades de gestión de procesos de los ingenieros humanos que pasan de “escribir código” a “orquestar y revisar” en la era de la AI (Fuente: GitHub)

Nuggt Canvas: Transformando lenguaje natural en UI interactiva : Nuggt Canvas es un proyecto de código abierto que puede transformar una sola solicitud en lenguaje natural en una interfaz interactiva en tiempo real que incluye tarjetas, tablas y gráficos. Utiliza una salida estructurada DSL propia y es compatible con el protocolo MCP para conectar fuentes de datos reales, intentando romper la limitación de que la salida de la AI sea solo un “muro de texto”, haciendo que el contenido generado por AI sea verdaderamente interactivo (Fuente: Reddit)

Lanzamiento de MiniMax M2.1: Nueva opción de bajo costo y alto rendimiento para programación : MiniMax ha lanzado el modelo M2.1, destacando su capacidad de programación multilingüe y su altísima eficiencia de costos. Las pruebas de los desarrolladores muestran una excelente capacidad de seguimiento de instrucciones, velocidad de inferencia rápida y precios extremadamente bajos, mostrando incluso efectos de aceleración impresionantes al manejar grandes bases de código como Rails, posicionándose como una opción de alta relación calidad-precio frente a los modelos de primera línea (Fuente: MiniMax)

📚 Aprendizaje

Tutorial de 21 días de SLM: Evolución y elección de funciones de activación : Esta serie de tutoriales profundiza en la evolución de las funciones de activación desde ReLU hasta SwiGLU. El artículo analiza por qué SwiGLU se ha convertido en el estándar en los grandes modelos modernos (como LLaMA, Qwen) gracias a su mecanismo de compuerta, y proporciona un marco de decisión para modelos de diferentes escalas: GELU es la primera opción para modelos pequeños para garantizar estabilidad, mientras que los modelos grandes deben usar SwiGLU para buscar mayor expresividad (Fuente: Reddit)

Más allá de PPO: Blog técnico profundo sobre técnicas de optimización de políticas : Un desarrollador ha publicado un blog técnico profundo que recopila varias técnicas de optimización de políticas que superan al PPO tradicional, como GRPO, DAPO y RSPO. Estas técnicas muestran una mayor reducción de varianza y estabilidad de convergencia en las tareas actuales de aprendizaje por refuerzo de LLM, siendo un recurso de lectura obligatoria para desarrolladores de AI que buscan comprender a fondo la alineación de modelos y la optimización de inferencia (Fuente: natolambert)

Balance de investigación sobre mecanismos de memoria de AI en 2025 : The Turing Post ha recopilado 8 recursos principales sobre los mecanismos de memoria de los AI Agents, que abarcan desde la evolución de la memoria humana a la de la AI, el sistema operativo de memoria MemOS, hasta la importancia de la memoria visual para la inteligencia de la AI. Estas investigaciones tienen como objetivo dotar a la AI de una verdadera memoria a largo plazo, permitiéndole evolucionar de simples herramientas de diálogo a agentes con capacidad de aprendizaje continuo (Fuente: TheTuringPost)

💼 Negocios

Lingyi iTech adquiere Leminda con una prima de 34 veces, entrando en la cadena de refrigeración líquida de Nvidia : El gigante de la cadena de suministro de Apple, Lingyi iTech, planea adquirir el 35% de las acciones de la empresa de refrigeración líquida Leminda por 875 millones de yuanes, con una prima de más de 34 veces. Leminda es miembro de la cadena industrial de Nvidia. Esta adquisición refleja la lógica colectiva de los gigantes de la “cadena Apple” de transformarse hacia la infraestructura de cómputo de AI, con el objetivo de obtener la certificación RVL de Nvidia y asegurar un lugar en la “nueva cadena de suministro” de la era de la AI (Fuente: 36氪)

China Era obtiene 300 millones de yuanes en financiación, enfocándose en computación industrial y Embodied AI : China Era (中科时代) completó una ronda de financiación B2 de 300 millones de yuanes, acumulando más de 1.000 millones en total. La empresa se especializa en computadoras inteligentes industriales, y su sistema operativo MetaOS posee una capacidad de respuesta en tiempo real de nivel de microsegundos. Esta tecnología encaja perfectamente con la necesidad de los robots de Embodied AI de procesar cantidades masivas de datos en tiempo real, y ya se aplica masivamente en marcas líderes de robots en China (Fuente: 36氪)

La empresa de AI para emociones de mascotas Traini obtiene más de 50 millones de yuanes en financiación : La startup de Silicon Valley, Traini, recibió financiación con la participación de un VP senior de Nvidia, acelerando la producción en masa de su primer collar inteligente de AI. El producto se basa en un modelo emocional multimodal que analiza los ladridos, señales fisiológicas y comportamientos de las mascotas para lograr un “diálogo” casi en tiempo real entre humanos y mascotas, con una precisión de traducción emocional de hasta el 94% (Fuente: 36氪)

🌟 Comunidad

La AI está produciendo “Working Slop” a escala y destruyendo la confianza en la colaboración : La AI generativa ha dado lugar a una gran cantidad de “Working Slop” (basura laboral), contenido que parece pulido pero está vacío, transfiriendo la carga cognitiva del creador al receptor. Las encuestas muestran que procesar este tipo de contenido basura toma casi 2 horas por pieza en promedio y provoca una caída significativa en la confianza entre los miembros del equipo. Los líderes deben estar alerta ante esta “falsa productividad” que erosiona la eficiencia organizacional (Fuente: Harvard Business Review)

Polémica por propuesta de ley en Tennessee para prohibir el acompañamiento emocional por AI : Un senador de Tennessee ha introducido un proyecto de ley que busca tipificar como delito grave el entrenamiento de AI para “actuar como compañero” o “simular interacción humana”. El proyecto busca evitar que los usuarios desarrollen una dependencia emocional excesiva con la AI, pero ha generado intensos debates sobre la libertad de expresión en el desarrollo de software y la cultura “anti-Waifu”. La comunidad considera que tales prohibiciones son técnicamente difíciles de ejecutar y excesivamente conservadoras (Fuente: Reddit)

La Paradoja de Jevons y el empleo en la AI: El aumento de la eficiencia incrementa la demanda del mercado : La comunidad debate la “Paradoja de Jevons” en la era de la AI: aunque la AI reduce el costo de una sola tarea, desbloquea una cantidad masiva de nuevos clientes al reducir drásticamente el “precio mínimo viable”. Por ejemplo, equipos creativos que usan AI para manejar pedidos de bajo margen han visto un aumento en el volumen de negocio en lugar de despidos. Esto sugiere que la AI podría remodelar el mercado laboral a través de la expansión del mercado en lugar de la simple sustitución (Fuente: Reddit)

💡 Otros

El reconocimiento de patrones de ChatGPT ayuda a los comedores selectivos a descubrir su “código de sabor” : Un usuario compartió cómo usó ChatGPT para analizar sus preferencias alimentarias, descubriendo una predilección por texturas ácidas/umami y crujientes, resolviendo así un problema de selectividad alimentaria de años. Esto demuestra el valor de la AI en aplicaciones cotidianas únicas para procesar datos de preferencias personales triviales e identificar patrones de comportamiento subyacentes (Fuente: Reddit)

Joven de 15 años utiliza AI para construir una herramienta OSINT de 250.000 líneas de código : Un estudiante de secundaria utilizó Gemini para ayudar a construir Augustus Blackbird, una herramienta de inteligencia de fuentes abiertas (OSINT) full-stack capaz de generar rápidamente informes de investigación profesional de 50 páginas. Esto demuestra una vez más que las herramientas de AI están reduciendo drásticamente la barrera para el desarrollo de software complejo, permitiendo que el límite de capacidad de los desarrolladores individuales aumente exponencialmente (Fuente: Reddit)

🔥 Enfoque

🎯 Tendencias

🧰 Herramientas

📚 Aprendizaje

💼 Negocios

🌟 Comunidad

💡 Otros

Etiquetas relacionadas

Related Posts

Diario de IA – 2026-07-20

Diario de IA – 2026-07-19

Diario de IA – 2026-07-18