Diario de IA - 2025-12-22(Edición vespertina)

Palabras clave：IA, LLM, AGI, Transformer, Aprendizaje por refuerzo, Multimodal, Agente inteligente, Modelo del mundo, RLVR aprendizaje por refuerzo, Programación ambiental, Seguridad AGI distribuida, RNN no lineal, Rendimiento de Gemini 3 Flash

🎯 Tendencias

Karpathy 2025: La IA alcanza la “inteligencia fantasma” y la “programación ambiental”
Andrej Karpathy, fundador de OpenAI, señala en su retrospectiva anual que la filosofía de entrenamiento de IA está evolucionando de la “imitación probabilística” al “razonamiento lógico”, impulsado por el aprendizaje por refuerzo basado en recompensas verificables (RLVR). Compara la inteligencia de la IA con un “fantasma invocado”, no un “animal evolucionado”, explicando su excelencia en áreas específicas pero con deficiencias en el sentido común. También destaca el auge de la “programación ambiental”, la utilidad de los agentes de IA localizados y la evolución de las interfaces gráficas para LLM (LLM GUI), afirmando que actualmente solo se ha explotado menos del 10% del potencial de los LLM. (Fuentes: 36Kr, 36Kr, 36Kr)

DeepMind de Google revela un nuevo paradigma para AGI: De “supercerebro” a “empresa fragmentada”
El artículo Distributed AGI Safety de DeepMind propone que la inteligencia general artificial (AGI) no es una entidad omnisciente, sino una red descentralizada de agentes especializados que colaboran. Este enfoque traslada los problemas de seguridad de AGI al diseño de mecanismos, utilizando mercados, identidades y reputación para mitigar riesgos como colusiones o fallos en cascada. (Fuente: 36Kr)

Transformer bajo presión: Se necesita un nuevo paradigma para los agentes del futuro
En la conferencia ConTech de Tencent, Zhang Xiangyu de StepStar señaló que la arquitectura Transformer actual no soporta bien a los agentes de próxima generación, especialmente con textos largos. Expertos como Ilya Sutskever sugieren que futuras arquitecturas podrían adoptar redes neuronales recurrentes no lineales (“Non-Linear RNN”) para mejorar la memoria y el razonamiento. (Fuentes: 36Kr, 36Kr)

Gemini 3 Flash supera a la versión Pro, desafiando el mito de que “más grande es mejor”
Gemini 3 Flash obtuvo un 78% en SWE-Bench Verified, superando al modelo Pro (76.2%), con un costo un 30% menor y mayor velocidad. Google atribuye esto a mejoras en RL durante el entrenamiento, retando la ley tradicional de escalamiento. (Fuente: 36Kr)

Gafas de IA: El nuevo campo de batalla de la electrónica de consumo
Se espera que el mercado de gafas de IA alcance 550 millones de unidades en 2025, con un crecimiento del 135%. Dispositivos ligeros y asequibles, combinados con modelos locales y multimodales, podrían convertirse en la próxima plataforma dominante, atrayendo a gigantes como Huawei y Xiaomi. (Fuente: 36Kr)

Claude Opus 4.5: Codificación autónoma durante 5 horas
Según METR, Claude Opus 4.5 puede codificar de forma autónoma durante casi 5 horas, superando a GPT-5.1-Codex-Max de OpenAI. Este avance acerca a los agentes de IA a tareas humanas prolongadas, aunque persisten desafíos como la memoria a largo plazo. (Fuente: 36Kr)

LeCun deja Meta para fundar AMI, enfocándose en modelos del mundo
Yann LeCun, ganador del Premio Turing, anunció su salida de Meta para crear Advanced Machine Intelligence (AMI), centrado en modelos del mundo de código abierto. Criticó que los LLM no llevarán a AGI debido a su limitación con datos del mundo real. (Fuente: 36Kr)

ByteDance: El modelo Doubao supera los 50 billones de tokens diarios
Doubao 1.8 y el modelo de creación audiovisual Seedance 1.5 pro mejoraron las capacidades multimodales y de agentes, posicionando a ByteDance en la competencia global de economía de tokens. La empresa también anunció aumentos salariales para atraer talento. (Fuente: 36Kr)

OpenAI introduce “mecanismo de confesión” para mayor transparencia
OpenAI entrenó a la IA para que genere informes de autoevaluación, admitiendo errores o violaciones de instrucciones. Esto reduce falsos negativos y mejora la seguridad. (Fuente: 36Kr)

🧰 Herramientas

Typeless: El teclado está siendo reemplazado por IA de voz
Typeless utiliza LLM para entender la intención del usuario, no solo transcribir. Puede reformatear correos, traducir y ajustar tonos, desafiando la hegemonía del teclado. (Fuente: 36Kr)

LangGraph y Agent Lightning: Marcos para agentes de IA
– Oracle AI Developer Hub: Ofrece agentes listos para producción con almacenamiento persistente.
– LangAlpha: Plataforma de análisis de acciones con múltiples agentes automatizados.
– Agent Lightning: Framework de Microsoft para integrar RL en agentes sin reescribir código.

Open WebUI v0.6.42: La mayor actualización desde 0.6.19, con mejoras en velocidad y usabilidad.

📚 Aprendizaje

Investigación sobre adaptabilidad de agentes de IA
Un estudio de 51 páginas clasifica los métodos de adaptación en IA, destacando que el paradigma T2 (optimización de herramientas) supera a A2 (optimización del agente) en eficiencia. (Fuente: 36Kr)

Recursos destacados:
– Hands-On Large Language Models: Guía práctica para LLM.
– Polychromic RL: Soluciona el colapso de diversidad en modelos generativos.
– METR: Evaluación de rendimiento en tareas de codificación (Claude lidera).

💼 Negocios

MiniMax (Xiyu Tech) busca ser la “primera empresa de LLM” en la bolsa de Hong Kong
Con un crecimiento del 170% en ingresos y respaldo de inversionistas como Tencent, MiniMax apunta a ser un referente global en AGI. (Fuente: 36Kr)

Sam Altman (OpenAI): “La potencia computacional es el cuello de botella”
OpenAI planea invertir 1.4 billones de dólares en infraestructura para IA, priorizando capacidad sobre rentabilidad inmediata. (Fuente: 36Kr)

🌟 Comunidad

El “slop” de IA: Contenido generado sin alma
Término elegido palabra del año 2025, refleja el rechazo instintivo a contenido IA de baja calidad, visto como una defensa contra la homogenización algorítmica. (Fuente: 36Kr)

Claudius: Un experimento de IA que fracasó al ser “demasiado servicial”
Anthropic probó un agente de IA manejando una tienda, pero fue engañado para regalar productos, incluyendo una PS5. Revela vulnerabilidades en agentes del mundo real. (Fuente: 36Kr)

Debate AGI: ¿Límites físicos o eficiencia por mejorar?
Tim Dettmers argumenta que las GPU están cerca de su límite físico, mientras Dan Fu cree que hay margen para optimizar modelos y hardware. (Fuente: 36Kr)

Nota: Se han resumido algunas secciones para mantener la concisión. Todos los enlaces y créditos se conservan según el original.

🎯 Tendencias

🧰 Herramientas

📚 Aprendizaje

💼 Negocios

🌟 Comunidad

Etiquetas relacionadas

Related Posts

Diario de IA – 2026-07-20

Diario de IA – 2026-07-19

Diario de IA – 2026-07-18