Diario de IA – 2026-01-03(Edición vespertina)

Palabras clave:Meta Llama 4, DeepSeek mHC, OpenAI Gumdrop, Fraude en los benchmarks de Llama 4, Arquitectura de hiperconexión con restricción de múltiple variedad, Diseño de hardware para lápiz de IA

🔥 Enfoque

Confirmada la manipulación de benchmarks de Meta Llama 4: LeCun revela la verdad tras su salida : Yann LeCun, ganador del Premio Turing, admitió públicamente al dejar Meta que los resultados de las pruebas del modelo base de Llama 4 fueron “maquillados”, utilizando modelos optimizados específicamente para diferentes tareas de evaluación con el fin de obtener puntuaciones altas. Esta revelación ha causado una gran conmoción en la comunidad de código abierto, exponiendo la ansiedad por los benchmarks entre las grandes tecnológicas en la carrera de los modelos base. LeCun señaló además que Mark Zuckerberg, decepcionado por el rendimiento de Llama 4, marginó al equipo original de Generative AI para invertir masivamente en Scale AI. Esto marca un giro importante en la ruta de investigación de Meta AI, pasando de un enfoque impulsado por la academia a uno más agresivo orientado a los negocios y la ingeniería (Fuente: Financial Times, Slashdot)

Meta Llama 4 跑分造假实锤

DeepSeek lanza la arquitectura mHC: Desafiando una década de tradición en Residual Connections : DeepSeek ha propuesto la arquitectura “Manifold-constrained Hyper-Connection” (mHC), intentando romper el paradigma de las Residual Connections que ha dominado el Deep Learning desde ResNet en 2015. Las conexiones residuales tradicionales presentan problemas de amplificación de señal e inestabilidad en el entrenamiento de redes profundas; mHC introduce una restricción de “matriz doblemente estocástica”, reduciendo la ganancia de señal de 3000 veces a solo 1.6 veces, mejorando significativamente la estabilidad y el rendimiento del modelo. Este avance muestra la ambición de los laboratorios de AI chinos en la innovación de arquitecturas fundamentales, yendo más allá de la simple expansión de escala para profundizar en la optimización de macro-arquitecturas (Fuente: arXiv, Reddit)

DeepSeek 发布 mHC 架构

Filtrado el proyecto de hardware “Gumdrop” de OpenAI: Jony Ive diseña un AI Pen : Fuentes de la cadena de suministro revelan que el proyecto de hardware de OpenAI en colaboración con el exjefe de diseño de Apple, Jony Ive, tiene el nombre en clave “Gumdrop” y se confirma como un AI Pen con capacidad de percepción ambiental. El dispositivo prescinde de la interacción tradicional por pantalla, centrándose en la voz y el tacto. El concepto de diseño busca el minimalismo y la “concentración”, con el objetivo de cubrir escenarios de trabajo profundo más allá del móvil y el ordenador. Este movimiento refleja el intento de OpenAI de establecer un punto de entrada nativo para la interacción con AI mediante hardware, aprovechando modelos de audio de nueva generación para una experiencia de “compañero inteligente” más natural (Fuente: APPSO, The Information)

OpenAI 硬件项目“软糖”曝光

Andrew Ng propone el “Test Turing-AGI”: Sustituyendo el engaño conversacional por el valor económico : Ante el excesivo hype sobre el concepto de AGI, Andrew Ng propuso en su edición especial de año nuevo 2026 establecer el “Test Turing-AGI”. Esta prueba ya no se centra en si la AI puede engañar a los humanos, sino en evaluar si puede completar tareas laborales de varios días con valor económico, como un empleado remoto cualificado, utilizando ordenadores e Internet. El núcleo de esta visión es devolver la AGI desde métricas intelectuales ilusorias hacia una dimensión pragmática de productividad, con el fin de calibrar las expectativas sociales sobre la AI mediante estándares más rigurosos y prácticos, evitando burbujas de inversión (Fuente: DeepLearning.AI)

吴恩达提出“图灵-AGI 测试”

🎯 Tendencias

Auge de los Recursive Language Models (RLM): Nueva tendencia para 2026 : Investigadores como Alex Zhang de la Universidad de Stanford proponen el concepto de Recursive Language Models, considerando que 2026 será el año del salto de los modelos de razonamiento a los modelos recursivos. El núcleo de los RLM es permitir que el modelo trate sus propios “prompts” como objetos en un entorno externo, manipulándose y llamándose a sí mismo de forma recursiva mediante la escritura de código. Este método puede aumentar la capacidad de procesamiento de contexto de los LLM en varios órdenes de magnitud, dotando a los modelos de una mayor capacidad de planificación de tareas a largo plazo y autocorrección. La comunidad coincide en que este escalado en el lado del razonamiento, al estilo de “The Bitter Lesson”, será una de las rutas clave para alcanzar la AGI (Fuente: arXiv, Stanford NLP)

递归语言模型(RLM)兴起

Crecimiento explosivo de Claude Code: 1.000 millones de dólares en ingresos en 6 meses : Anthropic reveló que su asistente de programación Claude Code ha alcanzado una tasa de ingresos anuales (ARR) cercana a los 1.000 millones de dólares en solo medio año, estableciendo un récord para herramientas de programación con AI. Su fundador, Boris Cherny, reveló que actualmente el 100% de su código personal es escrito por AI. La clave del éxito de Claude Code reside en su evolución de “autocompletado de código” a “ingeniero digital”, logrando un ciclo de desarrollo autónomo mediante plugins como Ralph Wiggum. Esto marca la entrada de la programación con AI en la era de la infraestructura empresarial, con una disposición a pagar significativamente mayor (Fuente: Sinziyuan, Boris Cherny)

Claude Code 爆发式增长

Guerra de talentos en Embodied AI: Salarios para recién graduados alcanzan los 3 millones de yuanes : Con gigantes como ByteDance y Huawei profundizando en Embodied AI, el talento de alto nivel en algoritmos se ha vuelto un recurso escaso. Los responsables de control de movimiento graduados en 2024 están recibiendo ofertas de 3 millones de yuanes anuales más opciones sobre acciones, y el salario mensual de expertos senior ha superado los 120.000 yuanes. Las empresas han activado el modo de “bloqueo anticipado”, ofreciendo incluso contratos a tiempo completo a estudiantes de tercer año de doctorado durante sus prácticas. Esta prosperidad irracional refleja la ansiedad colectiva de la industria ante la explosión tecnológica; se espera que la lucha por el talento continúe intensificándose hasta el nodo de producción a gran escala en 2027 (Fuente: Touzhong.com)

🧰 Herramientas

Plugin Ralph Wiggum: Permitiendo que Claude “trabaje horas extra” : Anthropic lanzó oficialmente el plugin Ralph Wiggum para Claude Code, que utiliza un mecanismo de Stop hook para interceptar comandos de salida y volver a alimentar el prompt al modelo. Este ciclo de “autodiálogo” permite que Claude mejore continuamente el código, ejecute pruebas y corrija errores sin intervención humana hasta emitir la señal “DONE”. Este modo de ciclo autónomo mejora enormemente la eficiencia en el desarrollo TDD y proyectos Greenfield, transformando el rol humano de “escritor” a “definidor de especificaciones” (Fuente: GitHub, Jintao Zhang)

Ralph Wiggum 插件

LlamaIndex lanza LlamaSheets: El némesis de las hojas de cálculo desordenadas : LlamaIndex presentó LlamaSheets en fase Beta, diseñado específicamente para resolver el problema de las hojas de cálculo del mundo real con formatos caóticos, celdas combinadas y encabezados complejos. La herramienta identifica automáticamente las áreas y las extrae en archivos Parquet limpios, conectándolos directamente con pandas o DuckDB. También ofrece más de 40 características de metadatos a nivel de celda, proporcionando un soporte sólido para el análisis automatizado de informes financieros y la limpieza de datos complejos, siendo un complemento vital para los sistemas RAG que manejan tablas no estructuradas (Fuente: LlamaIndex)

OpenCode, agente de programación Open Source: Un fuerte competidor para Claude Code : El popular proyecto de GitHub, OpenCode, ofrece un agente de programación con AI 100% de código abierto y sin dependencia de proveedores. Soporta Claude, OpenAI y modelos locales, utilizando una arquitectura cliente/servidor que permite a los usuarios desarrollar en ordenadores remotos desde dispositivos móviles. Con una interfaz TUI optimizada para usuarios de Neovim y soporte LSP integrado, se ha convertido en la opción preferida para desarrolladores que buscan libertad y una experiencia de terminal extrema. El proyecto ya cuenta con más de 45.000 estrellas (Fuente: GitHub)

OpenCode 开源编程代理

UltraShape-1.0: Nuevo estándar en generación de modelos 3D Open Source : El equipo del profesor Yuan Li de la Universidad de Pekín lanzó UltraShape-1.0, afirmando ser el generador de modelos 3D de código abierto más potente actualmente, superando el rendimiento de Trellis 2. El proyecto no solo libera el código de inferencia, sino también el preprocesamiento de datos y el código de entrenamiento, reduciendo drásticamente la barrera para la generación de activos 3D de alta calidad. Esto es de gran importancia para el desarrollo de juegos, realidad virtual y la construcción de entornos de simulación para Embodied AI (Fuente: GitHub)

UltraShape-1.0

📚 Aprendizaje

Tutorial de Física de Modelos de Lenguaje: Extrayendo principios de arquitectura de datos sintéticos : El Dr. Zeyuan Allen-Zhu de FAIR publicó la serie de tutoriales “Physics of Language Models”. Mediante experimentos en un “patio de juegos” controlado de datos sintéticos, derivó más de 20 principios arquitectónicos, explicando por qué las capas Canon son efectivas y por qué los modelos lineales son más débiles que los Transformer en profundidad de razonamiento. Estos videos revelan la lógica subyacente oculta por el ruido durante el escalado de modelos, siendo un recurso imprescindible para investigadores de AI que buscan entender los mecanismos internos de los modelos (Fuente: Zeyuan Allen-Zhu)

语言模型物理学教程

Programa OpenAI Grove: La academia de élite tecnológica para fundadores tempranos : OpenAI abrió las solicitudes para una nueva edición de Grove, un programa tecnológico de 5 semanas para fundadores en etapas iniciales. Los participantes recibirán mentoría directa de los equipos de investigación y aplicaciones de OpenAI, talleres prácticos y acceso anticipado a productos. El programa busca ayudar a los desarrolladores a explorar la vanguardia de las aplicaciones de AI en el entorno de hardware y software más denso en talento, siendo un canal central para entrar en el ecosistema de OpenAI (Fuente: OpenAI)

OpenAI Grove 计划

Revisión de Agentes Autoevolutivos: Hacia la Superinteligencia Artificial : Se ha vuelto viral en la comunidad el paper “A Survey on Self-evolving Agents”, que resume exhaustivamente cómo los agentes de AI mejoran sus capacidades mediante mecanismos de autoevolución. El contenido cubre cuándo, cómo y qué desafíos enfrenta esta evolución. En el contexto actual de explosión de agentes, entender cómo los modelos superan el rendimiento preestablecido por humanos mediante el feedback del entorno y la autoiteración es crucial para construir la próxima generación de sistemas autónomos (Fuente: TheTuringPost)

自进化代理综述

💼 Negocios

Zhipu AI y MiniMax inician la ola de salidas a bolsa en Hong Kong : La diferenciación entre los “Seis Pequeños Dragones” de los modelos chinos es evidente; Zhipu AI y MiniMax han sido los primeros en pasar la audiencia para cotizar en la bolsa de Hong Kong. Zhipu se centra en el negocio MaaS para el sector B, con más de un 80% de ingresos provenientes de ahí, enfatizando la base tecnológica y el empoderamiento industrial; MiniMax, por su parte, se expande globalmente a través de aplicaciones para el sector C como Talkie/Xingye, con más del 70% de sus ingresos provenientes del extranjero. La salida a bolsa de ambas empresas servirá como modelo importante para la transición de los modelos nacionales de la “narrativa tecnológica” a la “monetización comercial” (Fuente: Xiaguangshe)

智谱 AI 与 MiniMax 开启港股上市潮

Meta invierte 14.000 millones de dólares en Scale AI: Un CEO de 28 años toma el mando : Meta anunció una inversión masiva de 14.000 millones de dólares en el gigante del etiquetado de datos Scale AI, y contrató a su CEO de 28 años, Alexandr Wang, para liderar las nuevas iniciativas de AI de Meta. Este movimiento provocó directamente la marginación y salida de científicos veteranos como LeCun. Zuckerberg intenta obtener rápidamente recursos de datos de alta calidad para revertir el declive en el desarrollo de Llama 4, demostrando que Meta está acelerando a cualquier precio para alcanzar a OpenAI (Fuente: Financial Times)

🌟 Comunidad

El presidente de OpenAI, Greg Brockman, se convierte en el mayor donante de Trump : La comunidad debate intensamente sobre la donación masiva de Greg Brockman a un Super PAC de Trump. Los usuarios de Reddit reaccionaron con dureza, considerando que esto contradice los valores de “beneficio para la humanidad” y “gobernanza democrática” que OpenAI proclama, temiendo que las políticas de regulación de AI se inclinen hacia grupos de interés específicos. Algunos usuarios incluso han iniciado boicots cancelando sus suscripciones a ChatGPT, reflejando el gran impacto de las posturas políticas de los líderes tecnológicos en la credibilidad de la marca (Fuente: Reddit r/ChatGPT)

Greg Brockman 成为特朗普最大捐赠者

Aumenta la hostilidad de los ciudadanos estadounidenses hacia la AI: Ansiedad por energía, empleo y privacidad : Un análisis de The New York Times explora por qué los estadounidenses odian generalmente la AI. Las discusiones en Reddit señalan que el núcleo reside en: la infraestructura de AI (como centros de datos) que eleva las facturas de electricidad y el ruido local; el filtrado de CV por AI que causa rechazos constantes a los solicitantes de empleo; y la falta de un sistema de salud universal, donde el desempleo significa una crisis de supervivencia. Los ciudadanos sienten que los beneficios de la AI son monopolizados por las élites de Silicon Valley, mientras que las consecuencias las sufren las personas comunes. Este rechazo cultural se ha convertido en un obstáculo importante para la implementación de la tecnología (Fuente: Reddit r/artificial)

美国民众对 AI 敌意加剧

Escasez de hardware y ola de subidas de precios: Señales de “austeridad” en 2026 : Supermicro anunció que dejará de vender placas base independientes, vendiendo solo servidores completos; ASUS también anunció subidas de precios en toda su línea antes del CES 2026. La comunidad está preocupada, considerando que los fabricantes de hardware están monopolizando recursos para frenar el desarrollo de la Local Inference, obligando a los desarrolladores a recurrir a costosos servicios en la nube. Con el aumento del precio de la RAM, 2026 podría ser el año con los costes de hardware más altos para desarrolladores individuales y PYMES (Fuente: Reddit r/LocalLLaMA)

硬件短缺与涨价潮

Sospechas de que la AI se ha vuelto “tonta”: Usuarios cuestionan la limitación de velocidad y el throttling de los fabricantes : Han aparecido numerosas quejas en Reddit sobre la disminución de la calidad de respuesta de ChatGPT y Gemini. Los usuarios sospechan que, tras obtener un gran número de suscripciones, los fabricantes están aplicando “throttling” a los modelos para ahorrar costes de computación, resultando en respuestas superficiales, conservadoras y poco creativas. Aunque esto podría deberse a guardrails más estrictos o cambios en los system prompts, esta experiencia de “primero dulce, luego amargo” ha provocado un descontento colectivo entre los usuarios de pago (Fuente: Reddit r/ArtificialInteligence)

💡 Otros

Macy’s genera controversia al usar anuncios de ropa generados por AI : Macy’s ha sido objeto de burlas en redes sociales tras revelarse que comenzó a usar AI para generar modelos y fotos de ropa. Los críticos consideran que la textura de las prendas generadas por AI es falsa e incluso presenta deformidades en las proporciones humanas. Esta práctica no solo reduce la categoría de la marca, sino que también priva de oportunidades laborales a fotógrafos y modelos. Esto refleja los desafíos estéticos y éticos que enfrenta el comercio minorista tradicional al adoptar la AI para reducir costes (Fuente: Reddit r/artificial)

梅西百货使用 AI 生成服装广告引发争议

Logran eludir con éxito la marca de agua SynthID de Google : Investigadores publicaron un informe indicando que, mediante técnicas de postprocesamiento con modelos de Diffusion, es posible eliminar por completo la marca de agua invisible SynthID desarrollada por Google DeepMind. El estudio busca, mediante una divulgación responsable, impulsar a la industria a desarrollar tecnologías de identificación de contenido de AI más resilientes. Esto demuestra una vez más que las soluciones actuales basadas en perturbaciones de píxeles siguen siendo vulnerables ante ataques adversarios (Fuente: GitHub)

Previsión de profesiones futuras: Cirujano de trasplante de cabeza : MIT Technology Review repasó profesiones del futuro, mencionando el “trasplante de cabeza” que prepara el neurocirujano italiano Sergio Canavero. Aunque la idea es muy controvertida y fue vista como un fraude, el concepto está ganando nueva atención con el apoyo de los longevistas de Silicon Valley y robots quirúrgicos de precisión impulsados por AI. Este no es solo un desafío médico, sino el punto de encuentro definitivo entre la AI, la robótica y la bioética (Fuente: MIT Technology Review)

未来职业预想:换头手术医生