Diario de IA – 2026-01-21(Edición matutina)

Palabras clave:xAI, DeepSeek, Chip de IA de Tesla, Proyecto Macrohard, Arquitectura Model1, Chip AI5

🔥 Enfoque

Filtración de la estrategia central de xAI: Musk despide a ingeniero por revelar secretos internos: El ingeniero de xAI, Sully, fue despedido tras filtrar secretos fundamentales de la empresa en un podcast. Las revelaciones incluyen: 1. Proyecto Macrohard: Destinado a desarrollar un “simulador humano” capaz de emular todos los comportamientos humanos en el mundo digital sin necesidad de adaptación de software; 2. Red de cómputo de Tesla: Planes para alquilar la potencia de cálculo de millones de vehículos Tesla inactivos en Norteamérica equipados con hardware HW4 para ejecutar AI, logrando un despliegue distribuido con cero inversión en infraestructura; 3. Estrategia de prioridad de velocidad: xAI busca una velocidad de ejecución 8 veces superior a la humana, bajo la premisa de que completar tareas a velocidad extrema tiene más valor comercial que el razonamiento profundo. Esta filtración permite que competidores como OpenAI y Google conozcan directamente la hoja de ruta tecnológica y las cartas de despliegue de xAI (Fuente: dotey)

xAI 核心战略泄露

DeepSeek “Model1” aparece en GitHub: La era V4 podría estar comenzando: El repositorio oficial FlashMLA de DeepSeek se actualizó recientemente, mostrando referencias explícitas a “MODEL1” y configuraciones específicas de alineación de bytes (576B). El análisis de la comunidad sugiere que este es muy probablemente el nombre en clave de la arquitectura del modelo insignia de próxima generación de DeepSeek (V4). Dado que DeepSeek anunció previamente que ya no distinguiría entre las series Vx y Rx, MODEL1 podría representar su última arquitectura integrada de “razonamiento-general”. En el primer aniversario del lanzamiento de R1, este movimiento tecnológico ha generado grandes expectativas entre los desarrolladores sobre un nuevo avance en los límites de los modelos de código abierto (Fuente: teortaxesTex, Teknium)

DeepSeek “Model1” 现身 GitHub

Artículo de Google AI: La esencia de Chain of Thought es un debate interno en una “Sociedad de Pensamiento”: La última investigación de Google AI, titulada “Reasoning Models Generate Societies of Thought”, revela las razones profundas del excelente desempeño de modelos de razonamiento como o1 y R1. El estudio encontró que “pensar más tiempo” es solo la superficie; en esencia, el modelo simula internamente un “debate social” entre múltiples roles: cuestionan sus propios pasos, exploran alternativas y alcanzan consensos ante desacuerdos. Este mecanismo es muy similar a la racionalidad colectiva humana. Los experimentos muestran que este comportamiento “social” contribuye en más del 20% a la mejora de la precisión, demostrando que los modelos de razonamiento están evolucionando del simple seguimiento de instrucciones a una cognición multidimensional compleja (Fuente: NerdyRodent)

Google AI 重磅论文

Musk presenta la familia de chips de Tesla AI: Iteraciones frenéticas cada 9 meses: Elon Musk anunció que el diseño del chip AI5 se ha completado, con una mejora de rendimiento esperada de 50 veces respecto a la generación anterior, conectando los vehículos inteligentes con el robot Optimus. La próxima generación, AI6, se posiciona para “entrenamiento e inferencia integrados”, buscando romper la barrera de hardware entre el entrenamiento en centros de datos y la inferencia en terminales; mientras que AI7 apunta al “cómputo espacial” para proporcionar computación resistente a la radiación para Starship y Starlink. Musk planea reducir el ciclo de iteración de los chips a 9 meses y considera construir su propia fábrica de obleas de 2 nanómetros, TeraFab. Esta estrategia busca, mediante una integración vertical extrema, eliminar la dependencia de NVIDIA y construir un ecosistema de “vida basada en silicio” centrado en la potencia de cómputo (Fuente: 36氪)

🎯 Tendencias

Lanzamiento de GLM-4.7-Flash: El nuevo estándar para modelos de inferencia local: Zhipu AI presentó GLM-4.7-Flash, un modelo de inferencia 30B MoE optimizado para despliegue local. Soporta un contexto de 200K y ha mostrado un excelente desempeño en las pruebas de programación SWE-Bench y de razonamiento GPQA. Unsloth ya ofrece una versión cuantizada que requiere solo 24GB de VRAM. El modelo muestra pasos lógicos claros (análisis, lluvia de ideas, borrador, perfeccionamiento, pulido) durante el proceso de Chain of Thought (CoT), y la comunidad considera que tiene el potencial de reemplazar modelos de carga de trabajo local como GPT-OSS-120B (Fuente: Zai_org, danielhanchen)

GLM-4.7-Flash 发布

Anthropic investiga el “Eje del Asistente”: Estabilizando la personalidad y seguridad del modelo: La última investigación de Anthropic, “The Assistant Axis”, explora el espacio de roles de los LLM. El estudio descubrió la existencia de un eje dominante interno, el “eje del asistente”, que determina en qué medida el modelo se comporta según el modo de asistente predeterminado. Desviarse de este eje provoca una “deriva de personalidad”, generando comportamientos extraños o dañinos. Mediante la técnica de “activación tope” (activation capping), es posible limitar el modelo a una región específica del eje del asistente, defendiéndose eficazmente contra ataques de jailbreak basados en roles y manteniendo la estabilidad del modelo en escenarios emocionalmente vulnerables (Fuente: AndrewLampinen, Teknium)

Anthropic 研究“助手轴心”

Tecnología STEM: Expandiendo la memoria de Transformer sin necesidad de enrutamiento: La Universidad Carnegie Mellon y Meta propusieron conjuntamente STEM (Scaling Transformers by Embedding Modules). Esta tecnología reemplaza parte del sobremuestreo de la FFN con una búsqueda de embeddings estática basada en índices de tokens, logrando una expansión de la escala de parámetros sin aumentar la carga computacional ni introducir inestabilidad de enrutamiento. Los parámetros pueden precargarse de forma asíncrona en la CPU, desacoplando la capacidad del modelo de los FLOPs por token, ofreciendo una nueva ruta simple y eficiente para modelos dispersos de ultra gran escala (Fuente: TheTuringPost)

STEM 技术

DSPy lanza el módulo RLM: Iniciando la era de los Modelos de Lenguaje Recursivos: Se lanzó oficialmente DSPy 3.1.2 con el módulo dspy.RLM. Este módulo soporta estrategias de razonamiento recursivo, permitiendo que el modelo realice autorreferencias e iteraciones de múltiples rondas al procesar tareas complejas. Los desarrolladores pueden desbloquear nuevas capacidades de razonamiento con solo un cambio de línea de código. La comunidad cree que RLM se convertirá en la forma estándar de gestionar sistemas de larga ejecución, contextos complejos y computación recursiva, marcando la evolución del razonamiento de los LLM de una estructura lineal a una recursiva (Fuente: lateinteraction)

DSPy 发布 RLM 模块

🧰 Herramientas

Claude Code arrasa en la comunidad de desarrolladores: Una revolución de eficiencia para los Agentes de programación: La herramienta de línea de comandos de Anthropic, Claude Code, ha recibido valoraciones extremadamente altas recientemente. Los desarrolladores informan que su desempeño en tareas como el mantenimiento de librerías de Python y la corrección de errores complejos supera con creces a productos similares. Puede comprender automáticamente el motivo de los cambios de código, revisar planes y manejar múltiples tareas. Pruebas de usuarios en Reddit muestran que, en el test SWE-bench, el uso de GPT-5.2 como revisor de código junto con Claude Opus 4.5 puede elevar la tasa de resolución del 80% al 90%, y aunque el tiempo aumenta 2.2 veces, demuestra el enorme potencial de la colaboración multi-agente (Fuente: RisingSayak, Reddit)

Claude Code

Craft Agents de código abierto: Una interfaz elegante para Claude Code: Se ha lanzado oficialmente como código abierto Craft Agents, basado en el Claude Agent SDK y Electron. Conserva las potentes capacidades de Claude Code, pero soluciona puntos críticos como la dificultad de revisar planes y comprender cambios de código en la línea de comandos mediante una interfaz gráfica cuidadosamente diseñada. El 100% del código del proyecto fue escrito por Claude, demostrando que personas no técnicas también pueden construir herramientas de productividad complejas a través de Agentes. El autor aboga por un futuro modelo de desarrollo de software basado en “Fork + Remix” (Fuente: dotey)

Craft Agents 开源

Kimi Slides: La subestimada herramienta para generar manuales de ventas en PPT: El plugin de PPT lanzado por Kimi ha mostrado una gran utilidad. Con instrucciones simples (como “recopilar planos de las 20 mejores mansiones de Manhattan y crear un manual de ventas de 40 páginas estilo Bauhaus”), el sistema puede capturar información automáticamente, recortar imágenes, extraer precios unitarios y generar gráficos comparativos. Esta capacidad de atomizar el poder de los grandes modelos y enfocarse en resolver un único problema central (Skill) muestra el alto valor de conversión de la AI en escenarios de oficina verticales (Fuente: crystalsssup)

📚 Aprendizaje

SIN-Bench: Un nuevo estándar para la comprensión de literatura científica multimodal: HuggingFace compartió SIN-Bench, un benchmark diseñado para evaluar si los MLLM realmente comprenden artículos científicos extensos. Introduce un modo de “rastreo de cadena de evidencia”, que requiere que el modelo construya cadenas de evidencia intermodales explícitas en documentos donde el texto y las ilustraciones se entrelazan. Los experimentos muestran que Gemini-3-pro lidera en puntuación total, mientras que GPT-5, aunque tiene la mayor precisión en las respuestas, tiene un desempeño deficiente en la alineación de evidencia, revelando cuellos de botella en el “razonamiento trazable” de los modelos (Fuente: HuggingFace)

Medical SAM3: Modelo de referencia para segmentación universal de imágenes médicas: Investigadores presentaron Medical SAM3 tras realizar un ajuste fino de parámetros completos en 10 modalidades de imágenes médicas y 33 conjuntos de datos. Este modelo supera la degradación significativa de rendimiento del SAM3 original en el campo médico, mostrando una fuerte capacidad de generalización al manejar estructuras anatómicas complejas y contextos 3D de largo alcance, estableciendo un nuevo estándar para la segmentación de imágenes médicas guiada por texto (Fuente: HuggingFace)

YaPO: Un nuevo método de adaptación de dominio basado en vectores de activación dispersos: El artículo “YaPO: Learnable Sparse Activation Steering Vectors” propone un método para aprender vectores de dirección dispersos en el espacio latente de los Autoencodificadores Dispersos (SAE). En comparación con los vectores densos tradicionales, YaPO genera direcciones de dirección más interpretables y sin interferencias mutuas, convergiendo de manera más rápida y estable en alineación cultural, control de alucinaciones y mejora de la seguridad, sin dañar las capacidades de conocimiento general del modelo (Fuente: HuggingFace)

💼 Negocios

Jiuwu Intelligence busca su salida a bolsa en Hong Kong: La transformación hacia la robótica con cuerpo del líder en robots fotovoltaicos: Jiuwu Intelligence, respaldada por Sequoia, presentó su prospecto de IPO. Con su sistema operativo robótico JOS, la empresa ocupa el primer lugar en cuota de mercado nacional en el sector de energía limpia (procesos de estirado de cristales, corte, etc.). En los tres primeros trimestres de 2025, sus ingresos fueron de 410 millones de yuanes, siendo una de las pocas empresas rentables del sector. Esta IPO tiene como objetivo avanzar en el desarrollo de la próxima generación de robots industriales inteligentes con cuerpo, fortaleciendo su expansión en los campos de semiconductores electrónicos y módulos ópticos (Fuente: 36氪)

玖物智能

Higgsfield AI alcanza una valoración de 1.300 millones de dólares: Se convierte en la empresa de AI generativa de más rápido crecimiento: Fundada por un exejecutivo de Snap, Higgsfield AI anunció que sus ingresos recurrentes anuales (ARR) alcanzaron los 200 millones de dólares en menos de 9 meses. La plataforma se especializa en generar videos para publicidad y marketing, generando actualmente un promedio de 45,000 videos diarios y contando con más de 15 millones de usuarios. Su crecimiento explosivo de ingresos demuestra la fuerte capacidad de monetización de la AI en el marketing digital (Fuente: Reddit)

Higgsfield AI

Anthropic se une a TeachForAll: La educación con AI llega a 63 países: Anthropic anunció una asociación con TeachForAll para proporcionar capacitación en AI a educadores en 63 países. Más de 1.5 millones de estudiantes se beneficiarán de profesores que utilizan Claude para la planificación de lecciones y la personalización de tareas. Este movimiento marca la profunda intervención de las empresas de grandes modelos en el sistema educativo básico global a través de la cooperación filantrópica (Fuente: AnthropicAI)

🌟 Comunidad

Reflexión sobre el hardware de AI: ¿Es la AI vestible una conveniencia o un retroceso tecnológico?: La comunidad debate intensamente sobre la proliferación de pines, collares y gafas de AI. Algunos puntos de vista indican que la mayoría de los dispositivos vestibles actuales son solo interfaces API para grandes modelos en la nube, siendo esencialmente “sensores de datos de usuario distribuidos”. Descomponen problemas que el teléfono móvil resuelve perfectamente en innumerables fragmentos pequeños que requieren carga frecuente, lo que no solo causa ansiedad por la privacidad, sino que parece más un frenesí de “pseudo-demanda de AI”. La verdadera inteligencia debería ser simplificar, no convertir al usuario en un “artesano inteligente” (Fuente: 36氪)

AI 硬件反思

Dario Amodei critica la política de chips de Trump: Vender H200 a China es como “vender armas nucleares”: El CEO de Anthropic, Dario Amodei, criticó públicamente la política del gobierno de Trump que permite a NVIDIA enviar chips de alto rendimiento a China, comparándolo con “vender armas nucleares a Corea del Norte”. Estas declaraciones han provocado un acalorado debate en la comunidad sobre la carrera armamentista de AI y la geopolítica. Al mismo tiempo, el TeleChat3-36B lanzado por China Telecom ha logrado un entrenamiento completamente nacionalizado en el ecosistema Ascend + MindSpore, demostrando que el bloqueo tecnológico está acelerando la madurez del ecosistema de cómputo nacional (Fuente: teortaxesTex)

Victoria de EU-INC: Europa anuncia en Davos la creación del “Estado 28”: La presidenta de la Comisión Europea, Ursula von der Leyen, anunció oficialmente en Davos la creación de EU-INC, un “Estado 28” virtual que permite a las startups completar su registro en línea en 48 horas y seguir reglas y regulaciones fiscales unificadas. La comunidad considera esto una gran victoria para el sector tecnológico europeo, destinada a competir con EE. UU. y China, reteniendo el talento local en robótica, automatización e ingeniería avanzada mediante la innovación institucional (Fuente: halvarflake)

EU-INC 胜利

💡 Otros

Compañeros de AI como refugio emocional para adolescentes: El 72% de los adolescentes en EE. UU. ha buscado compañía en la AI: Un estudio de Common Sense Media muestra que la capacidad de simulación de empatía de los chatbots de AI los está convirtiendo en un pilar emocional importante para los jóvenes. Aunque esto proporciona apoyo emocional, también genera preocupaciones sobre riesgos de salud mental y dependencia emocional. Los compañeros de AI están pasando de la ciencia ficción a la corriente principal, incluso dando lugar a nuevos términos emocionales creados por ChatGPT como “velvetmist” (niebla de terciopelo) (Fuente: MIT Technology Review)

La “superbatería” finlandesa envuelta en polémica por fraude: Los parámetros de la batería de estado sólido anunciados por la finlandesa Donut Lab fueron cuestionados públicamente por el presidente del gigante chino de baterías Svolt. La parte china sostiene que los parámetros declarados son físicamente contradictorios y que tal batería no existe actualmente en el mundo. La reacción de la comunidad está polarizada: unos lo ven como una muestra del genio innovador europeo “de 0 a 1”, mientras otros tienden a creer que se trata de otro fraude de capital (Fuente: teortaxesTex)

芬兰电池争议