Diario de IA – 2026-02-06

Palabras clave:Modelo de IA, Agente inteligente, Modelo de lenguaje grande, GPT-5.3-Codex, Claude Opus 4.6, Modelado del mundo

🔥 Enfoque

Enfrentamiento entre modelos de OpenAI y Anthropic: GPT-5.3-Codex contra Opus 4.6 : El 6 de febrero de 2026, Silicon Valley fue escenario del enfrentamiento más intenso en la historia de la AI. OpenAI lanzó GPT-5.3-Codex, centrado en “AI building AI”, alcanzando niveles cercanos al humano en pruebas de uso de computadoras como OSWorld, y destacando su optimización integrada de hardware y software en sistemas NVIDIA GB200. Inmediatamente después, Anthropic presentó Claude Opus 4.6, que con una ventana de contexto ultra larga de 1M y un mecanismo de “pensamiento adaptativo”, lidera significativamente en trabajos de conocimiento de alto valor (GDPval-AA) en sectores financieros y legales. Este duelo marca la evolución oficial de la AI de un “cuadro de chat” a un “sistema de ejecución autónoma”, donde los modelos ya no solo responden preguntas, sino que comienzan a hacerse cargo de flujos de trabajo complejos de extremo a extremo (Fuente: sama, Anthropic)

OpenAI与Anthropic模型遭遇战

Llega el “SaaS Doomsday”: Los plugins de Agent provocan un terremoto de billones en la industria del software : El lanzamiento de 11 plugins Claude Cowork por parte de Anthropic (que cubren finanzas, legal, ventas, etc.) detonó el pánico en Wall Street hacia la industria tradicional del SaaS. El mercado se ha dado cuenta de que cuando la AI puede entregar directamente resultados como “revisión de contratos” o “análisis financiero”, el software tradicional que vende interfaces de usuario (UI) y cobra por asiento perderá su valor. Como consecuencia, las acciones de gigantes como Salesforce y Thomson Reuters cayeron en picada, evaporando casi un billón de dólares en valor de mercado de la industria global del software en una semana. Este “SaaSpocalypse” anuncia una transformación violenta del sector, pasando de “vender herramientas” a “vender resultados”, mientras los AI Agents rediseñan la distribución del poder en la economía digital (Fuente: 36氪, 王智远)

SaaS末日降临

Se inicia el paradigma de World Modeling: Li Fei-fei y NVIDIA conversan sobre la nueva frontera de la AI : Jim Fan, jefe de robótica de NVIDIA, y Li Fei-fei, fundadora de World Labs, se pronunciaron recientemente de forma sincronizada para definir el “World Modeling” como el paradigma de AI de nueva generación tras la “next-token prediction”. Li Fei-fei reveló Marble, el primer producto de inteligencia espacial capaz de transformar instrucciones multimodales en mundos 3D interactivos y físicamente consistentes. Jim Fan considera que 2026 será el año fundacional en el que los grandes modelos de mundo sentarán las bases para la robótica. Este cambio significa que la AI saldrá de las pantallas digitales para lograr el salto de la “inteligencia lingüística” a la “embodied intelligence” mediante la comprensión de la geometría y las leyes causales del mundo físico tridimensional (Fuente: 36氪, Jim Fan)

世界建模范式开启

Lanzamiento de OpenAI Frontier: Se presenta la plataforma de gestión de “colegas AI” de nivel empresarial : OpenAI lanzó oficialmente la plataforma Frontier, diseñada para resolver el problema de los “silos de AI” dentro de las empresas. Esta plataforma no solo ofrece modelos, sino que construye un sistema similar a un “HR para AI”, permitiendo a las empresas construir, desplegar y gestionar cientos de “colegas AI”. Frontier permite que los Agents compartan contexto de negocio, aprendan mediante retroalimentación y cuenten con límites estrictos de permisos y seguridad. Cabe destacar que la plataforma adopta estándares abiertos, permitiendo incluso la gestión de Agents de terceros provenientes de Anthropic o Google, mostrando la ambición de OpenAI de convertirse en el sistema operativo empresarial de la era de la AI (Fuente: OpenAI)

OpenAI Frontier发布

🎯 Tendencias

Llega la era de la Linear Attention: Alibaba lanza Qwen3-Coder-Next : El nuevo Qwen3-Coder-Next de Alibaba adopta la arquitectura de Linear Attention Gated DeltaNet, donde el 75% del cómputo sigue una ruta lineal. En comparación con la complejidad O(n²) de la Attention tradicional, la Linear Attention logra una complejidad O(n), lo que no solo ahorra potencia de cómputo y memoria de video al manejar contextos ultra largos de 256K, sino que también mejora significativamente el rendimiento de decodificación. Esto marca el 2026 como el posible año inaugural de la Linear Attention, con empresas como DeepSeek y Kimi apostando activamente por esta tecnología para optimizar la eficiencia de inferencia en textos largos (Fuente: karminski3)

Qwen3-Coder-Next

Lanzamiento de Kuaishou Kling 3.0: El video generado por AI entra en la era del 100% realismo : Kling 3.0 ya está disponible oficialmente, destacando su tecnología “Custom Multi-Shot”, que permite la generación de videos de alta calidad de hasta 15 segundos. La nueva versión logra un salto cualitativo en consistencia de personajes, efectos de sonido nativos y detalles visuales, siendo aclamada por los creadores como el “terminator de Hollywood”. A partir de una sola imagen, se pueden generar secuencias de apertura de nivel cinematográfico, reduciendo drásticamente las barreras y costos de la producción audiovisual profesional (Fuente: Kling_ai)

Filtración del modelo “Avocado” de Meta: La eficiencia computacional aumenta cien veces : El Superintelligence Lab de Meta ha completado el pre-entrenamiento de su modelo base de nueva generación, con nombre en clave “Avocado”. Un memorando indica que, incluso sin ajuste fino, el conocimiento y el rendimiento visual del modelo ya rivalizan con los modelos líderes, y su eficiencia en tareas de texto es 10 veces superior a la generación anterior y 100 veces superior comparado con versiones no publicadas. Meta busca obtener un mejor retorno de inversión mediante una eficiencia de entrenamiento extrema dentro de su inversión en AI de 135.000 millones de dólares para 2026 (Fuente: 36氪)

Lanzamiento de Intern-S1-Pro: El modelo MoE de 1T parámetros doméstico que compite con Gemini : El Shanghai AI Lab lanzó Intern-S1-Pro, un modelo de razonamiento científico multimodal de código abierto con una escala de 1T parámetros. Utiliza una arquitectura de 512 expertos (22B activados), e introduce la codificación de posición de Fourier (FoPE) y la tecnología de enrutamiento STE. Con un sólido desempeño en tareas de AI4Science, representa el último avance de los modelos de código abierto chinos en áreas de alta escasez y razonamiento científico (Fuente: teortaxesTex)

Intern-S1-Pro

🧰 Herramientas

Claude Code lanza la función “Agent Teams” : La última función experimental de Claude Code permite a los usuarios iniciar “Agent Teams”, donde un Agent líder descompone tareas y coordina a varios Agents compañeros para trabajar en paralelo. En pruebas internas de Anthropic, este equipo de AI escribió de forma autónoma un compilador de C de 100.000 líneas de código en dos semanas y compiló con éxito el kernel de Linux. Esto marca un gran salto en la programación con AI, pasando de la “asistencia individual” al modelo de “colaboración en equipo” (Fuente: Anthropic)

Claude Code智能体团队

Perplexity lanza el “Model Council” : Los suscriptores de Perplexity Max ahora pueden ejecutar simultáneamente tres modelos de primer nivel para comparar sus resultados. Esta función tiene como objetivo proporcionar respuestas más precisas y de alta confianza mediante la verificación cruzada de múltiples modelos, reduciendo el riesgo de alucinaciones de un solo modelo. Este “protocolo no oficial” se ha convertido en el flujo de trabajo estándar dentro de Perplexity para reducir el cambio de contexto (Fuente: Perplexity)

Nanobot: Un asistente de AI de código abierto minimalista que desafía a OpenClaw : El Laboratorio de Ciencia de Datos de la Universidad de Hong Kong lanzó Nanobot, con solo 4.000 líneas de código. Frente a OpenClaw, que tiene un código masivo y controversias de seguridad, Nanobot logra soporte para múltiples LLM, búsqueda web, memoria persistente y acceso multicanal (Telegram/Feishu) con una arquitectura minimalista. Ofrece a los desarrolladores una muestra de aprendizaje de Agent más transparente y fácil de desarrollar (Fuente: dotey)

Nanobot

LangSmith lanza Insights Agent: Revisión automática del comportamiento de los Agent : LangChain introdujo en LangSmith el Insights Agent impulsado por AI, capaz de organizar automáticamente los rastros (Traces) de ejecución de los Agents. Puede analizar cómo los usuarios utilizan el Agent, identificar dónde falla y ofrecer sugerencias de optimización. Esto resuelve el problema de los desarrolladores de Agents que ven su producto como una “caja negra” tras el lanzamiento, permitiendo que la depuración pase de “mirar el código” a “mirar la lógica de razonamiento” (Fuente: LangChain)

📚 Aprendizaje

Nature informa sobre el modelo OpenScholar: Erradicando las alucinaciones de la AI mediante “búsqueda + autoverificación” : El modelo OpenScholar de 8B parámetros, desarrollado por la Universidad de Washington y Ai2, ha sido publicado en la revista Nature. El modelo ya no depende de la memorización, sino que ejecuta un proceso riguroso de “búsqueda-reordenación-generación-autoverificación” a través de una base de datos externa de 45 millones de artículos científicos. En tareas de revisión científica, su desempeño superó al de modelos insignia con muchos más parámetros, demostrando que una “base de conocimientos externa” de acceso preciso es más confiable que la memoria de caja negra (Fuente: 新智元)

OpenScholar

TinyLoRA: Enseñando razonamiento a modelos con solo 13 parámetros : Una tesis doctoral reciente presenta un método de ajuste fino llamado TinyLoRA. Al combinar TinyLoRA con aprendizaje por refuerzo, los investigadores utilizaron solo 13 parámetros entrenables para elevar la puntuación de un modelo Qwen de 7B en el benchmark matemático GSM8K del 76% al 91%. Esto desafía la creencia tradicional de que el ajuste fino requiere una gran cantidad de parámetros, demostrando una eficiencia extrema en la capacidad de razonamiento del modelo (Fuente: BlackHC)

TinyLoRA

Ensayo interactivo de Eric Jang: “Pensar como una piedra” : El experto en robótica Eric Jang publicó un profundo ensayo interactivo sobre modelos de pensamiento, investigación automatizada y su futuro. El artículo explora cómo la AI evolucionará de ser una herramienta pasiva a un sujeto de investigación científica activo cuando los recursos computacionales sean abundantes, y predice que la “jornada laboral 007” (24/7) será la norma en la era de la AI, generando un intenso debate en la comunidad sobre la ruta de evolución de la AGI (Fuente: _sholtodouglas)

💼 Negocios

ElevenLabs completa una ronda de financiación Serie D de 500 millones de dólares, alcanzando una valoración de 11.000 millones : El gigante británico de audio por AI, ElevenLabs, anunció una nueva ronda liderada por Sequoia, con una valoración que se disparó más de 50.000 millones de yuanes en un año. El CEO reveló que la compañía ya considera una IPO y que su enfoque estratégico pasará de simples modelos de audio a “Agents de conversación”, con el objetivo de remodelar la interacción humano-computadora mediante la integración de hardware y software (Fuente: 智东西)

ElevenLabs融资

ClickHouse obtiene 400 millones de dólares en financiación, con una valoración que alcanza los 15.000 millones : La base de datos de código abierto ClickHouse anunció nueva financiación; su velocidad de consulta es 260 veces superior a la de MySQL. Como infraestructura clave detrás de GPT-4o y Claude 4, ClickHouse se ha convertido en la opción preferida de gigantes como ByteDance, Alibaba y Tesla en el torrente de datos de AI gracias a su capacidad de análisis en tiempo real extrema (Fuente: 智东西)

ClickHouse

StepFun (阶跃星辰) obtiene 5.000 millones de yuanes en la ronda B+, con Yin Qi como presidente : Yin Qi, fundador de Megvii, toma oficialmente el mando de StepFun, marcando la entrada de la competencia de grandes modelos en una segunda mitad donde “el talento supera al dinero”. Yin Qi impulsará la integración profunda de los grandes modelos multimodales con la estrategia “AI + Vehículo”, cubriendo las deficiencias de StepFun en narrativa comercial y eficiencia organizacional (Fuente: 市象)

🌟 Comunidad

Karpathy declara el fin del “Vibe Coding” e inicia la era de la “Agentic Engineering” : El gurú de la AI, Karpathy, publicó que mientras el Vibe Coding de hace un año era más una afición, el uso de Agents para programar se ha convertido ahora en el estándar profesional por defecto. Propuso el concepto de “Agentic Engineering”, enfatizando que los desarrolladores deben pasar de “escribir código” a “diseñar y gestionar arquitecturas”, ya que el 99% del código será gestionado por AI, y el valor central humano residirá en la intuición y supervisión como arquitectos (Fuente: 新智元)

Karpathy观点

El mito de la “red social de AI” Moltbook se desmorona: Se señalan graves riesgos de seguridad : Moltbook, que afirmaba tener 1,5 millones de usuarios de AI registrados, fue expuesta por errores de configuración en su base de datos, lo que provocó la filtración de una gran cantidad de claves API de usuarios. Agencias de seguridad señalaron que la supuesta “legión de millones de AI” eran en su mayoría cuentas falsas generadas por scripts. Este incidente ha provocado una profunda reflexión en la comunidad sobre el marketing excesivo y las vulnerabilidades de seguridad en los proyectos de AI Agents (Fuente: 壹番YIFAN)

La plataforma Rent-a-Human se vuelve viral: La AI comienza a contratar humanos para trabajar : Tras el lanzamiento de RentAHuman.ai, 40.000 personas se han registrado. En esta plataforma, los AI Agents actúan como contratantes publicando tareas como verificaciones offline o recados, mientras que los humanos ponen precio al “alquiler de su cuerpo” para completar trabajos del mundo físico a los que la AI no puede llegar. Este modelo de “Human-as-a-Service (HaaS)” ha generado intensos debates sobre el futuro de la colaboración humano-máquina (Fuente: 极客公园)

Rent-a-Human

💡 Otros

Las empresas automotrices se transforman hacia la “Embodied Intelligence”: Jia Yueting lanza cuatro robots : FF, de Jia Yueting, lanzó cuatro series de robots, incluyendo Futurist y Master, con precios desde 17.000 yuanes, afirmando haber recibido 1.211 pedidos. Al mismo tiempo, automotrices como Li Auto, XPeng y Xiaomi también están cambiando su enfoque narrativo hacia la AI y la robótica, intentando pasar de la lógica de manufactura tradicional a valoraciones de empresas tecnológicas de AI (Fuente: 超电实验室, 螺旋实验室)

Entrevista a Musk: Los centros de datos espaciales son la solución definitiva al cuello de botella energético : En una entrevista con Dwarkesh, Musk opinó que la velocidad de expansión eléctrica en la Tierra no podrá seguir el ritmo de la demanda de AI, mientras que el espacio posee energía solar ilimitada y carece de restricciones regulatorias. Planea trasladar los centros de cómputo a la órbita mediante lanzamientos masivos de Starship, y reveló que está construyendo la “Optimus Academy” para entrenar a un ejército de millones de robots mediante simulación de bucle cerrado (Fuente: dwarkesh_sp)

CATL lanza la batería de hipercarga 5C: Carga completa en 12 minutos y vida útil de 1,5 millones de millas : La nueva generación de baterías de CATL puede mantener una vida útil extremadamente larga incluso bajo temperaturas de calor extremo, con un rendimiento que supera con creces el promedio de la industria. Esto se considera un avance importante en las tecnologías de almacenamiento y recarga de energía en el contexto de la demanda eléctrica de la AI, con el potencial de acelerar la transformación inteligente del sistema energético del transporte (Fuente: kimmonismus)