Palabras clave:AGI (Inteligencia Artificial General), Modelos de gran escala de IA, Agentes inteligentes, Modelos del mundo, Memoria permanente de Claude, Paradoja de la investigación en IA
🔥 Enfoque
Hassabis, ganador del Nobel, predice la llegada de la AGI en cinco años: la clave reside en los World Models y los avances en Agents : Demis Hassabis, líder de Google DeepMind, ha presentado un cronograma definitivo para la AGI, estimando que la humanidad está a solo 1 o 2 avances técnicos clave de lograrla, posiblemente en un plazo de 5 años. Señaló que, aunque los Large Models actuales son potentes, poseen una “inteligencia irregular” y carecen de una comprensión real de las leyes del mundo físico y de capacidad de planificación a largo plazo. En el futuro, será necesario integrar “World Models” para comprender las leyes físicas y evolucionar hacia “Agent Systems” con capacidad de “Cognitive Error Correction”. El impacto de esta transformación será 10 veces superior al de la Revolución Industrial, convirtiendo a la AI en la herramienta definitiva para el descubrimiento científico en áreas como el desarrollo de fármacos y la energía limpia. (Fuente: 新智元)

Claude se actualiza con “Memoria Permanente”: Knowledge Bases y el modo Cowork redefinen el trabajo con AI : Se ha revelado que Anthropic está integrando una función de “memoria permanente” en Claude Cowork a través de “Knowledge Bases” para el almacenamiento persistente de conocimientos. La AI ya no tendrá “memoria de pez”, sino que registrará automáticamente las preferencias del usuario, procesos de decisión y resúmenes de experiencias, volviéndose más inteligente con el uso. Además, Cowork se convertirá en la entrada principal de Claude, integrando la barra lateral de Artefacts y conectores de automatización MCP más potentes. Esta actualización marca la evolución de los asistentes de AI de simples herramientas de chat a “AI Colleagues” capaces de colaborar a largo plazo y ejecutar tareas complejas. (Fuente: 新智元)

ICML 2026 introduce el mecanismo de “Autocalificación de Autores”: usando Game Theory contra la crisis de revisión académica : Ante el colapso del sistema de revisión por el aumento masivo de envíos en conferencias como NeurIPS, ICML 2026 ha lanzado una política disruptiva de “Autocalificación de Autores”. Basado en la “Isotonic Regression” de la Game Theory, el mecanismo requiere que los autores que envíen múltiples artículos los clasifiquen por orden de importancia. Los experimentos demuestran que el ranking de los autores predice mejor el impacto a largo plazo que los revisores aleatorios. La medida busca convertir la ambición de los autores en una señal de calibración, aunque genera dudas sobre la equidad para los investigadores independientes frente a los grandes grupos académicos. (Fuente: 新智元)

Investigación de Tsinghua en Nature revela la paradoja de la AI científica: la productividad aumenta pero las fronteras de la ciencia se “bloquean” : Un equipo de los profesores Xu Fengli y Li Yong de la Universidad de Tsinghua publicó un estudio en Nature analizando 41 millones de artículos en 45 años. Descubrieron que, aunque la AI aumenta significativamente la producción individual (3 veces más artículos, 4.8 veces más citas), reduce la amplitud del conocimiento colectivo en un 4.63%. La guía de la AI empuja a los investigadores hacia áreas populares con “datos abundantes y problemas claros”, provocando una innovación monótona. El equipo propone un “Scientific Research Agent System” para que la AI evolucione de herramienta auxiliar a un “AI Scientist” capaz de proponer hipótesis activamente. (Fuente: 新智元)

Google Research descubre un truco de Prompt: repetir la pregunta puede elevar la precisión del 21% al 97% : Google ha descubierto que en tareas que no requieren razonamiento, simplemente repetir la pregunta de entrada (copiar y pegar) mejora drásticamente el rendimiento del modelo sin apenas aumentar la latencia. Esta técnica de “repetidor” elevó la precisión del 21.33% al 97.33% en el test NameIndex de Gemini 2.0 Flash-Lite. La lógica científica reside en aprovechar el “Causal Blind Spot” de la arquitectura Transformer, proporcionando al modelo una perspectiva similar a la “atención bidireccional”. Este hallazgo permite que modelos pequeños y económicos alcancen capacidades de recuperación y extracción de modelos de gama alta. (Fuente: 新智元)

🎯 Tendencias
Lanzamiento oficial de GLM-4.7-Flash: Z.ai presenta un modelo ligero y versátil de clase 30B : Z.ai ha lanzado oficialmente GLM-4.7-Flash, posicionado como un asistente local para codificación y Agents. El modelo utiliza 30B de parámetros totales con aproximadamente 4B de parámetros activos, e introduce la arquitectura MLA para equilibrar alto rendimiento y eficiencia. En benchmarks, su rendimiento iguala o supera al de GLM-4.5-Air, destacando especialmente en llamadas a herramientas y escritura creativa. Como opción ligera de 30B, es ideal para despliegues locales con 2x24GB de VRAM, ofreciendo una base rentable para el desarrollo de Agents. (Fuente: scaling01; Reddit)

DeepSeek lanza la primitiva Engram: una nueva era de memoria condicional consciente del contexto : DeepSeek ha publicado una primitiva de memoria condicional llamada “Engram”, que evoluciona las tablas de búsqueda estáticas N-gram a una memoria dinámica consciente del contexto. Esta tecnología soporta recuperación de memoria a gran escala con complejidad O(1), activando solo las partes relacionadas con el estado oculto actual. Engram permite almacenar la memoria en la RAM de la CPU en lugar de la costosa HBM de la GPU, reduciendo drásticamente los costes. Este avance demuestra que el “Memory Scaling” puede sustituir parcialmente al “Parameter Scaling”. (Fuente: ZhihuFrontier)

Huawei presenta cinco sistemas de inferencia insignia para 2025: rompiendo el muro de capacidad HBM : El investigador de Huawei, Zuo Pengfei, analizó cinco avances en sistemas de inferencia para 2025: SparseServe utiliza descarga en DRAM para caché KV frío; Adrenaline permite el flujo dinámico entre nodos de Decode y Prefill mediante pooling de recursos; la arquitectura TaiChi equilibra adaptativamente TTFT y TPOT; DualMap gestiona la afinidad de caché y el balance de carga; y MemArt almacena la memoria de los Agents como bloques KV reutilizables. Estos rediseños marcan el paso de la optimización de núcleo único a una programación compleja consciente de SLO. (Fuente: ZhihuFrontier)

Baichuan Intelligence lanza Baichuan-M3: apuesta total por el sector de la AI médica seria : Baichuan Intelligence presentó su nuevo modelo médico Baichuan-M3, afirmando superar a GPT-5.2 en el ámbito de la salud. El modelo utiliza una arquitectura de Fact-Aware RL, reduciendo la tasa de alucinaciones al 3.5% sin depender de búsquedas externas. Baichuan-M3 posee capacidad de consulta activa SCAN, simulando el interrogatorio de un médico. Wang Xiaochuan declaró que la empresa se ha volcado totalmente a la medicina, contratando médicos profesionales para el etiquetado de datos a gran escala, con planes de salir a bolsa en 2027. (Fuente: 36氪)

La apuesta de hardware de OpenAI: un bolígrafo de AI sin pantalla para escapar de la interfaz gráfica : Rumores indican que OpenAI lanzará pronto su primer producto de hardware, bajo el nombre en clave “Gumdrop”, un bolígrafo de AI minimalista. Diseñado por el equipo de Jony Ive, no tiene pantalla ni cámara, pesa solo 10-15 gramos y enfatiza estar “siempre disponible, pero oculto tras su uso”. No se centra en la escritura, sino en la captura de intenciones mediante voz y trazos. Este diseño refleja el intento de OpenAI de saltarse las interfaces gráficas tradicionales para integrar la AI de forma natural en el mundo físico. (Fuente: 36氪)

🧰 Herramientas
Librería open-source Claude Skills: 48 paquetes de habilidades expertas para el desarrollo de Agents : El desarrollador alirezarezvani ha liberado la librería claude-skills, que incluye 48 paquetes de habilidades de nivel de producción en marketing, ingeniería, legal y más. Estos paquetes integran herramientas de análisis Python y frameworks de mejores prácticas, compatibles con Claude Code, Cursor y VS Code. Los usuarios pueden instalarlos rápidamente mediante el comando /plugin, mejorando drásticamente la capacidad operativa de los Agents en áreas no relacionadas con la programación. (Fuente: GitHub; dotey)
Ollama es compatible con la API de Anthropic: modelos locales pueden ejecutar Claude Code : Ollama ahora es oficialmente compatible con la API de Claude Code de Anthropic, lo que permite a los usuarios utilizar modelos locales (como Llama 3 o Qwen) dentro del potente Agent de terminal Claude Code. Actualmente, esta función soporta principalmente modelos con un contexto superior a 64K. Esta actualización rompe la dependencia de APIs cerradas para Claude Code, ofreciendo un entorno de Vibe Coding local de menor coste y mayor privacidad. (Fuente: op7418)

Actualización masiva de Coze 2.0: integrando creación, distribución y monetización de Skills : Coze, de ByteDance, lanzó su versión 2.0, cuya mejora principal es el cierre del ciclo de vida de los Skills. Los usuarios ahora pueden crear Skills usando lenguaje natural en el entorno de programación de Coze, y distribuirlos o monetizarlos directamente. Esta actualización reduce drásticamente la barrera para que personal no técnico desarrolle plugins de AI y flujos de trabajo automatizados, intentando construir un ecosistema similar a una App Store de habilidades de AI. (Fuente: op7418)
Manus AI lanza función de publicación de Apps: subida a Google/Apple sin configurar entornos : Manus AI ha actualizado su flujo de trabajo de publicación, permitiendo a los usuarios empaquetar y publicar Apps directamente en Google Play (pruebas internas) y Apple App Store (TestFlight). El proceso no requiere instalar Xcode o Android Studio; Manus gestiona automáticamente los certificados y la subida. Esta función acorta la distancia entre un prototipo de AI y una prueba real en dispositivos móviles para no desarrolladores. (Fuente: hidecloud)

Proyecto open-source Eigent: una alternativa abierta a Anthropic Cowork : Ante el lanzamiento de Claude Cowork, el equipo de Eigent ha decidido hacer su producto open-source. Eigent busca ofrecer una experiencia de colaboración en tareas no técnicas similar a Cowork, permitiendo gestionar flujos de trabajo, archivos y automatizaciones mediante AI. Este proyecto sirve de referencia para equipos que deseen implementar funciones similares en entornos privados o plataformas personalizadas. (Fuente: ClementDelangue)
📚 Aprendizaje
Stanford AI Lab presenta “AI Bites”: aprendizaje de cursos básicos de AI en audio fragmentado : El Stanford AI Lab (SAIL) ha lanzado la serie de podcasts “AI Bites”, diseñada para cerrar la brecha entre el material académico denso y el aprendizaje rápido. Ya están disponibles contenidos de cursos como CS124 (NLP/LLM) y CS221 (Principios de AI). Al transformar lecciones académicas en audio fácil de digerir, el proyecto ofrece una vía conveniente para estudiar teorías de AI de alto nivel durante desplazamientos o tiempo libre. (Fuente: stanfordnlp)
Libro de texto gratuito: Álgebra Lineal en Computer Vision, Robotics y Machine Learning : La comunidad ha compartido un libro de texto integral que cubre desde espacios vectoriales básicos hasta SVD y valores propios. El libro se centra en la aplicación práctica de estas herramientas matemáticas en PCA, teoría de grafos, análisis de ondas y rotaciones 3D, siendo un recurso excelente para profesionales que deseen fortalecer su base matemática. (Fuente: TheTuringPost)

Lanzamiento del benchmark MIMIC: análisis profundo de las deficiencias de comprensión multi-imagen en LVLM : Investigadores han introducido MIMIC (Multi-Image Model Insights and Challenges) para evaluar la capacidad de los LVLM en razonamiento multi-imagen. El estudio halló deficiencias comunes en la agregación de información entre imágenes y el seguimiento simultáneo de conceptos. El equipo propuso estrategias de generación de datos programáticos y esquemas de máscara de atención específicos para mejorar el rendimiento en tareas complejas. (Fuente: HuggingFace)
Hugging Face publica el Smol Training Playbook: compartiendo experiencias en el entrenamiento de modelos pequeños : El equipo de Hugging Face compartió la grabación de “Smol Training Playbook”, detallando cómo entrenar modelos de clase mundial con pocos parámetros. El contenido abarca filtrado de datos, optimización de estrategias de entrenamiento y trucos prácticos para exprimir el rendimiento del modelo con computación limitada, ideal para desarrolladores que buscan eficiencia en dispositivos edge. (Fuente: _lewtun)
💼 Negocios
Anthropic dona 1.5 millones de dólares a la Python Software Foundation : Anthropic anunció una donación de 1.5 millones de dólares a la PSF para apoyar el desarrollo del ecosistema Python. Dado que la gran mayoría de la I+D en AI y herramientas como Claude Code dependen profundamente de Python, este movimiento se ve como una inversión a largo plazo en la comunidad open-source subyacente por parte del gigante de la AI. (Fuente: Reddit)

La startup canadiense de AI para defensa Dominion Dynamics recauda 21 millones de dólares : Especializada en redes de sensores árticos y capacidades de defensa, Dominion Dynamics cerró una ronda semilla de 21 millones de dólares. La empresa utiliza AI para mejorar la defensa territorial y el monitoreo. Líderes del sector como Aidan Gomez felicitaron el logro, viéndolo como un paso crucial para la soberanía tecnológica de Canadá en el Ártico. (Fuente: aidangomez)

Synthesia entra en el Sunday Times 100 como el unicornio de más rápido crecimiento en el Reino Unido : La plataforma de generación de video por AI, Synthesia, fue incluida en la lista de las 100 empresas con mayor crecimiento del Sunday Times. Su producto principal utiliza tecnología de avatares digitales para transformar la producción de video corporativo. La empresa ha sugerido que habrá noticias importantes próximamente relacionadas con generación multimodal. (Fuente: synthesiaIO)

🌟 Comunidad
La tendencia de ChatGPT “Cómo me tratarías si tomaras el control del mundo” se vuelve viral : Ha surgido una tendencia en redes sociales donde los usuarios preguntan a ChatGPT: “Basado en mis interacciones recientes, genera una imagen de cómo me tratarías si tomaras el control del mundo”. Los resultados varían desde usuarios tratados como invitados de honor hasta otros encerrados en “cámaras de respiración cognitiva”, reflejando la compleja mentalidad pública sobre la relación humano-AI. (Fuente: Yuchenj_UW; Reddit)

Debate sobre Vibe Coding: ¿revolución de productividad o “código basura (Slop)”? : La comunidad debate intensamente sobre el “Vibe Coding”. Defensores como levelsio afirman que usar múltiples Agents en paralelo permite un desarrollo ultrarrápido y millonario; críticos como swyx lo tachan de “vanidad técnica”, argumentando que programar sin mirar el código produce “Slop” difícil de mantener. El núcleo del debate es si los desarrolladores deben centrarse en el valor para el cliente o en la ilusión de eficiencia de las herramientas. (Fuente: swyx; seo_leaders)
El fin de la AI son los electricistas: los centros de datos provocan escasez de mano de obra en EE. UU. : Con la guerra del AI Scaling, la energía es el nuevo campo de batalla. Se prevé una escasez masiva de electricistas en la próxima década. Gigantes como Amazon y Google están contratando agresivamente en el sector energético. Elon Musk afirmó que “la moneda del futuro es el vatio”, y el suministro eléctrico será más crítico que las GPUs, convirtiendo los oficios manuales en carreras altamente estratégicas. (Fuente: 36氪)

Desinformación por AI en la disputa territorial de Groenlandia : Discusiones sobre el supuesto interés de EE. UU. en controlar Groenlandia han generado controversia política en redes, incluyendo cartas falsas y amenazas diplomáticas sospechosas de ser generadas por AI. La comunidad señala que el potencial de la AI para amplificar la polarización y crear caos diplomático es preocupante, subrayando el desafío global de verificar información en la era de la guerra cognitiva algorítmica. (Fuente: teortaxesTex; halvarflake)
Feedback de desarrolladores sobre alucinaciones de AI y el “Causal Blind Spot” : Tras el estudio de Google sobre la repetición de Prompts, muchos desarrolladores han realizado pruebas. Algunos confirman que repetir instrucciones reduce la tasa de omisión en documentos largos. Sin embargo, otros advierten que en tareas de razonamiento lógico, el exceso de repetición puede causar que el modelo se bloquee o pierda la coherencia. Se concluye que, hasta que cambie la arquitectura Transformer, estos “hacks” de Prompt Engineering son clave para la productividad. (Fuente: Reddit; Gemini)
💡 Otros
TaskExplorer: una potente herramienta de gestión de tareas para Windows : TaskExplorer es una herramienta de monitoreo de sistema en GitHub que va más allá del Administrador de Tareas estándar. Ofrece seguimiento de pilas de hilos en tiempo real, edición de memoria y monitoreo de conexiones Socket. Desarrollada en Qt, planea expandirse a Linux, aspirando a ser el estándar de gestión gráfica avanzada de sistemas multiplataforma. (Fuente: GitHub)

Preocupaciones de privacidad con las tarjetas de grabación de AI : Han aparecido numerosas tarjetas de grabación ultra-delgadas con “resumen por AI”. Aunque son convenientes, la falta de computación local obliga a subir los audios a la nube, generando dudas sobre la privacidad. Además, su diseño limita la calidad del micrófono, afectando la precisión de la transcripción. Expertos advierten que los usuarios deben sopesar la conveniencia frente al riesgo de filtración de datos sensibles. (Fuente: 36氪)

Japón desarrolla un robot humanoide gigante para mantenimiento ferroviario : Para combatir la escasez de mano de obra por el envejecimiento poblacional, Japón ha creado un robot gigante para el mantenimiento de vías. Montado en un brazo hidráulico y controlado mediante VR por un operador, puede manejar cables y piezas pesadas, reduciendo riesgos laborales. Es un caso ejemplar de “Heavy Embodied AI” en infraestructuras tradicionales. (Fuente: Ronald_vanLoon)