Palabras clave:IA, Código Claude, OpenAI, Colaboración multiagente, Fijación de precios orientada a resultados, Comercialización de vLLM
🔥 Focus
Gran actualización de Claude Code: Task sustituye oficialmente a Todo, iniciando una nueva era de colaboración multi-Agent : Anthropic presenta una actualización principal para Claude Code, introduciendo la función “Tasks” diseñada específicamente para ingeniería compleja a largo plazo, eliminando por completo la antigua herramienta Todo. Este cambio está respaldado por la potente memoria de contexto y capacidad autónoma de Opus 4.5, lo que le permite dejar de depender de herramientas de registro triviales. Tasks permite la difusión en tiempo real del estado de las tareas entre múltiples Agent y sesiones, e introduce la gestión de “dependencias”, con datos almacenados de forma nativa en el sistema de archivos local (~/.claude/tasks). Esto marca la evolución de la AI de una simple herramienta de asistencia de código a un “ingeniero digital” capaz de gestionar proyectos masivos con capacidad de colaboración autónoma, elevando significativamente el límite de la automatización en ingeniería de software compleja. (Fuente: dotey, yoheinakajima, dejavucoder)
Cambio drástico en el modelo de negocio de OpenAI: la propuesta de “Outcome-Based Pricing” provoca sacudidas en la industria : La CFO de OpenAI, Sarah Friar, sugirió recientemente un giro hacia el “Outcome-Based Pricing” (precios basados en resultados), es decir, cobrar una comisión basada en el valor creado por la AI (como descubrimientos de fármacos o beneficios comerciales), en lugar de simplemente facturar por Token. Esta señal ha provocado una fuerte reacción en la comunidad ante lo que consideran “royalties de AI”, interpretado como un “impuesto sobre la producción de la fábrica”. Al mismo tiempo, Sam Altman reveló que su negocio de API ha experimentado un aumento de 1.000 millones de dólares en ARR (ingresos recurrentes anuales) en el último mes, lo que demuestra la alta dependencia del mercado empresarial de los modelos cerrados. Este cambio en la lógica de precios podría impulsar a más empresas hacia el despliegue local para evitar riesgos potenciales de reparto de beneficios. (Fuente: Reddit, nickaturley)
El equipo principal de vLLM funda Inferact: el avance comercial del motor de inferencia open-source : Los miembros fundadores del proyecto vLLM han anunciado oficialmente la creación de la startup Inferact, con el objetivo de comercializar el motor de inferencia open-source más popular del mundo. La misión de Inferact es reducir aún más los costes de uso de la AI optimizando la eficiencia de la inferencia. Aunque existe preocupación en la comunidad sobre si vLLM “perderá su esencia open-source” al comercializarse, este movimiento indica que la competencia en el lado de la inferencia ha entrado en una fase crítica. La incorporación del equipo principal acelerará los avances en rendimiento y la construcción de estabilidad de vLLM en escenarios empresariales. (Fuente: QuixiAI)

Cambio de paradigma en el entrenamiento de AI: de la acumulación de potencia de cómputo a la curación de datos refinada : Investigadores de OpenAI, Thinking Machines y Amazon están impulsando un replanteamiento de cómo se entrenan los LLM, centrándose en mejorar la eficiencia del uso de datos y la calidad de la curación. La startup DatologyAI se encuentra en el centro de esta tendencia, buscando abordar las limitaciones principales de razonamiento y fiabilidad mediante la resolución de problemas de escasez de datos y ruido en el entrenamiento de modelos actuales. Esta tendencia indica que la segunda mitad de la carrera de la AI no será solo una carrera armamentista de potencia de cómputo, sino un juego intelectual sobre quién puede extraer “señales de alta calidad” de forma más eficiente a partir de volúmenes masivos de datos. (Fuente: code_star)
🎯 Trends
World Labs de Fei-Fei Li busca financiación con una valoración de 5.000 millones de dólares : La startup de inteligencia espacial World Labs planea recaudar 500 millones de dólares, con un objetivo de valoración de hasta 5.000 millones. El equipo de Fei-Fei Li se centra en los “modelos de mundo”, con el objetivo de dotar a la AI de la capacidad de comprender el espacio físico tridimensional al igual que los humanos. En un contexto donde los LLM enfrentan cuellos de botella en su crecimiento, la inteligencia espacial se considera el camino clave hacia la AGI, atrayendo inversiones continuas de capital de primer nivel. (Fuente: Dorialexander)
Sakana AI y Google establecen una alianza estratégica : El unicornio japonés Sakana AI ha anunciado una vinculación profunda con Google. Además de recibir inversión adicional, combinarán la infraestructura de Google con el “AI Scientist” y la tecnología de Agent de Sakana para acelerar avances en descubrimientos científicos. Esta colaboración enfatiza especialmente la provisión de soluciones en sectores con altas exigencias de soberanía de datos, como finanzas y gobierno, mostrando la ambición de Google en el ecosistema regional de AI. (Fuente: hardmaru)
Los costes de inferencia de Anthropic superan el presupuesto en un 23%, lo que genera especulaciones técnicas : Filtraciones indican que los costes de inferencia de Anthropic en los servidores de Google y Amazon son un 23% superiores a lo previsto. Analistas del sector sugieren que esto podría indicar que su estrategia de Quantization no ha logrado los recortes de costes esperados, o que el consumo real del modelo en el procesamiento de contextos largos supera con creces el diseño original. Esto refleja que incluso los principales fabricantes de AI enfrentan grandes desafíos para equilibrar el rendimiento del modelo con los costes operativos comerciales. (Fuente: code_star)

La salida de una investigadora de AI de Samsung revela dificultades en la cultura corporativa : La reconocida investigadora Alexia Jolicoeur-Martineau anunció su salida de Samsung, afirmando que tras crear un gran valor comercial, su vida se volvió “un infierno” debido a problemas de gestión. El incidente ha generado debate en la comunidad, exponiendo la desconexión entre la cultura de gestión obsoleta de los gigantes tecnológicos tradicionales y los mecanismos de incentivo a la innovación necesarios para retener el talento de élite en AI. (Fuente: cloneofsimo, QuixiAI)
🧰 Tools
Plano 0.4.3: introduce Filter Chains para optimizar los flujos de trabajo de Agent : La última versión de Plano introduce “Filter Chains”, que permiten a los desarrolladores capturar pasos de flujo de trabajo reutilizables en el plano de datos sin repetir lógica en el código de la aplicación. Esta función permite inspeccionar prompts, modificar solicitudes o interrumpir procesos prematuramente si falla el cumplimiento. Además, la nueva función de autenticación pass-through es compatible con servicios proxy como OpenRouter, facilitando enormemente la gestión de API en escenarios multi-tenant. (Fuente: Reddit)

File Brain: motor de búsqueda semántica local open-source : Se trata de una herramienta de escritorio que se ejecuta 100% localmente, combinando OCR con modelos de embeddings multilingües. Indexa automáticamente PDF, imágenes y documentos de Office, permitiendo búsquedas en lenguaje natural (ej. “buscar el billete de avión del año pasado”), localizando el contenido con precisión incluso si el nombre del archivo es aleatorio. Resuelve el problema de la búsqueda tradicional por palabras clave que no entiende el contenido de documentos escaneados o capturas de pantalla, protegiendo totalmente la privacidad del usuario. (Fuente: Reddit)

Todoist Ramble: gestión de tareas impulsada por voz : La función Ramble de Todoist permite a los usuarios describir tareas por voz, y la AI las analiza y organiza automáticamente en listas de prioridad. Las discusiones en la comunidad señalan que se pueden replicar procesos similares con herramientas como Whisper y n8n, pero la integración nativa de Todoist y el soporte para servidores MCP le otorgan una ventaja significativa en facilidad de uso, siendo un caso típico de optimización de productividad personal mediante AI. (Fuente: Reddit)
Step3-VL-10B: potente modelo de visión compatible con la resolución de problemas geométricos : El modelo de visión Step3-VL-10B ya es compatible con chatllm.cpp y destaca en tareas complejas de razonamiento visual como la resolución de problemas geométricos, con un rendimiento comparable al de modelos Qwen de escala 200B. Su potencial para ejecutarse en dispositivos edge ofrece nuevas opciones para aplicaciones locales de AI visual. (Fuente: Reddit)

📚 Learning
SAMTok: la tokenización de máscaras dota a los MLLM de capacidades a nivel de píxel : Un artículo propone SAMTok, un tokenizador de máscaras discretas capaz de convertir cualquier máscara de región en dos Token especiales. Al tratar las máscaras como Token de lenguaje, los modelos multimodales base (como QwenVL) pueden aprender capacidades a nivel de píxel sin modificaciones arquitectónicas. Tras entrenarse con 209 millones de máscaras diversas, el modelo alcanzó niveles SOTA en tareas como descripción de regiones y segmentación referencial, proporcionando un paradigma sencillo para la escalabilidad de tareas a nivel de píxel en MLLM. (Fuente: HuggingFace)
HERMES: KV Cache como memoria jerárquica para la comprensión de vídeo : Esta investigación propone HERMES, una arquitectura que no requiere entrenamiento y trata la KV Cache como un marco de memoria jerárquica que encapsula información de vídeo a diferentes granularidades. Durante la inferencia, puede reutilizar una KV Cache compacta, manteniendo una alta precisión con un 68% menos de Token de vídeo, con un TTFT (Time To First Token) 10 veces más rápido que los SOTA actuales, resolviendo problemas de memoria y latencia en la comprensión de vídeo en streaming. (Fuente: HuggingFace)
DLCM: hacia un Dynamic Large Concept Model para el razonamiento semántico adaptativo : Este estudio desafía el modo tradicional de computación a nivel de Token de los LLM, proponiendo la introducción de una granularidad de “concepto” aprendible entre el Token y la frase. El modelo DLCM puede asignar recursos de cómputo de forma adaptativa según la densidad de información, simulando el razonamiento conceptual lógico humano. Los experimentos muestran que, con el mismo coste de inferencia, esta arquitectura presenta una mejora significativa del rendimiento en benchmarks intensivos en razonamiento. (Fuente: GeZhang86038849)

Resumen de Agentic Reasoning: la evolución del “pensamiento” a la “acción” : Un resumen publicado conjuntamente por Meta y Google DeepMind, entre otros, explora sistemáticamente cómo el razonamiento de los LLM está pasando de la pura Chain of Thought (CoT) a la acción en entornos reales. Abarca temas centrales como single-agent, colaboración multi-agent, retroalimentación del entorno y memoria a largo plazo, señalando los desafíos clave de los Agent actuales en planificación a largo plazo y construcción de modelos de mundo. (Fuente: TheTuringPost)

💼 Business
World Labs de Fei-Fei Li busca financiación con una valoración de 5.000 millones de dólares : La startup de inteligencia espacial World Labs planea recaudar 500 millones de dólares, con un objetivo de valoración de hasta 5.000 millones. El equipo de Fei-Fei Li se centra en los “modelos de mundo”, con el objetivo de dotar a la AI de la capacidad de comprender el espacio físico tridimensional al igual que los humanos. Ante el estancamiento de los LLM, la inteligencia espacial se ve como el camino crítico hacia la AGI. (Fuente: Dorialexander)
Sakana AI y Google establecen una alianza estratégica : El unicornio japonés Sakana AI ha anunciado una vinculación profunda con Google. Además de recibir inversión adicional, combinarán la infraestructura de Google con el “AI Scientist” y la tecnología de Agent de Sakana para acelerar avances en descubrimientos científicos. (Fuente: hardmaru)
El negocio de API de OpenAI crece 1.000 millones de dólares en ARR en un solo mes : Sam Altman reveló que, aunque el público se centra en ChatGPT, su negocio de API ha sumado más de 1.000 millones de dólares en ARR en el último mes, demostrando la altísima fidelidad de desarrolladores y empresas a la infraestructura de OpenAI. (Fuente: nickaturley)
🌟 Community
Gran debate sobre la burbuja de la AI: la brecha entre valoración y realidad : La comunidad debate intensamente si las altas valoraciones de startups como Thinking Machines presagian una burbuja de AI. Elon Musk predice que 2026 será el año de la singularidad, pero en la realidad la AI sigue mostrando una mezcla incómoda de “IQ de doctor en matemáticas con el sentido común de un becario”. Shane Gu señala que la valoración se ha convertido en el indicador más fiable de la burbuja, mientras que el suministro de energía y chips sigue siendo un cuello de botella físico ineludible en el camino hacia la AGI. (Fuente: shaneguML, Yuchenj_UW)

Despertar de la conciencia sobre el despliegue local: afrontando el riesgo de “comisiones” de las API en la nube : Ante los planes potenciales de OpenAI de precios basados en resultados, la comunidad LocalLLaMA ha iniciado una tendencia de “acaparamiento de GPU”. Los usuarios consideran que depender de API en la nube es como depender de la red eléctrica: conveniente pero sin control; mientras que el despliegue local es como instalar paneles solares: requiere una gran inversión inicial pero asegura que los beneficios del proyecto no sean divididos forzosamente por el proveedor del modelo. Esta conciencia de “Sovereign AI” se está extendiendo rápidamente entre los desarrolladores. (Fuente: Reddit)
Alerta por el hackeo de la cuenta de un investigador de Kimi : Se ha informado en la comunidad que la cuenta de X de Crystal, investigadora de Kimi, fue hackeada y utilizada para enviar mensajes directos fraudulentos. Este incidente recuerda a los profesionales de la AI que, mientras se enfocan en avances tecnológicos, deben reforzar la seguridad de sus cuentas personales y datos sensibles para evitar ser blanco de ataques dirigidos. (Fuente: Kimi_Moonshot, iScienceLuvr)

💡 Others
La voz es la próxima frontera de la AI : Expertos del sector como Elad Gil señalan que la interacción por voz será el próximo punto de explosión en el desarrollo de la AI. Con la maduración de modelos de baja latencia y tecnologías de síntesis emocional, la voz evolucionará de una simple entrada de comandos a una interfaz de interacción con capacidad de comprensión profunda. (Fuente: glennko)

Devin Review: revisión humana al 100% bajo el apalancamiento de la AI : Ante la situación actual de las herramientas de revisión de código por AI que “combaten tonterías con más tonterías”, Cognition lanza Devin Review, enfatizando la colaboración hombre-máquina al 100%. La herramienta busca que la AI ayude a los humanos a comprender realmente la lógica del código, en lugar de simples “fusiones de ambiente”, intentando encontrar un equilibrio entre automatización y rigor. (Fuente: russelljkaplan)