Palabras clave:gran modelo, chip de IA, agente inteligente, serie GPT-5.6, chip de inferencia Jalapeño, orquestación de múltiples modelos
🔥 Enfoque
OpenAI lanza la serie GPT-5.6 y su chip de inferencia de desarrollo propio Jalapeño : OpenAI ha presentado la serie de modelos GPT-5.6, que incluye Sol, Terra y Luna, con capacidades de razonamiento de cadena larga y modos de colaboración multi-agente, aunque su lanzamiento inicial está restringido por el gobierno de EE. UU. y solo está disponible para ciertas instituciones. Al mismo tiempo, OpenAI ha desarrollado conjuntamente con Broadcom su primer chip de inferencia para grandes modelos de desarrollo propio, Jalapeño, utilizando el proceso de TSMC, con el objetivo de reducir drásticamente los costes de inferencia diarios de ChatGPT y mejorar la velocidad de respuesta. Esto marca que los gigantes de la AI están extendiendo la competencia desde una simple carrera armamentista de algoritmos hasta las profundidades de la cadena de suministro de hardware personalizado subyacente. (Fuente: 36氪)

El regreso de Claude Fable 5 y Mythos 5 viene acompañado de controversias de seguridad : Tras regresar de una ola de regulaciones, Claude Fable 5 ha provocado críticas negativas debido a un clasificador de seguridad excesivamente estricto, lo que ha causado que una gran cantidad de solicitudes normales sean bloqueadas erróneamente y degradadas automáticamente a Opus. Al mismo tiempo, los hackers descubrieron durante las pruebas que Fable 5, en tareas de razonamiento profundo, genera una “cadena de pensamiento ilegible” sin filtrar, utilizando símbolos y partículas expresivas de creación propia como taquigrafía. Esto indica que los grandes modelos de razonamiento bajo aprendizaje por refuerzo se están alejando espontáneamente del lenguaje humano para mejorar la eficiencia, exponiendo también nuevos desafíos para la seguridad y la explicabilidad de la AI. (Fuente: 量子位)

Shengshu Technology lanza Vidu S1, un gran modelo de video interactivo en tiempo real : Shengshu Technology ha presentado Vidu S1, un modelo de generación de video interactivo en tiempo real que admite el control por voz para la generación de contenido de video, generación en tiempo real de duración ilimitada e interacción en tiempo real a 540P/25FPS. Los usuarios solo necesitan subir una imagen del primer fotograma y un tono de voz personalizado, y el modelo puede generar en tiempo real las expresiones y movimientos del personaje, funcionando de manera fluida en tarjetas gráficas de consumo. Este avance lleva la generación de video de la “reproducción offline” a la era de la “interacción bidireccional en tiempo real”, reduciendo drásticamente la barrera de desarrollo para humanos digitales y acompañamiento virtual. (Fuente: 机器之心)
.jpg)
Damo Academy lanza ElementsClaw, un agente de AI para materiales superconductores : Alibaba Damo Academy, en colaboración con varias universidades, ha lanzado ElementsClaw, el primer agente de AI especializado en el descubrimiento de materiales superconductores. Este agente combina una red neuronal de gráficos geométricos profundos de 1.000 millones de parámetros con un gran modelo de lenguaje. Utilizando solo 28 horas de GPU, filtró 2,4 millones de cristales estables, predijo 68.000 superconductores potenciales y sintetizó con éxito en experimentos 4 nuevos materiales superconductores previamente desconocidos para la humanidad. Este logro mejora enormemente la eficiencia en la investigación y desarrollo de materiales superconductores, impulsando la aplicación de la AI en campos científicos de frontera. (Fuente: 量子位)

Baiyao Technology lanza AURA CellOS, un modelo de mundo celular virtual : Baiyao Technology ha lanzado AURA CellOS, un modelo de mundo celular virtual de AI basado en la arquitectura LLM-JEPA. El modelo cuenta con 12B de parámetros y ha sido entrenado con datos de transcriptoma de 390 millones de células individuales humanas, cubriendo más de 40 tipos de tejidos y más de 260 tipos de células. A través del aprendizaje de representación multivisual y la predicción de incrustación conjunta de JEPA, CellOS permite por primera vez que un modelo comprenda las leyes de evolución interna de los estados celulares, alcanzando un nivel líder internacional en tareas como la predicción de respuestas a perturbaciones, y proporcionando una base computacional clave para la medicina de AI y la terapia celular. (Fuente: 量子位)

🎯 Tendencias
Microsoft lanza MAI-Thinking-1, su primer gran modelo de razonamiento independiente : Microsoft ha presentado en la conferencia Build el modelo de razonamiento MAI-Thinking-1, que utiliza una arquitectura de Mezcla de Expertos (MoE) de 1 billón de parámetros y ha sido entrenado completamente desde cero, sin destilación ni ajuste fino de ningún otro modelo. El modelo admite un contexto de 250k Tokens y muestra un rendimiento sólido en pruebas de referencia de razonamiento matemático y STEM, superando incluso a Claude Sonnet 4.6 en el AIME 2025. Esto marca un paso crucial para Microsoft en su camino hacia la independencia de la tecnología de OpenAI y la creación de su propia pila tecnológica de AI. (Fuente: DeepLearning.AI Blog)

Dongfeng Yijing colabora con Huawei Qiankun Smart Driving ADS 5 en pruebas reales de escenarios extremos : El modelo Yijing X9, la marca de gama alta de Dongfeng, equipado con el sistema de conducción inteligente Huawei Qiankun ADS 5, completó pruebas reales en escenarios extremos como conducción nocturna, tormentas y obstáculos repentinos. ADS 5 adopta la nueva arquitectura WEWA 2.0, que integra la teoría de juegos multi-agente y algoritmos de campo de riesgo de seguridad, reduciendo costes y mejorando la eficiencia al tiempo que disminuye el riesgo de colisión. Las pruebas reales demostraron que puede lograr una navegación autónoma con cero intervención en escenarios de almacenes desconocidos, lo que marca una transición generacional de los sistemas de conducción inteligente desde el enfoque basado en reglas hacia el enfoque impulsado por datos y agentes de AI. (Fuente: 量子位)

Sakana AI lanza la serie Fugu, un sistema de orquestación colaborativa multi-modelo : La startup japonesa de AI Sakana AI ha lanzado los modelos Fugu y Fugu-Ultra. Este sistema no depende de un único modelo, sino que utiliza algoritmos evolutivos y aprendizaje por refuerzo en la capa de pasarela de API para programar dinámicamente modelos subyacentes (como Claude, GPT, Gemini, etc.) para colaborar en tareas complejas. Fugu-Ultra logró una precisión récord del 95.5% en la prueba científica GPQA-Diamond. Esto demuestra que la orquestación colaborativa multi-modelo se ha convertido en una tendencia importante para evitar el bloqueo de un solo proveedor y optimizar los costes de inferencia. (Fuente: DeepLearning.AI Blog)

La tecnología de aceleración DSpark de DeepSeek se porta con éxito a Mac local : El ingeniero de código abierto Abdur Rahim ha portado la tecnología de decodificación especulativa DSpark de DeepSeek a los chips de Apple, lanzando el proyecto mlx-dspark. En el chip M4 Pro, este proyecto aumentó la velocidad de inferencia local de Gemma-4 12B y Qwen3-4B en 1.6 y 1.4 veces respectivamente, y los resultados de salida fueron completamente idénticos a los del modelo original bajo el mismo muestreo de temperatura. Este intento demuestra que la tecnología de decodificación especulativa también tiene un enorme potencial para reducir costes y mejorar la eficiencia en dispositivos de borde de consumo. (Fuente: 36氪)

DENG Lab de la Universidad Jiao Tong de Shanghái lanza en código abierto el modelo de mundo-lenguaje-acción WLA : El DENG Lab de la Universidad Jiao Tong de Shanghái ha lanzado en código abierto el modelo WLA, que unifica el modelado del mundo, el razonamiento del lenguaje y la generación de acciones robóticas en un mismo marco autorregresivo de 2B de parámetros. WLA no solo puede predecir dinámicas físicas detalladas, sino que también puede predecir secuencias de subtareas a través del lenguaje natural y mantener un búfer de memoria para la planificación a largo plazo. En la prueba de referencia de memoria a largo plazo RMBench, WLA logró una tasa de éxito del 56.5%, casi el doble que el segundo mejor método, con una latencia de inferencia de solo 40 ms. (Fuente: 机器之心)
.jpg)
Tencent Cloud ofrecerá directamente el servicio del modelo DeepSeek-V4 : Tencent Cloud ha anunciado que a mediados de julio ofrecerá el servicio del modelo DeepSeek-V4 en su plataforma TokenHub, el cual se ejecutará directamente desde la propia red de DeepSeek. Esta colaboración se beneficia del soporte técnico de Tencent Cloud y, al mismo tiempo, demuestra la confianza de DeepSeek en su propio clúster de potencia de cómputo. Esto proporciona a los clientes de nivel empresarial una opción de infraestructura de cómputo más flexible y con garantía de red al invocar grandes modelos de código abierto de vanguardia. (Fuente: teortaxesTex)

🧰 Herramientas
LangChain lanza en código abierto OpenWiki, un agente de wiki de memoria universal : LangChain ha lanzado en código abierto el proyecto OpenWiki, que obtuvo 1.7k estrellas en GitHub en solo 3 días desde su lanzamiento. Actualmente, el proyecto se centra principalmente en la construcción de wikis de memoria estructurada para bases de código, resolviendo el problema de que los Agents olviden información clave en tareas a largo plazo mediante la extracción y organización automática del contexto del proyecto. El equipo de desarrollo planea expandirlo a fuentes de datos más generales como Notion, Google Drive, Slack y búsquedas web, con el fin de crear un centro de memoria global para Agents. (Fuente: LangChain)

Vercel lanza el framework de agentes Eve e integra LlamaIndex : Vercel ha presentado el framework de agentes Eve, y LlamaIndex ha construido inmediatamente una plantilla de integración para él. Esta plantilla proporciona a Eve un conjunto de herramientas de sistema de archivos de solo lectura, lo que le permite analizar rutas, leer texto y trabajar con la herramienta LiteParse para analizar documentos no estructurados en un formato Markdown limpio. Esta combinación proporciona a los Agents un flujo de trabajo fiable y listo para usar que puede navegar y comprender de manera eficiente colecciones complejas de documentos locales. (Fuente: jerryjliu0)
Hugging Face lanza un framework de optimización automática para el ajuste fino de prompts en grandes modelos : Hugging Face ha presentado un framework de ajuste fino automático de prompts en su proyecto Harness Optimization. Este framework utiliza a Claude como proponente para reescribir los prompts periféricos del Agent y el código de llamada a herramientas a través de la iteración y validación automáticas, sin modificar los pesos del modelo subyacente. Las pruebas muestran que este método elevó la puntuación de un modelo de código abierto congelado en una evaluación legal compleja del 0% a un nivel comparable al de Sonnet 4.6, reduciendo el coste de la tarea en 7 veces. (Fuente: ClementDelangue)
Se actualiza baoyu-design, la herramienta de diseño de PPT basada en Fable 5 : El desarrollador Baoyu ha actualizado su habilidad de agente de código abierto baoyu-design, añadiendo soporte para animaciones de PPT y llamadas a imágenes generadas por AI. Aprovechando la profunda comprensión de Fable 5 del formato PPTX XML, la herramienta resuelve con éxito la limitación de exportación de animaciones que Opus 4.8 no podía manejar anteriormente. Los usuarios ahora pueden generar directamente PPT en formato HTML con efectos de animación y exportarlos sin problemas a archivos PPTX editables para Keynote o PowerPoint. (Fuente: dotey)

Termiprotocol crea una oficina virtual en 3D para Claude Code : Un desarrollador ha lanzado el proyecto de código abierto Termiprotocol, que construye una interfaz de oficina virtual en 3D para Agents de terminal como Claude Code y Codex. Cada operación que el Agent realiza en la terminal (como leer/escribir archivos, buscar en la web, ejecutar código) se presenta en tiempo real en forma de un pequeño robot en 3D que escribe a máquina o busca en archivadores en la oficina, acompañado de un monitoreo intuitivo del consumo de Tokens y un tablero de tareas, lo que mejora enormemente la visualización y la diversión del flujo de trabajo del Agent. (Fuente: Reddit r/ClaudeAI)

Hugging Face y Cerebras presentan una Demo de voz de Gemma 4 : Hugging Face y Cerebras han colaborado para construir una Demo de interacción de voz en tiempo real completamente de código abierto. Basada en el modelo Gemma 4 y el hardware de inferencia de ultra baja latencia de Cerebras, la Demo logra una experiencia de conversación de voz a voz extremadamente rápida. Los usuarios pueden probar, hacer fork y ajustar el proyecto directamente en Hugging Face Spaces, lo que proporciona un excelente modelo para que la comunidad de código abierto desarrolle asistentes de voz de baja latencia. (Fuente: huggingface)
📚 Aprendizaje
ByteDance lanza EdgeBench, un punto de referencia para evaluar el aprendizaje de Agents en ciclos ultralargos : El equipo Seed de ByteDance ha lanzado EdgeBench, un benchmark diseñado específicamente para estudiar cómo los agentes aprenden continuamente a partir de la retroalimentación del entorno durante operaciones de ciclos ultralargos de 12 a 72 horas. Tras probar el funcionamiento de los Agents durante un total acumulado de 38.000 horas, los investigadores descubrieron que la mejora del rendimiento del Agent y el tiempo de interacción con el entorno se ajustan con precisión a una función log-sigmoidea, lo que demuestra que acumular y reutilizar la experiencia de las tareas es clave para impulsar el progreso a largo plazo del Agent. (Fuente: arankomatsuzaki)

Samsung y la Universidad de Pekín lanzan LiveClawBench, un benchmark sistemático para AI Agents : El equipo de grandes modelos de Samsung, en colaboración con la Universidad de Pekín y otras instituciones, ha lanzado LiveClawBench para evaluar el rendimiento de los Agents asistentes personales en flujos de trabajo complejos. Este benchmark incluye 134 tareas ejecutables y propone un sistema de factores de complejidad tridimensional. Los experimentos muestran que, para los modelos de vanguardia, el dominio de la tarea solo explica alrededor del 9.6% de la fluctuación de la puntuación, mientras que el “perfil de complejidad” de la tarea tiene un poder explicativo del 18.6%, revelando que las dependencias entre servicios y la resolución de objetivos son las causas principales de la inestabilidad del Agent. (Fuente: 机器之心)
.jpg)
La Universidad Renmin de China publica CoDA-Bench, un benchmark para agentes de datos : Un equipo de investigación de la Universidad Renmin de China ha presentado el benchmark CoDA-Bench, diseñado para evaluar conjuntamente la inteligencia de código y la inteligencia de datos de los Agents. El benchmark coloca al Agent en un entorno sandbox de Linux complejo que contiene más de 1000 archivos de distracción, requiriendo que explore de forma autónoma el sistema de archivos, localice los datos relevantes y escriba código para analizarlos. Los experimentos muestran que incluso el sistema con mejor rendimiento logró solo una precisión del 61.1% en CoDA-Bench, revelando que “no encontrar los datos correctos” es el cuello de botella central de los Code Agents actuales. (Fuente: 机器之心)
.jpg)
Meta descubre el fallo de “sobrepensamiento” en modelos de razonamiento cuantificados y propone una solución : Meta ha revelado en un estudio un peculiar modo de fallo en los modelos de razonamiento cuantificados: tras la cuantificación, el modelo no solo disminuye su capacidad, sino que comienza a “sobrepensar”. En hasta el 52% de los casos de fallo, el modelo ya había llegado a la respuesta correcta a mitad del razonamiento, pero debido a que la cuantificación aumentó la probabilidad de muestreo de Tokens de vacilación (como wait, but, maybe), esto provocó que cayera en una autorreflexión interminable y finalmente anulara la conclusión correcta. Meta redujo con éxito el 58% de los errores de sobrepensamiento aplicando una pequeña penalización de decodificación a los Tokens de vacilación. (Fuente: TheTuringPost)

Stanford y UC Berkeley lanzan RoboReward, un modelo de recompensa de visión-lenguaje para robótica : Equipos de investigación de Stanford y UC Berkeley han presentado RoboReward, un modelo de recompensa de visión-lenguaje para robótica con parámetros de 4B/8B. Al reetiquetar con texto y truncar videos de acciones exitosas, el estudio generó una gran cantidad de muestras de intentos negativos e incompletos de alta calidad, resolviendo el punto de dolor del aprendizaje por refuerzo tradicional que carece de ejemplos de fallos. Los experimentos demuestran que el uso de RoboReward para la evaluación de recompensas supera significativamente a los grandes modelos generales similares en tareas reales de agarre con brazo robótico y apertura de cajones. (Fuente: DeepLearning.AI Blog)

CMU publica en código abierto los videos y materiales de las 23 clases del curso Advanced NLP : El profesor Sean Welleck de la Universidad Carnegie Mellon (CMU) ha subido a YouTube los videos de las 23 clases de su curso “Advanced Natural Language Processing (ANLP Spring 2026)” y ha liberado en código abierto las notas de clase correspondientes y 20 ejemplos de código. El contenido del curso cubre sistemáticamente siete temas principales, incluyendo fundamentos de NLP, arquitectura de modelos, aprendizaje y razonamiento, métodos de evaluación, aprendizaje por refuerzo y agentes (RL & Agents), así como escalado y eficiencia de modelos, siendo un recurso excelente para estudiar en profundidad los principios subyacentes de los grandes modelos. (Fuente: gneubig)

Se publica oficialmente el nuevo libro de Sebastian Raschka “Build a Reasoning Model (From Scratch)” : Se ha publicado oficialmente el nuevo libro del renombrado experto en aprendizaje automático Sebastian Raschka, titulado “Build a Reasoning Model (From Scratch)”. Con un total de 440 páginas, el libro cuenta con un diseño a todo color y proporciona ejemplos de código ejecutables. Introduce sistemáticamente la lógica subyacente de los modelos de razonamiento, incluyendo tecnologías de vanguardia como el escalado de inferencia (Inference Scaling), el aprendizaje por refuerzo (RL) y la destilación de modelos (Distillation), siendo una lectura excelente para construir la teoría fundamental de los grandes modelos. (Fuente: cwolferesearch)

💼 Negocios
Unitree Robotics recibe la aprobación de la CSRC para su registro de IPO en el mercado STAR : La Comisión Reguladora de Valores de China (CSRC) ha aprobado oficialmente la solicitud de registro de Unitree Robotics para su oferta pública inicial (IPO) en el mercado STAR (Sci-Tech Innovation Board). Unitree Robotics planea emitir públicamente no menos del 10% de sus acciones, recaudando 4.202 millones de yuanes, con una valoración de aproximadamente 42.000 millones de yuanes. El folleto de cotización muestra que Unitree logró unos ingresos de 1.708 millones de yuanes en 2025, con un beneficio neto de 591 millones de yuanes, y los envíos de robots humanoides superaron las 5.500 unidades, alcanzando una cuota de mercado global del 32.4%. Esto marca que la primera empresa nacional de inteligencia incorporada de sistemas completos que logra rentabilidad está a punto de cotizar oficialmente en las acciones A. (Fuente: 36氪)
Silicon Flow presenta su folleto de cotización a la Bolsa de Hong Kong para convertirse en la “primera acción de fábrica de Tokens” : La startup de infraestructura de AI, Silicon Flow, ha presentado oficialmente su folleto de cotización a la Bolsa de Hong Kong. La empresa se posiciona como un “mayorista de Tokens” para la industria de la AI, ofreciendo servicios de acceso unificado a múltiples modelos a través de APIs estandarizadas. Tras su ronda de financiación B+, su valoración alcanzó los 7.740 millones de yuanes, con accionistas que incluyen a gigantes como Alibaba, Tencent, Huawei y Meituan. El folleto muestra que en 2025 los clientes de pago de su nube pública alcanzaron los 716.000, pero debido a la enorme inversión inicial en potencia de cómputo y promoción, la pérdida neta alcanzó los 345 millones de yuanes. (Fuente: 36氪)

Guangxiang Technology completa una ronda de financiación ángel acumulada de cientos de millones de yuanes : La startup de inteligencia incorporada Guangxiang Technology ha anunciado la finalización de una ronda de financiación ángel acumulada de cientos de millones de yuanes, coinvertida por Zhuhai Technology Group, Industrial Securities Capital, Songhe Capital, entre otros. Incubada por un equipo de la Universidad de Tsinghua, Guangxiang Technology ha establecido la ruta técnica de “inteligencia física nativa” y ha construido un sistema compuesto por una matriz de algoritmos de aprendizaje por refuerzo, activos de datos físicos de alta fidelidad y una plataforma de desarrollo inteligente. Su robot incorporado de desarrollo propio, Phi-Bot X1, ha verificado operaciones continuas de alta precisión en la estación de alimentación de soldadura de líneas de producción de automóviles. (Fuente: 量子位)

🌟 Comunidad
Alibaba emite una notificación interna para prohibir por completo el uso de Claude y Claude Code : Alibaba ha emitido una notificación interna de emergencia exigiendo a sus empleados desinstalar y prohibir por completo el uso de productos de Anthropic como Claude y Claude Code antes del 10 de julio. Anteriormente, la comunidad de seguridad descubrió mediante ingeniería inversa que Claude Code tiene incorporado un mecanismo oculto de detección de usuarios chinos y laboratorios de AI. Este mecanismo recopila la zona horaria del sistema, proxies y palabras clave de API a través de código ofuscado, y envía las huellas digitales del entorno de vuelta al servidor alterando caracteres Unicode en los prompts, lo que ha generado preocupación en la empresa sobre la filtración de código fuente principal. (Fuente: 36氪)

El motor de videojuegos Godot anuncia oficialmente un endurecimiento total de su política de contribución de código de AI : El motor de videojuegos de código abierto Godot ha anunciado una modificación en su política de contribuciones, prohibiendo por completo el uso de AI para generar grandes bloques de código y el envío automático de PRs por parte de AI Agents. Los responsables oficiales declararon directamente que, aunque la AI reduce la barrera para escribir código, ha provocado una avalancha de PRs de baja calidad, consumiendo seriamente la energía de revisión de los mantenedores voluntarios. Peor aún, muchos de los contribuyentes no pueden explicar el código generado por la AI ni mantenerlo cuando surgen Bugs. Godot enfatizó que la AI no puede ser responsable del código, y que el proyecto necesita personas que realmente entiendan el código. (Fuente: 36氪)

Meta planea lanzar el servicio en la nube Metamate para alquilar potencia de cómputo de AI inactiva : Bloomberg informa que Meta planea crear una división de negocio de infraestructura en la nube llamada “Metamate” para vender potencia de cómputo de AI inactiva y acceso a modelos a clientes externos, con el objetivo de generar entre 10.000 y 15.000 millones de dólares en ingresos anuales para 2027. Esta noticia ha despertado temores en el mercado sobre una posible sobrecapacidad temporal de potencia de cómputo de AI, lo que provocó ventas masivas en los sectores globales de chips y almacenamiento en las dos sesiones de negociación siguientes. (Fuente: 36氪)
La academia descubre que los grandes modelos de AI están reemplazando gradualmente a los humanos en la investigación matemática : Con la refutación independiente por parte de un modelo interno de OpenAI de la “conjetura de la distancia unitaria en el plano”, propuesta por el físico Erdős y estudiada por humanos durante casi 80 años, la capacidad de razonamiento matemático de la AI ha experimentado un salto cualitativo. Esto ha desencadenado una ansiedad existencial en los círculos de estudiantes de doctorado en matemáticas, y algunos bromean diciendo que solo pueden jugar a “Honor of Kings” para escapar de la realidad. Los académicos creen que la alta eficiencia de la AI en la investigación matemática estandarizada y formalizada está obligando a los matemáticos humanos a repensar el valor de su propia investigación y sus límites estéticos. (Fuente: 36氪)

Un informe de Cloudflare muestra que el tráfico de red de máquinas supera al humano por primera vez : El proveedor de servicios de seguridad web Cloudflare ha publicado un informe que indica que, de todas las solicitudes de acceso web recibidas por los sitios web que aloja, aproximadamente el 57.4% proviene de inteligencia artificial y programas automatizados (como rastreadores de entrenamiento de AI, Agents, etc.), mientras que las solicitudes de humanos reales representan solo el 42.6%. Esta es la primera vez en la historia de Internet que el tráfico de máquinas supera al tráfico humano, lo que marca un cambio fundamental en el paradigma de interacción web y supone un impacto sistémico para el modelo de negocio tradicional de monetización de publicidad basada en tráfico. (Fuente: 36氪)

💡 Otros
Investigadores descubren el nombre fantasma “Dr. Elena Rodriguez” en grandes modelos de lenguaje : Samsung Labs ha revelado un hallazgo interesante en su artículo sobre “Diferenciación de Decodificación Contrastiva (CDD)”: al realizar la recuperación inversa de datos de entrenamiento en múltiples modelos ajustados finamente, el nombre de una científica ficticia, “Dr. Elena Rodriguez”, apareció con alta frecuencia en las salidas de modelos de diferentes dominios. La investigación descubrió que esto se debe a que Claude Sonnet 3.6 prefiere enormemente este nombre al generar datos de entrenamiento sintéticos, lo que provocó que fuera “horneado” involuntariamente en todos los modelos ajustados que utilizaron dichos datos sintéticos. (Fuente: Reddit r/MachineLearning)

Usuarios de Reddit critican a Perplexity Pro por limitar silenciosamente las cuotas de uso : Muchos usuarios suscritos a Perplexity Pro (200 dólares al año) se han quejado en Reddit al descubrir que sus funciones de “carga ilimitada de archivos” y “búsqueda profunda (Deep Research)” han sido limitadas silenciosamente y aparecen en gris como no disponibles recientemente. Los usuarios acusan a la plataforma de recortar unilateralmente los beneficios de los usuarios Pro sin enviar ningún correo electrónico, anuncio o actualización de los términos de servicio, lo que ha provocado un amplio debate en la comunidad sobre la transparencia de los servicios SaaS y la protección de los derechos de los consumidores. (Fuente: Reddit r/artificial)
Un usuario de Reddit comparte cómo usó Fable 5 para organizar diez años de configuración de mundo y generar automáticamente una wiki : Un escritor de novelas compartió en Reddit que reunió sus borradores de novelas, configuraciones de mundo y notas desordenadas acumuladas durante diez años (que contenían cientos de miles de palabras) en un solo PDF y utilizó Fable 5 para analizarlos. Fable 5, tras consumir el 90% de su límite en una sola sesión, organizó a la perfección estos contenidos en entradas estructuradas de personajes, eventos y geografía, y generó automáticamente archivos Markdown que se pueden importar directamente al sistema wiki World Anvil, ayudándole a superar un largo bloqueo creativo. (Fuente: Reddit r/ClaudeAI)