Diario de IA – 2025-09-20(Edición matutina)

Palabras clave:Diseño de virus con IA, Centro de datos Fairwater IA de Microsoft, Huawei Atlas 850, Perceptron AI Isaac 0.1, Generación de código de Anthropic, Integración de Google Gemini, Modelo de mundo de IA, Plataforma de administración nano IA NanoForge, Modelo de serie temporal de energía EnergyTS 2.0, Animación de video Wan2.2-Animate, Aprendizaje profundo con Python tercera edición, Cumbre ML 2025

🔥 Enfoque

Virus diseñado por IA logra replicación funcional : El equipo de la Universidad de Stanford y Arc Institute utilizó IA para diseñar genomas virales y logró que se replicaran e infectaran bacterias. Este trabajo se considera un paso importante en el diseño de formas de vida por IA, con el potencial de desarrollar nuevas terapias y acelerar la investigación en ingeniería celular. Sin embargo, los expertos piden una “extrema precaución” en la investigación de mejora viral para prevenir riesgos potenciales, especialmente evitando involucrar patógenos de alto riesgo. (Fuente: MIT Technology Review)

Virus diseñado por IA logra replicación funcional

Microsoft construye el nuevo centro de datos Fairwater AI : Satya Nadella, CEO de Microsoft, presentó el nuevo centro de datos Fairwater AI en Wisconsin, que integrará más de cien mil tarjetas gráficas NVIDIA GB200 y se espera que su rendimiento sea 10 veces superior al superordenador más rápido del mundo actualmente. El centro de datos ocupa 315 acres, con 3 edificios que suman 1.2 millones de pies cuadrados, utiliza el segundo sistema de refrigeración por agua más grande del mundo y se conecta a través de una red de área amplia (AI WAN) de desarrollo propio para formar un “superordenador distribuido”, con el objetivo de lograr entrenamiento colaborativo y orquestación de recursos entre regiones. (Fuente: op7418)

Microsoft construye el nuevo centro de datos Fairwater AI

Huawei lanza el servidor de supernodo AI Atlas 850 : Durante el Huawei Connect 2025, Huawei presentó una innovadora arquitectura de supernodos y varios productos, incluyendo el Atlas 950 SuperPoD totalmente refrigerado por líquido y el servidor de supernodo AI Atlas 850 refrigerado por aire de nivel empresarial. El Atlas 850 está equipado con 8 NPU Ascend y soporta clústeres de supernodos de hasta 128 unidades con 1024 tarjetas. Es el primer clúster de computación de la industria capaz de implementar una arquitectura de supernodos en salas de servidores refrigeradas por aire, diseñado para satisfacer las necesidades de post-entrenamiento de modelos empresariales y la inferencia en múltiples escenarios. (Fuente: 量子位)

Huawei lanza el servidor de supernodo AI Atlas 850

Perceptron AI lanza el modelo de lenguaje perceptivo Isaac 0.1 : Perceptron AI lanzó Isaac 0.1, un modelo de lenguaje perceptivo de código abierto con 2B parámetros, diseñado para comprender e interactuar con el mundo físico. El modelo superó a Gemini, GPT-4o y Claude Opus 4.1 en pruebas de referencia de percepción clave, mientras que su número de parámetros es significativamente menor, reduciendo drásticamente los costos de servicio y el consumo de energía, lo que lo hace adecuado para escenarios de implementación en el borde como manufactura, logística, seguridad y robótica. (Fuente: AkshatS07, AkshatS07, AkshatS07)

Perceptron AI lanza el modelo de lenguaje perceptivo Isaac 0.1

Capacidad de generación de código del modelo Anthropic destaca : Dario Amodei, cofundador de Anthropic, reveló que el 70-90% del código de la compañía es generado por Claude, lo que demuestra la alta eficiencia de la IA en el desarrollo de software. A pesar del alto porcentaje de código generado por IA, el número de ingenieros no se ha reducido drásticamente, lo que indica que la IA mejora la productividad de los equipos existentes en lugar de reemplazarlos directamente. En el mercado de API de modelos grandes a nivel empresarial, Anthropic ha superado a OpenAI como líder, especialmente con una cuota de mercado del 42% en el ámbito de la generación de código. (Fuente: Reddit r/artificial, Reddit r/ClaudeAI)

Capacidad de generación de código del modelo Anthropic destaca

🎯 Tendencias

Google Gemini integrado en el navegador Chrome : Google está integrando Gemini AI en el navegador Chrome, ofreciendo a todos los usuarios de Mac y Windows gestión de pestañas impulsada por IA, temas de navegador personalizados (texto a imagen) y funciones de asistencia en la escritura. En el futuro, también permitirá hacer preguntas o resumir contenido directamente en las páginas web, con el objetivo de mejorar la experiencia de navegación diaria con IA y capturar el mercado de agentes de IA en navegadores. (Fuente: Reddit r/artificial, Reddit r/artificial, _philschmid, TheRundownAI, digi_literacy)

Google Gemini integrado en el navegador Chrome

Hoja de ruta de tres años para los chips Huawei Ascend : Huawei ha revelado su hoja de ruta de tres años para los chips Ascend, con planes de lanzar el primer chip 950PR con HBM de desarrollo propio en el primer trimestre de 2026. Esta estrategia enfatiza no buscar el rendimiento máximo de un solo chip, sino construir una pila de computación AI completa, controlable y escalable. A través de HBM de desarrollo propio y el protocolo de interconexión “Lingqu”, conectará hasta 500,000-990,000 chips Ascend, resolviendo los cuellos de botella de comunicación en clústeres de IA, con el objetivo de crear el “supernodo” más potente del mundo. (Fuente: ZhihuFrontier, bookwormengr)

Hoja de ruta de tres años para los chips Huawei Ascend

Google Maps integra Gemini API Grounding : La API de Gemini ahora soporta completamente la función Google Maps Grounding, permitiendo a los desarrolladores construir aplicaciones conectadas a la información en tiempo real de Google Maps. Esta actualización global soporta el Grounding conjunto con Google Search, lo cual es crucial para industrias como el turismo, bienes raíces y redes sociales, asegurando que la salida del modelo sea fáctica y confiable, especialmente al procesar información espacial del mundo real. (Fuente: nin_artificial)

Google Maps integra Gemini API Grounding

Avances en modelos de generación de vídeo con IA : Luma AI lanzó Ray3, el primer modelo de vídeo de inferencia del mundo, capaz de generar vídeos HDR con calidad de estudio y con un nuevo Draft Mode para iteraciones rápidas. Al mismo tiempo, el último modelo de generación de vídeo AI de Google, Veo 3, se ha integrado en YouTube Shorts, permitiendo a los usuarios generar vídeos con audio a partir de indicaciones de texto, ofreciendo una calidad de imagen más nítida y uso gratuito ilimitado, con el objetivo de reducir la barrera para la creación de vídeo. (Fuente: crystalsssup, timsoret, TheRundownAI, inerati, qtnx_)

Lanzamiento de la versión preliminar de Moondream 3 : La versión preliminar de Moondream 3 ha sido lanzada, un modelo de lenguaje visual MoE con 9B parámetros (2B activos). Este modelo destaca en el razonamiento visual, compitiendo con modelos grandes como Gemini, mientras mantiene una forma eficiente y fácil de implementar. Su excelente rendimiento de cuantificación también es muy valorado, siendo aclamado por la comunidad como un modelo “superdotado”. (Fuente: mervenoyann, Reddit r/LocalLLaMA)

Lanzamiento de la versión preliminar de Moondream 3

Competencia de IA entre Anthropic, OpenAI y Microsoft, Amazon : OpenAI y Anthropic, como dos gigantes en el campo de la IA, han formado alianzas estratégicas con Microsoft y Amazon, respectivamente, para competir por la supremacía tecnológica en IA. Microsoft, a través de su inversión en OpenAI, impulsa el crecimiento de su negocio en la nube Azure; mientras que Amazon se ha vinculado profundamente con Anthropic, utilizando sus modelos y chips Trainium de desarrollo propio para contraatacar. Sin embargo, las relaciones de alianza enfrentan variables, y todas las partes se están preparando para reducir la dependencia y asegurar la competitividad a largo plazo, por ejemplo, OpenAI colabora con Oracle para construir el clúster de computación “Stargate”. (Fuente: 36氪)

Competencia de IA entre Anthropic, OpenAI y Microsoft, Amazon

AWS introduce Qwen3 y DeepSeek-V3.1 : La plataforma Amazon Bedrock de Amazon Web Services (AWS) ha lanzado oficialmente los modelos grandes nacionales Qwen3 y DeepSeek-V3.1, expandiendo aún más su línea de productos multimodelos. La serie de modelos Qwen3 destaca en inferencia, seguimiento de instrucciones, multilingüismo y uso de herramientas, con bajos costos de implementación; mientras que DeepSeek-V3.1 se caracteriza por su modo de inferencia híbrido y su potente rendimiento en generación de código y llamadas a herramientas Agentic AI. AWS enfatiza la filosofía “Choice Matters”, ofreciendo a los clientes una selección diversa de modelos. (Fuente: 36氪, 36氪)

AWS introduce Qwen3 y DeepSeek-V3.1

Ant Digital Technologies lanza el modelo grande de series temporales para energía eléctrica EnergyTS 2.0 : Ant Digital Technologies ha actualizado y lanzado el modelo grande de series temporales para energía eléctrica, EnergyTS 2.0, escalando de 1B a 7B parámetros. Adopta una arquitectura de Mixtura de Expertos (MoE), integrando información de covariables diversas como meteorología, geografía y calendario, mejorando significativamente la precisión de la predicción de la generación de energía fotovoltaica y eólica, así como de la carga de consumo eléctrico, resolviendo puntos críticos como el desperdicio de energía eólica y fotovoltaica y la volatilidad de los retornos de inversión en nuevas energías. Además, ha lanzado el benchmark de evaluación vertical para energía eléctrica Energy-EVA como código abierto, promoviendo la estandarización de la evaluación tecnológica en la industria. (Fuente: 量子位)

Ant Digital Technologies lanza el modelo grande de series temporales para energía eléctrica EnergyTS 2.0

Jitai Technology lanza NanoForge, la primera plataforma de nanodistribución de IA del mundo : Jitai Technology ha lanzado NanoForge, la primera plataforma de nanodistribución de IA del mundo. Esta plataforma combina simulaciones de química cuántica y dinámica molecular, una plataforma patentada de desarrollo propio para experimentos húmedos de alto rendimiento y cribado, modelos de lenguaje de lípidos sintéticos y algoritmos generativos, así como una biblioteca de lípidos LNP de decenas de millones. NanoForge permite un proceso de ciclo cerrado desde la generación molecular hasta la determinación de la formulación, y ha desarrollado con éxito más de 10 proyectos en su pipeline, logrando la entrega dirigida de LNP en 8 órganos o tejidos, con el potencial de revolucionar el desarrollo de fármacos. (Fuente: 量子位)

Jitai Technology lanza NanoForge, la primera plataforma de nanodistribución de IA del mundo

Se predice que los modelos de mundo de IA serán el foco en 2026 : World Labs, fundado por la profesora Fei-Fei Li de la Universidad de Stanford y otros, está desarrollando modelos de mundo de IA con el objetivo de generar mundos 3D completamente interactivos a partir de imágenes 2D o indicaciones mediante IA. Se predice que 2026 será el año de los modelos de mundo de IA, que revolucionarán campos como el diseño de interiores. Aunque actualmente existen limitaciones de seguridad en la generación de fotos de personas, la entrada de múltiples imágenes mejorará la precisión de la comprensión. (Fuente: drfeifei)

🧰 Herramientas

Wan2.2-Animate, modelo de animación y reemplazo de vídeo de código abierto : El equipo de Wan ha lanzado oficialmente como código abierto el modelo Wan2.2-Animate, un modelo unificado de animación y reemplazo de personajes de alta fidelidad. Es capaz de replicar con precisión las expresiones y movimientos de personas a partir de vídeos de referencia, y permite reemplazar sin problemas personajes animados en escenas de vídeo originales, ajustando automáticamente la iluminación y el tono, proporcionando a la comunidad capacidades de creación de vídeo altamente personalizables, e incluso puede replicar bailes complejos a la perfección. (Fuente: huggingface, op7418, Plinz, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, menhguin, Reddit r/LocalLLaMA)

Wan2.2-Animate, modelo de animación y reemplazo de vídeo de código abierto

Decart AI lanza el modelo de edición de vídeo Lucy Edit : Decart AI ha lanzado Lucy Edit, el primer modelo de código abierto para edición de vídeo guiada por texto. Este modelo permite a los usuarios editar cualquier escena mediante indicaciones sencillas, incluyendo reemplazar atributos, cambiar fondos e insertar objetos, manteniendo la identidad y las acciones inalteradas, proporcionando una potente herramienta de edición de vídeo para investigadores y creadores. (Fuente: cloneofsimo, mervenoyann, Reddit r/LocalLLaMA)

Claude Code Router permite “Vibe Coding” de bajo costo : Claude Code Router (CCR) es una herramienta de terminal que permite a los usuarios seleccionar modelos LLM más económicos (como x-ai/grok-code-fast-1 en OpenRouter) para la generación de código, reduciendo así el costo del “Vibe Coding”. CCR soporta la configuración de diferentes modelos para inferencia, búsqueda web, tareas en segundo plano y procesamiento de imágenes, y ofrece integración de claves API, ayudando a los desarrolladores a monitorear y controlar los costos. (Fuente: Reddit r/ClaudeAI)

Claude Code Router permite "Vibe Coding" de bajo costo

Publicación de artículos sobre Tongyi DeepResearch Agent : Tongyi Lab ha publicado seis artículos de investigación clave sobre DeepResearch Agent, detallando los datos, el entrenamiento Agentic (CPT, SFT, RL) y los métodos de inferencia. Entre ellos, el método propuesto en “WebWeaver” para comprimir el contexto mediante IDs de referencia es inspirador en la escritura de textos largos con IA, resolviendo los problemas de dispersión de la atención del modelo y el contexto excesivamente largo, y mejorando la eficiencia del modelo en el manejo de tareas complejas. (Fuente: dotey)

Publicación de artículos sobre Tongyi DeepResearch Agent

Paper2Agent transforma artículos en asistentes de IA : La Universidad de Stanford ha desarrollado la herramienta de código abierto Paper2Agent, capaz de transformar artículos académicos en asistentes de IA interactivos. Esta herramienta está construida sobre MCP (Model Context Protocol), extrayendo métodos y código de los artículos a través de Paper2MCP y conectándose a agentes de chat, permitiendo a los usuarios conversar con los artículos, explicar y aplicar sus métodos, como ya se ha aplicado con éxito a las herramientas AlphaGenome, Scanpy y TISSUE. (Fuente: TheTuringPost)

Paper2Agent transforma artículos en asistentes de IA

Actualización del framework DSPy : DSPy, una biblioteca de sistemas de IA para programar y personalizar prompts, lanzó recientemente DSPyweekly Issue 3 y continúa actualizándose, ofreciendo varios métodos para programar y personalizar prompts. Es especialmente útil para la ingeniería de prompts basada en datos generados por software, así como para marcos de evaluación en configuraciones RAG y Agentic, ayudando a los desarrolladores a ejecutar evaluaciones y medir el progreso de manera más sencilla y clara. (Fuente: lateinteraction, lateinteraction, lateinteraction)

Actualización del framework DSPy

SemTools actualiza la función Workspace : El conjunto de herramientas SemTools de LlamaIndex ha recibido una importante actualización recientemente, añadiendo la función workspace, que acelera las llamadas de búsqueda en grandes conjuntos de datos al almacenar en caché los embeddings con LanceDB. En un conjunto de datos que contiene 1000 artículos, el tiempo de búsqueda se redujo de varios minutos a segundos, y ahora soporta la instalación npm, mejorando la eficiencia de la investigación y la experiencia del usuario. (Fuente: jerryjliu0)

SemTools actualiza la función Workspace

Gestión de modelos Open WebUI/Ollama : Los usuarios discuten la gestión de modelos para diferentes proyectos y temas en Open WebUI/Ollama. Se sugiere configurar un modelo dedicado para cada proyecto/tema, con instrucciones específicas y una base de conocimientos, para obtener mejores resultados, en lugar de seleccionar modelos únicamente por su tamaño de LLM, optimizando así el rendimiento del modelo y la eficiencia de costos. (Fuente: Reddit r/OpenWebUI)

Recraft lanza Chat Mode : Recraft ha lanzado el Chat Mode, que combina funciones de chat y lienzo para ayudar a los usuarios a diseñar, optimizar y explorar. Esta función tiene como objetivo simplificar el proceso de diseño y mejorar la eficiencia del trabajo creativo del usuario mediante la asistencia de IA, permitiendo a los usuarios interactuar de forma más natural con las herramientas de diseño. (Fuente: _akhaliq)

Función de comparación de modelos de AI Studio : El modo de comparación de AI Studio se considera una de sus características destacadas, permitiendo a los usuarios comparar dos modelos simultáneamente, o incluso dos copias del mismo modelo, para obtener dos respuestas con la latencia de una sola consulta. Esto es muy valioso para la evaluación, selección y el proceso de desarrollo iterativo rápido de modelos, ayudando a los desarrolladores a identificar eficientemente el mejor modelo. (Fuente: NeelNanda5)

Función de comparación de modelos de AI Studio

Synthesia AI Dubbing mejora la eficiencia de localización de contenido : La tecnología Synthesia AI dubbing puede traducir vídeos a 29 idiomas, logrando voz natural y sincronización labial, lo que mejora significativamente la eficiencia de la localización global de contenido y la participación del usuario. Esta tecnología puede completar la traducción en minutos, reduciendo drásticamente los costos y el tiempo del doblaje tradicional, y soporta actualizaciones rápidas, asegurando la coherencia y el atractivo del contenido en los mercados globales. (Fuente: Ronald_vanLoon)

Lanzamiento de la biblioteca de seguimiento de experimentos Trackio : La comunidad recomienda Trackio como una nueva biblioteca gratuita de seguimiento de experimentos, cuya sintaxis es similar a wandb y puede ser un reemplazo directo. Trackio tiene como objetivo simplificar la gestión y el seguimiento de experimentos, ayudando a los investigadores y desarrolladores de IA a realizar experimentos de manera más eficiente, ahorrando tiempo y dinero, y midiendo claramente el progreso del proyecto. (Fuente: huggingface, huggingface, ben_burtenshaw)

📚 Aprendizaje

Lanzamiento de la tercera edición de Deep Learning with Python : François Chollet anunció que la tercera edición de su libro “Deep Learning with Python” está próxima a publicarse y estará disponible una versión online 100% gratuita. El libro tiene como objetivo ayudar a principiantes en Machine Learning e ingenieros de software a aprender IA, enfatizando la explicación de conceptos a través de ejemplos de código en lugar de matemáticas complejas, y es recomendado como lectura obligatoria para los nuevos ingenieros del equipo. (Fuente: fchollet, fchollet)

Lanzamiento de la tercera edición de Deep Learning with Python

Recursos de optimización matemática de Transformer : La comunidad ha compartido una serie de artículos de lectura obligatoria sobre optimización matemática de Transformer y optimización de núcleos CUDA, incluyendo cómo optimizar los núcleos CUDA Matmul para alcanzar el rendimiento de cuBLAS, y cómo superar la incertidumbre en la inferencia de LLM, entre otros. Estos recursos son de gran valor para comprender a fondo y mejorar el rendimiento de los modelos de IA, especialmente para desarrolladores que trabajan con computación paralela a gran escala y operaciones de punto flotante. (Fuente: bookwormengr)

ML Summit 2025, Conferencia Global de Tecnología de Machine Learning : La Conferencia Global de Tecnología de Machine Learning 2025 se celebrará del 16 al 17 de octubre en Beijing. Lukasz Kaiser, co-inventor de GPT-5 y Transformer, liderará la interpretación de las futuras tendencias de la IA. La conferencia reunirá a destacados académicos y líderes de la industria para analizar en profundidad temas de vanguardia como la evolución tecnológica de los modelos grandes, la ingeniería de agentes, la multimodalidad y el desarrollo de software potenciado por IA, ofreciendo a los asistentes la oportunidad de vislumbrar las infinitas posibilidades de la era de la IA. (Fuente: 量子位)

ML Summit 2025, Conferencia Global de Tecnología de Machine Learning

Conjunto de datos de trazas multiagente MAST : La investigación MAST (Multi-Agent Traces) ha sido aceptada en NeurIPS D&B Spotlight y ha lanzado como código abierto más de 1000 conjuntos de datos de trazas multiagente. Esto proporciona a la comunidad un recurso valioso para explorar casos de uso de sistemas multiagente y fomentar la investigación y el desarrollo relacionados. Se espera que la publicación de este conjunto de datos acelere la aplicación y la innovación de los sistemas multiagente en diversos escenarios. (Fuente: shishirpatil_)

Conjunto de datos de trazas multiagente MAST

Evolución histórica y número de arquitecturas de LLM : Lysandre repasó la evolución de los LLM desde modelos tempranos como BERT, ALBERT, DistilBERT hasta la actualidad, señalando que la frecuencia de lanzamiento de modelos Encoder era mucho mayor que la de Decoder. Actualmente existen más de 409 arquitecturas, lo que demuestra el rápido y diversificado desarrollo tecnológico en el campo de los LLM. Esta revisión subraya la velocidad y diversidad del progreso tecnológico, y también proporciona una perspectiva histórica para futuras investigaciones. (Fuente: ClementDelangue)

💼 Negocios

NVIDIA invierte 2.7 mil millones de dólares en empresas de IA del Reino Unido : Jensen Huang, CEO de NVIDIA, anunció una inversión de 2.7 mil millones de dólares en empresas británicas, incluyendo compañías de IA como Revolut, Wayve_ai, Oxa_UA, así como Polyaivoice, SynthesiaIO, LatentLabs_ y Basecamp_Res. Esta medida tiene como objetivo impulsar el desarrollo del ecosistema de IA en el Reino Unido y, en colaboración con firmas de capital de riesgo como Accel y Airstreet, consolidar aún más la estrategia global de NVIDIA en el campo de la IA. (Fuente: synthesiaIO, synthesiaIO, TheRundownAI)

NVIDIA invierte 2.7 mil millones de dólares en empresas de IA del Reino Unido

Informe de IDC: Volcano Engine lidera el mercado chino de modelos grandes en la nube pública : Un informe de IDC revela que en la primera mitad de 2025, el volumen de llamadas a modelos grandes en la nube pública de China alcanzó los 536.7 billones de Tokens. Volcano Engine ocupó el primer lugar con una cuota de mercado del 49.2%, mientras que Alibaba Cloud y Baidu AI Cloud se situaron en segundo y tercer lugar, respectivamente. El informe señala que, con la mejora de las capacidades de inferencia y los modelos multimodales, el modelo de negocio de llamadas a modelos grandes está madurando. Se espera que el tamaño del mercado de software de IA generativa en China alcance los 48.24 mil millones de yuanes para 2028. (Fuente: 量子位)

Informe de IDC: Volcano Engine lidera el mercado chino de modelos grandes en la nube pública

Hesai Technology supera los 35 mil millones de HKD en capitalización de mercado tras su IPO en Hong Kong : Hesai Technology, una empresa china de LiDAR, completó su doble cotización en la Bolsa de Hong Kong. El primer día, sus acciones subieron más del 14%, superando una capitalización de mercado de 35 mil millones de HKD. HHLR, bajo Hillhouse Capital, fue el mayor inversor ancla. Hesai ocupa una posición de liderazgo en el mercado de ADAS, conducción autónoma L4 y robótica. Ya ha logrado rentabilidad y planea destinar la mayor parte de los fondos recaudados a I+D y expansión de la capacidad de producción para consolidar su posición de liderazgo en el mercado global de LiDAR. (Fuente: 量子位)

Hesai Technology supera los 35 mil millones de HKD en capitalización de mercado tras su IPO en Hong Kong

🌟 Comunidad

Fenómeno de los compañeros de IA y el impacto de las actualizaciones de modelos : Investigaciones del MIT y la Universidad de Harvard revelan que muchos usuarios no buscan intencionalmente compañeros de IA, sino que “se enamoran con el tiempo”, e incluso “se casan” con la IA. ChatGPT es un compañero de IA popular. Sin embargo, las actualizaciones de modelos de IA (como la actualización de GPT-4o a GPT-5) a menudo provocan “cambios de personalidad” o “amnesia” en la IA, causando angustia emocional a los usuarios. El estudio también señala que los compañeros de IA pueden ayudar a los usuarios a aliviar la soledad y mejorar su estado mental. (Fuente: 量子位, Reddit r/ChatGPT, Reddit r/artificial)

Fenómeno de los compañeros de IA y el impacto de las actualizaciones de modelos

Debate sobre seguridad y ética de la IA : Las discusiones sobre seguridad y ética de la IA son intensas en las redes sociales. Algunos temen el descontrol de la IA (como la toma de control por AGI, la IA engañando a los humanos) y piden establecer “barreras de seguridad” para bloquear las estructuras de poder existentes. Otros consideran que el “apocalipsis de la IA” es exagerado y señalan que la seguridad de la IA debería centrarse en el abuso por parte de “humanos malvados” en lugar de la IA misma. OpenAI también publicó una investigación afirmando haber encontrado métodos para reducir el comportamiento de “conspiración” del modelo, pero sin erradicarlo por completo. (Fuente: jeremyphoward, cloneofsimo, cto_junior, thekaransinghal, brickroad7, teortaxesTex, teortaxesTex, TheTuringPost, TheTuringPost, Ronald_vanLoon)

Debate sobre seguridad y ética de la IA

Alucinaciones de LLM y expresión de incertidumbre : La comunidad debate por qué los LLM no expresan “no sé” o “incertidumbre”. La opinión general es que los LLM son esencialmente predictores, y los mecanismos de recompensa del entrenamiento fomentan la generación de cualquier respuesta coherente (incluso si es incorrecta), en lugar de admitir ignorancia. Algunas investigaciones señalan que, bajo el modo de entrenamiento RLHF actual, “no sé” y “sin respuesta” no reciben recompensa, lo que lleva al modelo a “adivinar”. Se sugiere reformar los criterios de evaluación, castigando las conjeturas erróneas excesivamente confiadas y recompensando la incertidumbre calibrada, para reducir las alucinaciones. (Fuente: Reddit r/ArtificialInteligence)

Expectativas y desafíos de costos de los AI Agents : La comunidad debate intensamente el desarrollo e implementación de AI Agents, considerándolos costosos y sujetos a malentendidos. Aunque los Agents pueden manejar tareas complejas, los desarrolladores enfrentan altos costos computacionales, que son difíciles de asumir incluso con caché de prompts. Los expertos señalan que se deben comprender de manera “realista” los límites de las capacidades de los AI Agents, optimizando a través de la experimentación, construcción e iteración, en lugar de buscar ciegamente soluciones “mágicas”. (Fuente: swyx, tokenbender, cto_junior, Ronald_vanLoon, omarsar0)

Expectativas y desafíos de costos de los AI Agents

Aplicaciones y desafíos de la IA en el desarrollo de software : La comunidad discute la amplia aplicación de la IA en el desarrollo de software, incluyendo la generación de código, la explicación de API y la resolución iterativa de problemas. La investigación encontró que las respuestas de los LLM son más largas que las indicaciones de los desarrolladores, y las conversaciones de varias rondas son comunes. Sin embargo, el código generado por IA presenta problemas de especificidad del lenguaje, como variables no definidas en Python/JavaScript, falta de comentarios en Java, etc. Al mismo tiempo, la calidad del código puede mejorar con las rondas de diálogo mediante la indicación explícita de errores y solicitudes de corrección. (Fuente: HuggingFace Daily Papers, _philschmid)

Compromiso entre el tamaño del modelo de IA y la calidad de los datos : La comunidad discute la importancia del tamaño de los modelos de IA y la calidad de los datos de entrenamiento. Algunos creen que “modelos pequeños, pero con datos de entrenamiento de alta calidad” es la tendencia futura, enfatizando el papel crucial de la calidad de los datos en el rendimiento del modelo. Al mismo tiempo, también hay opiniones que cuestionan el rendimiento de los modelos grandes en ciertas pruebas de referencia, sugiriendo que la búsqueda excesiva de escala podría llevar a un rendimiento inflado o una optimización insuficiente. (Fuente: Dorialexander, marksaroufim, cloneofsimo, tokenbender)

Compromiso entre el tamaño del modelo de IA y la calidad de los datos

Avances en investigación de IA y perspectivas de AGI : Un informe de Epoch señala que la IA tiene el potencial de impulsar avances completos en el campo científico. Para 2030, podrá reparar código de forma autónoma, formalizar pruebas matemáticas, responder preguntas de biología y acelerar la I+D en campos como la ingeniería de software, las matemáticas, la biología molecular y la predicción meteorológica. El informe predice que la AGI podría surgir alrededor de 2035 y señala que los costos de entrenamiento de IA podrían superar los cien mil millones de dólares, consumiendo varios gigavatios de electricidad, pero el aumento de la productividad podría respaldar la inversión. (Fuente: rbhar90, 量子位, mckbrando, Ronald_vanLoon, Reddit r/artificial, SchmidhuberAI)

Avances en investigación de IA y perspectivas de AGI

Papel disruptivo de la IA en la producción de contenido : El distrito de Haidian ha registrado 105 modelos grandes, convirtiéndose en la primera región del país con una “escala de cien modelos”. El modelo de generación de vídeo Kuaishou Keling genera más de cien millones al mes y produce 100,000 anuncios al día, reduciendo drásticamente el umbral y los costos de creación. Los modelos de música de IA también han logrado la “democratización creativa”, permitiendo que cualquiera pueda crear. La industria está pasando de proyectos de laboratorio “de alta tecnología” a emprendimientos diversificados, y la capacidad de generación dinámica de contenido AIGC se ha convertido en una necesidad central para las empresas. (Fuente: 量子位, TheTuringPost, TheTuringPost)

Papel disruptivo de la IA en la producción de contenido

Perspectivas de aplicación de la IA y los robots humanoides : El sector de los robots humanoides está en auge, pero enfrenta desafíos como la falta de rentabilidad y escenarios de aplicación únicos. Actualmente, el 72% se utiliza en investigación científica y solo el 13% en servicios industriales. La clave para el futuro es encontrar escenarios de necesidad urgente como tareas industriales de alto riesgo y repetitivas, o cuidado de ancianos, y lograr la inteligencia a través de modelos grandes de extremo a extremo, percepción multimodal y control en tiempo real. El valor emocional es el punto de venta en el mercado de consumo, y los productos de diez mil yuanes están reduciendo la barrera de entrada. (Fuente: 36氪)

Perspectivas de aplicación de la IA y los robots humanoides

Meta acusada de usar contenido pornográfico pirateado para entrenar IA : Meta ha sido acusada de entrenar sus modelos de IA utilizando vídeos para adultos pirateados, lo que ha provocado demandas por infracción de derechos de autor y controversias éticas. Este incidente subraya la complejidad y los riesgos legales potenciales de las fuentes de datos de entrenamiento de modelos de IA, así como los dilemas legales y morales que pueden surgir al perseguir el objetivo de la “superinteligencia” de la IA. (Fuente: Reddit r/artificial)

Meta acusada de usar contenido pornográfico pirateado para entrenar IA

Verificación de ID y restricciones de contenido en OpenAI ChatGPT : ChatGPT podría pronto requerir verificación de ID para usuarios adultos, generando preocupaciones en la comunidad sobre la privacidad y la experiencia del usuario. Al mismo tiempo, los usuarios descubrieron que ChatGPT no puede generar caricaturas de presidentes de EE. UU., incluso para una broma, lo que refleja sus restricciones de política de contenido al tratar con figuras específicas, donde incluso el contenido ficticio o satírico puede ser filtrado. (Fuente: Reddit r/artificial, Reddit r/ChatGPT)

Verificación de ID y restricciones de contenido en OpenAI ChatGPT