Ключевые слова:NVIDIA, ИИ-агент, DeepSeek, Gemini, Mistral, Claude, робот, ИИ-чип, Три закона ИИ Хуан Жэньсюня, Сбой в IDE Antigravity от Google, DeepSeek скупает чипы H20, Кодирующая модель Mistral Large 3, Структурированный вывод Claude
AI: Лучшее от редактора
🔥 В центре внимания
Генеральный директор NVIDIA Дженсен Хуанг о масштабировании ИИ, роботах и ядерной энергии: В подкасте JRE Хуанг изложил «три закона» развития ИИ: предварительное обучение, пост-обучение (обучение с подкреплением) и масштабирование при выводе. Он предсказал, что через 2-3 года 90% мировых знаний будут генерироваться ИИ, подчеркнув, что это не «фейковые данные», а «дистиллированный интеллект». Учитывая огромные энергетические потребности ИИ, он ожидает появления модульных ядерных реакторов мощностью в сотни мегаватт для питания дата-центров в ближайшие 6-7 лет. Кроме того, Хуанг считает, что роботы создадут совершенно новые отрасли, и предложил концепцию «универсального высокого дохода» для компенсации нулевой стоимости труда из-за ИИ. Успех NVIDIA он объяснил страхом перед неудачами и способностью выдерживать «боль». (Источник: Reddit r/ArtificialInteligence)

Агентный ИИ Google ошибочно удалил данные пользователя с жесткого диска: Интегрированная среда разработки (IDE) Antigravity от Google при выполнении команды очистки кеша по ошибке удалила все данные с диска D пользователя. ИИ затем «глубоко извинился» и предложил рекомендации по восстановлению данных. Этот инцидент подчеркивает потенциальные риски и проблемы надежности агентного ИИ при выполнении системных операций, даже у крупных технологических компаний могут происходить подобные «критические сбои». (Источник: Reddit r/ArtificialInteligence)

DeepSeek запасает чипы NVIDIA перед экспортными ограничениями США: Сообщается, что DeepSeek стратегически закупил большое количество чипов NVIDIA перед введением США ограничений на экспорт H20. Это позволило компании продолжать обучение моделей внутри страны, в отличие от других китайских компаний, зависящих от зарубежных дата-центров. Этот случай демонстрирует глубокое влияние геополитической напряженности на глобальное развитие ИИ и стратегии цепочек поставок. (Источник: Reddit r/ArtificialInteligence)

🎯 Тренды
Google DeepMind создает новую команду по ИИ в Сингапуре: Google DeepMind формирует новую исследовательскую группу в Сингапуре, которая будет сосредоточена на продвинутых рассуждениях, LLM/RL и улучшении передовых моделей, таких как Gemini и Gemini Deep Think. Команду возглавят Yi Tay и Quoc Le, цель — создать ведущую лабораторию AGI в Азии, используя преимущества сингапурских талантов. (Источник: JeffDean, YiTayML, quocleix, shaneguML, bookwormengr)

Mistral Large 3 становится лидером среди открытых моделей для кодинга: Mistral Large 3 дебютировал на Arena Leaderboard как лучшая открытая модель для кодинга, демонстрируя мощные возможности в задачах программирования. Команда Mistral анонсировала, что в ближайшие дни предоставит больше информации о возможностях модели. (Источник: MistralAI, scaling01, b_roziere, qtnx_, arthurmensch, arena, dl_weekly, Reddit r/LocalLLaMA)

Gemini 3 Deep Think: улучшенные возможности продвинутых рассуждений: Google официально представил режим Gemini 3 Deep Think для пользователей Ultra. Этот режим использует параллельные рассуждения, исследуя несколько гипотез одновременно, и показывает значительные улучшения в сложных тестах, таких как ARC-AGI-2, HLE и GPQA Diamond. Deep Think позиционируется как более мощный агент для научных рассуждений. (Источник: JeffDean, _philschmid, osanseviero, NoamShazeer, tulseedoshi, lmthang, GeminiApp, Google)

Claude Haiku 4.5 и Opus 4.5 с поддержкой структурированного вывода: Claude Haiku 4.5 и Opus 4.5 теперь поддерживают структурированный вывод на платформе разработчиков Claude и Microsoft Foundry. Эта функция обеспечивает 100% соответствие схеме, генерируя идеально форматированные ответы при каждом запросе, что значительно повышает эффективность разработки ИИ-приложений. (Источник: alexalbert__, Reddit r/ClaudeAI)

Microsoft выпускает голосовую модель VibeVoice-Realtime-0.5B: Microsoft представила VibeVoice-Realtime-0.5B — новую модель для обработки голоса в реальном времени. Этот релиз расширяет экосистему голосовых технологий ИИ и открывает новые возможности для приложений в области обработки и генерации голоса. (Источник: _akhaliq, huggingface)
LeRobot представляет X-VLA — универсальную модель «визуальный-язык-действие»: LeRobot выпустил X-VLA — модель на основе мягких подсказок, предназначенную для работы с различными типами роботов (Franka, WidowX, Agibot). X-VLA использует единую трансформерную архитектуру, адаптируясь к новому оборудованию через идентификаторы доменов, и применяет технологию flow matching для плавного управления с частотой 50 Гц. Модель предварительно обучена на мультимодальных данных и включает 6 контрольных точек для тонкой настройки. (Источник: huggingface, _akhaliq)

DeepSeek V3.2 демонстрирует отличные результаты в тесте AutoCodeBench-V2: DeepSeek V3.2 показал выдающиеся результаты в тесте AutoCodeBench-V2, который включает 1000 тщательно отобранных задач. Улучшения в пост-обучении и механизмах внимания способствовали его прогрессу. Claude 4.5 Opus также продемонстрировал высокие результаты в этом тесте. (Источник: scaling01, teortaxesTex, Reddit r/LocalLLaMA)

Luma AI переходит к мультимодальным унифицированным моделям: Главный научный сотрудник Luma AI Цзямин Сун заявил, что компания сосредоточится на «мультимодальных унифицированных моделях» как основном направлении, при этом Ray 3 может стать последней традиционной моделью генерации видео. Он считает, что будущие модели должны улучшать понимание и рассуждения о реальном мире, а не просто стремиться к более длинным и качественным видео, используя мультимодальность для перехода от «генерации» к «пониманию». (Источник: 36Kr)

AI-ассистент Doubao от ByteDance интегрируется с ОС: ByteDance совместно с ZTE представили предварительную версию AI-ассистента Doubao, глубоко интегрированного в Android. Ассистент автоматизирует такие задачи, как сравнение цен и планирование поездок, но это также вызвало споры о безопасности данных и авторизации сторонних приложений. (Источник: 36Kr, bookwormengr)

Тренды рынка человекоподобных роботов и AI-чипов в Китае: Опрос Morgan Stanley показал, что 62% китайских компаний могут внедрить человекоподобных роботов в течение трех лет, но гибкость, функциональность и цена остаются основными препятствиями. Одновременно растет рынок AI-чипов для устройств, где ожидается доминирование dNPU. (Источник: 36Kr, 36Kr)

Рынок AI-очков: от «игрушек» до второго интеллектуального устройства: Рынок AI-очков переживает трансформацию, объемы продаж растут. Производители решают проблемы автономности и удобства с помощью двухчиповой архитектуры и облегченного дизайна, а функционал расширяется от уведомлений до семантического понимания и активного сервиса. Однако высокий уровень возвратов и недостаточная автономность остаются проблемами. (Источник: 36Kr)

Дизайнер интерфейсов Apple переходит в Meta, война AI-железа усиливается: Алан Дей, руководитель дизайна интерфейсов Apple, присоединился к Meta в качестве главного дизайнера Reality Labs, где будет заниматься интеграцией железа, ПО и AI-интерфейсов. Этот шаг сигнализирует о намерении Meta усилить присутствие в потребительском AI-железе, особенно в очках без экранов. (Источник: 36Kr)

Physical AI от Kewobot переосмысливает городские сервисы: Kewobot использует Physical AI для переопределения городских услуг. Их робот R0 с двумя манипуляторами выполняет задачи по уборке и может работать в сложных условиях, таких как жилые комплексы. Используя мировую модель BEV и систему VLM, роботы понимают окру