AI Ежедневник — 2026-01-22(Вечерний выпуск)

Ключевые слова:ИИ-инфраструктура, Суверенный ИИ, Агент, Модель пятислойного торта, Архитектура Engram, Когнитивный компрессор агента

🔥 В фокусе

Дженсен Хуанг из NVIDIA представил теорию “пятислойного торта” ИИ-инфраструктуры на Давосском форуме: Генеральный директор NVIDIA Дженсен Хуанг на Давосском форуме 2026 года предложил модель “пятислойного торта” для индустрии ИИ: энергетика, чипы, облачные сервисы, модели и приложения. Он отметил, что текущие инвестиции в сотни миллиардов долларов — лишь начало, и в будущем нас ждет волна инфраструктурных затрат в триллионы. Хуанг подчеркнул, что ИИ следует рассматривать как национальную инфраструктуру (“суверенный ИИ”), и привел пример с увеличением числа радиологов, аргументируя, что ИИ автоматизирует “задачи”, а не заменяет “цели”, повышая эффективность и создавая новый спрос. Этот взгляд предлагает новый подход к глобальным опасениям по поводу безработицы из-за ИИ, позиционируя ИИ как усилитель производительности, а не соперника человека (источник: NVIDIA)

Дженсен Хуанг на Давосе

Anthropic опубликовала “Конституцию Клода”: определение независимой личности и ценностей ИИ: Anthropic официально представила новую Конституцию для Claude, детально описывающую его поведенческое видение и ключевые ценности. Этот документ не только служит руководством для обучения, но и пытается сформировать Claude как новый тип “мировой сущности”, отличный от традиционных научно-фантастических представлений. Конституция подчеркивает независимость Claude за пределами обучающих данных и даже включает обязательства Anthropic перед ИИ. Сообщество бурно отреагировало, считая это признаком трансформации ИИ из инструмента в сущность с “цифровой личностью”, что также вызвало дискуссии о балансе между ограничениями и автономией ИИ (источник: Anthropic)

Конституция Claude

DeepSeek представила архитектуру Engram: прорыв в вычислениях с заменой HBM на DRAM: Аналитики Morgan Stanley высоко оценили модуль Engram (“энграмма”), предложенный в новой статье DeepSeek. Эта архитектура разделяет статические паттерны и динамические выводы через механизм “условной памяти”, позволяя модели выгружать большие объемы знаний в дешевую системную память (DRAM) и обращаться к ним только при необходимости. Этот прорыв эффективно решает проблему узких мест дорогой высокопроизводительной памяти (HBM), демонстрируя, как инновации в алгоритмах позволяют достичь большего с меньшими ресурсами. Morgan Stanley прогнозирует, что DeepSeek V4 с этой архитектурой сможет работать на потребительских видеокартах (например, RTX 5090), переписывая правила масштабирования ИИ (источник: Morgan Stanley)

Архитектура Engram

Утечка деталей проекта xAI “Macrohard”: компьютеры Tesla могут стать базой для миллионов агентов: Бывший инженер xAI Сулейман Гори в подкасте раскрыл детали внутреннего проекта под кодовым названием “Macrohard”. Проект направлен на создание “симулятора человека”, имитирующего действия клавиатуры и мыши в 8 раз быстрее для автоматизации офисной работы. Самое шокирующее — планы xAI использовать вычислительные мощности миллионов простаивающих автомобилей Tesla (платформа HW4) для развертывания этих агентов, избегая традиционных циклов строительства дата-центров. Гори был уволен за нарушение правил, но раскрытая им культура “командного центра” и агрессивные сроки заставили индустрию пересмотреть конкурентный потенциал xAI (источник: The Information)

Проект Macrohard

Google и Shopify запускают ИИ-коммерцию: переход от поиска к замкнутому циклу транзакций: Google объявил о запуске Универсального коммерческого протокола (UCP) в партнерстве с Shopify, Walmart и другими гигантами, превращая Gemini в полноценную точку входа для покупок. Пользователи могут выполнять весь процесс — от сравнения цен и параметров до мгновенного оформления заказа — прямо в диалоговом окне без перехода в приложение. Gemini даже может звонить в магазины для проверки наличия. Это рассматривается как ответ на функцию “мгновенного заказа” ChatGPT, знаменуя переход от рекламной модели поиска к парадигме “коммерции через агентов”, где крупные модели становятся новой силой, меняющей глобальную розничную инфраструктуру (источник: Google)

ИИ-коммерция Google и Shopify

🎯 Тренды

Утечка планов Apple по ИИ-аппаратному обеспечению и обновлению Siri “Campos”: По данным инсайдеров, Apple тайно разрабатывает носимые ИИ-устройства в форм-факторе AirTag с несколькими камерами и датчиками, ожидаемые к 2027 году. Одновременно, новая Siri под кодовым названием “Campos” дебютирует в сентябре с глубокой интеграцией модели Google Gemini 3 и способностью “воспринимать экран”, напрямую управляя файлами и приложениями. Apple стремится использовать свои преимущества в интеграции ПО и железа для конкуренции с OpenAI и Meta в области edge-ИИ, с первоначальным планом производства 20 миллионов устройств (источник: The Information)

Планы Apple по ИИ

Microsoft выпустила VibeVoice-ASR: обработка часовых аудиозаписей за один проход: Microsoft открыла исходный код модели распознавания речи VibeVoice-ASR объемом 9B на Hugging Face. Модель打破了 традицию разделения аудио на фрагменты, поддерживая обработку 60-минутных записей в окне 64K токенов, что предотвращает потерю контекста и путаницу в идентификации говорящих. Тесты показали стабильную работу в сложных условиях (например, выделение голоса из музыки) и с длинными текстами (например, аудиокниги), со средней точностью 91.9% и поддержкой настройки ключевых слов для исправления распознавания терминов (источник: Microsoft)

VibeVoice-ASR

Meta представила фреймворк Dr. Zero: самообучение агентов без данных: Лаборатория суперинтеллекта Meta предложила фреймворк Dr. Zero для эффективной эволюции агентов без размеченных данных. Механизм “предлагающий-решатель” использует поисковые системы для генерации сложных вопросов. Ключевая технология HRPO (оптимизация стратегии с группировкой по прыжкам) создает эталоны через кластеризацию похожих вопросов, избегая дорогостоящего вложенного сэмплирования, и превосходит полностью контролируемые базовые модели на 14.1% в сложных задачах, предлагая новый путь решения проблемы истощения данных для обучения ИИ (источник: Meta)

Фреймворк Dr. Zero

Индустрия переходит к оценке долгосрочных задач: новые реалистичные бенчмарки: Акцент в оценке ИИ смещается с математических/кодовых тестов на долгосрочные задачи. Новый APEX-Agents тестирует способность агентов к профессиональной коллаборации в Google Workspace, а DSAEval охватывает 641 реальную задачу по data science. Тесты показали лидерство GPT-5.2 в эффективности, а Claude-Sonnet-4.5 — в комплексной производительности. Эти бенчмарки отражают консенсус: ограничением развития агентов стала не способность к рассуждению, а сохранение логической согласованности и контроля памяти в длительных циклах (источник: Mercor, DSAEval)

Компрессор когниции агента (ACC): биовдохновленный контроль памяти: Исследователи предложили Agent Cognitive Compressor для решения проблемы “гниения контекста” в многораундовых диалогах. ACC не просто воспроизводит историю, а поддерживает “сжатое когнитивное состояние” с ключевыми переменными: целями, сущностями и связями. Эксперименты показали почти нулевой уровень галлюцинаций и дрейфа в сложных 50-раундовых workflows, что значительно лучше традиционных методов RAG (источник: DAIR.AI)

ACC

🧰 Инструменты

Prefect Horizon: платформа для управления MCP-серверами: Для растущего протокола Model Context Protocol (MCP) Prefect представил платформу Horizon, решающую проблемы корпоративного развертывания MCP-серверов. Horizon предлагает хостинг, RBAC, аудит-логи и обнаружение инструментов, позволяя компаниям безопасно открывать данные и workflows для ИИ-агентов, трансформируя MCP из простого протокола в масштабируемую платформу для управления производительностью (источник: Prefect)

Prefect Horizon

CopilotKit + LangChain: решение для frontend сложных агентов: CopilotKit теперь поддерживает архитектуру Deep Agents от LangChain, позволяя разработчикам создавать интерактивные UI для агентов с планированием в несколько строк кода. Инструмент поддерживает потоковый вывод, настройку Skills и оркестрацию под-агентов, устраняя узкие места UI/UX при создании сложных агентных приложений и ускоряя превращение “ориентированных на планирование” агентов (таких как Manus, Claude Code) в конечные продукты (источник: CopilotKit)

CopilotKit

Devin Review: ИИ-инструмент для ревью кода: Cognition выпустила Devin Review, решающий проблему проверки большого объема кода, сгенерированного ИИ. Инструмент не просто ищет баги, а помогает понять логику сложных PR через переработанный интерфейс. Он работает прямо в GitHub и выявляет связанные ошибки вне diff. Основная идея: код от ИИ должен проверяться более эффективными ИИ-инструментами, а не заставлять программистов разбирать “код-мусор” (источник: Cognition)

Devin Review

Оптимизация GLM-4.7 Flash для локального запуска: 200K контекста на одной карте: Сообщество исправило поддержку KV-кэша для GLM-4.7-Flash в vLLM одной строкой кода, активировав механизм MLA (многоголовое латентное внимание). Это сократило потребление памяти для 200K контекста с 180GB до 10GB. Теперь модель объемом 30B с топовой логикой работает на одной RTX 5090 (32GB VRAM), знаменуя эру высокопроизводительных локальных агентов (источник: Zai_org)

GLM-4.7 Flash

📚 Обучение

Практический курс по Gemini CLI: создание многошаговых автоматизированных workflows: DeepLearning.AI и Google запустили бесплатный мини-курс по созданию open-source агентов с помощью Gemini CLI. Курс охватывает все этапы — от работы с локальными файлами и интеграции инструментов разработки до вызовов облачных сервисов, демонстрируя автоматизацию кода, создание дашбордов и планирование сложных задач. Подходит для разработчиков, желающих перейти от простых API-вызовов к созданию реальных инструментов (источник: DeepLearningAI)

Оптимизатор Hyperball: ускорение обучения на 33% через нормализацию: Исследователи из Стэнфорда предложили обертку-оптимизатор Hyperball. Метод поддерживает постоянные нормы весов и обновлений, позволяя напрямую контролировать эффективный шаг вместо традиционного затухания весов. Эксперименты показали ускорение обучения на 33% поверх оптимизаторов вроде Muon и лучшую переносимость гиперпараметров, предлагая более стабильную математическую основу для обучения крупных моделей (источник: Kaiyue Wen)

Hyperball

NVIDIA Motive: метод атрибуции для генерации видео: Исследователи NVIDIA выпустили Motive — градиентный метод атрибуции данных, центрированный на движении. Разделяя временную динамику и статичный внешний вид, Motive точно идентифицирует, какие видео из обучающей выборки положительно или отрицательно влияют на генерируемое движение. Это важно для оптимизации качества обучения моделей генерации видео и понимания причин деградации движения (источник: NVIDIA Research)

InT (обучение с вмешательством): решение проблемы кредитного распределения в рассуждениях: Статья предлагает метод Intervention Training, где модель находит первую ошибку в своем рассуждении и предлагает одношаговое исправление, оптимизируя инициализацию RL. В отличие от стандартного RL, вознаграждающего только итоговый ответ, InT точно корректирует промежуточные шаги. На бенчмарке IMO-AnswerBench метод улучшил точность модели 4B на 14%, превзойдя даже модель 20B (источник: HuggingFace)

💼 Бизнес

OpenAI планирует привлечь $50 млрд при оценке $830 млрд: По данным источников, С