AI Ежедневник - 2026-01-06(Вечерний выпуск)

Ключевые слова：ИИ-рассуждение, NVIDIA, OpenAI, Архитектура Vera Rubin, Трансформерный движок, Уход Джерри Творека

🔥 В фокусе

NVIDIA представила архитектуру Vera Rubin: начало эры ИИ-суперкомпьютеров следующего поколения : На CES 2026 Дженсен Хуанг представил новую платформу Vera Rubin, включающую собственную разработку Vera CPU (с кастомными ядрами Olympus) и Rubin GPU. Система оснащена Transformer engine, обеспечивающим 5-кратный прирост производительности инференса по сравнению с Blackwell, и поддерживает первые в мире конфиденциальные вычисления на уровне стойки. Система Rubin NVL72 благодаря 100% жидкостному охлаждению и безкабельному дизайну повышает эффективность сборки и обслуживания в 18 раз. Кроме того, NVIDIA запустила платформу хранения памяти контекста инференса, специально предназначенную для решения проблем с хранением KV Cache в приложениях с длинными текстами. Цель — снизить стоимость токенов для крупных MoE моделей до 1/10 от уровня Blackwell, что знаменует переход ИИ-инфраструктуры от «точечной вычислительной мощности» к «системному инжинирингу». (Источник: NVIDIA, 智东西, TheTuringPost)

Руководитель направления рассуждений OpenAI Jerry Tworek покидает компанию: продолжающийся отток ключевых кадров : Вице-президент OpenAI по исследованиям и разработкам, ключевой создатель моделей рассуждения o1/o3 и модели программирования Codex, Jerry Tworek, объявил об уходе. Он проработал в OpenAI почти семь лет, руководя разработками от раннего обучения роботов с подкреплением до механизмов рассуждения в GPT-4 и GPT-5. Tworek отметил, что уходит, чтобы «исследовать области исследований, которые трудно реализовать внутри OpenAI», что намекает на разрыв между идеалистической исследовательской средой и давлением коммерциализации продукта. Его уход, как лидера проекта o1, стал очередной крупной потерей после Ilya Sutskever и John Schulman, что вызвало глубокую обеспокоенность сообщества по поводу будущей независимости исследований OpenAI. (Источник: 36氪, 量子位, The Verge)

Google DeepMind объединяется с Boston Dynamics: ИИ-мозг для самого мощного тела : Google DeepMind объявила о партнерстве с Boston Dynamics. В рамках сотрудничества возможности визуально-языковых моделей (VLM) Gemini Robotics будут интегрированы в нового полностью электрического гуманоидного робота Atlas. Это означает объединение лучших в мире алгоритмов ИИ-рассуждений с самым передовым робототехническим оборудованием, что подтолкнет Embodied AI к переходу от простого сопоставления шаблонов к «физическому ИИ», обладающему физическим здравым смыслом и способному автономно планировать сложные задачи. Этот альянс рассматривается как ключевой шаг в противостоянии экосистемам Tesla Optimus и NVIDIA Isaac, предвещая наступление настоящего «момента iPhone» для гуманоидных роботов. (Источник: GoogleDeepMind, HuggingFace)

NVIDIA открывает исходный код Alpamayo: «момент ChatGPT» для автономного вождения : На CES NVIDIA открыла исходный код Alpamayo (10B параметров) — первой модели автономного вождения, основанной на рассуждениях. В отличие от традиционной цепочки «восприятие-планирование», Alpamayo обладает способностью Chain of Thought (CoT), позволяя ей понимать сложные дорожные ситуации и объяснять логику принятия решений (например, «замедление, так как пешеход может перебежать дорогу») подобно водителю-человеку. Вместе с моделью были открыты фреймворк симуляции AlpaSim и 1700 часов реальных данных вождения. Дженсен Хуанг назвал это «моментом ChatGPT для физического ИИ», стремясь через открытую экосистему разрушить монополию закрытых систем, таких как Tesla FSD, и позволить автопроизводителям по всему миру ускорить внедрение автономного вождения L4 на базе единого фреймворка рассуждений. (Источник: TheTuringPost, NVIDIA)

🎯 Тренды

NVIDIA Cosmos Reason 2: вершина производительности Physical AI : NVIDIA выпустила Cosmos Reason 2, которая заняла первые места в нескольких рейтингах, включая Physical AI Bench. Модель значительно улучшила пространственно-временное понимание и точность временных меток, поддерживая позиционирование точек 2D/3D и вывод данных траектории. Окно контекста увеличилось с 16K до 256K, что позволяет обеспечивать точную аннотацию и логический анализ длинных видео. Salesforce уже интегрировала ее в Agentforce для анализа соответствия требованиям безопасности роботов Cobalt, демонстрируя эволюцию ИИ от понимания языка к пониманию законов физического мира. (Источник: HuggingFace)

Таинственная модель Kimi «Kiwi-do» появилась на арене: поразительные мультимодальные способности : На арене больших моделей (LMArena) появилась загадочная модель под кодовым названием «kiwi-do», называющая себя Kimi. Тесты пользователей показали, что модель отлично справляется с рисованием SVG (например, пеликан на велосипеде) и задачами визуального физического понимания (VPCT), точно сочетая рассуждения с физическими законами. Предполагается, что это готовящаяся к выпуску мультимодальная модель K2-VL от Moonshot AI. Ранее Ян Чжилинь сообщил, что у компании есть резерв в 10 миллиардов наличными и планы выпустить в 2026 году новое поколение мультимодальных Agent, поддерживающих режим «размышление во время сотрудничества». (Источник: 36氪)

GEO: новые маркетинговые дивиденды и «серая» индустрия в эпоху ИИ-поиска : Поскольку инструменты ИИ-поиска, такие как ChatGPT и Perplexity, оттягивают трафик от традиционных поисковых систем, оптимизация под генеративные движки (GEO) становится новым полем битвы для брендов. Ожидается, что к 2025 году объем рынка GEO достигнет 12 миллиардов долларов за счет размещения структурированного контента для цитирования ИИ. Однако в этой области уже возникли «серые» схемы, такие как «отравление данных», использующие дешевые учебники и ложную авторитетную информацию для обмана ИИ-парсеров. OpenAI также явно сигнализирует о внедрении рекламы, изучая возможность приоритетного показа спонсируемого контента в ответах, что знаменует переход больших моделей к моделям монетизации под давлением огромных убытков. (Источник: 36氪, Tech星球)

Кризис надежности малых моделей: 50-69% правильных ответов основаны на ошибочных рассуждениях : Исследование, опубликованное DAIR.AI, раскрывает феномен «Right-for-Wrong-Reasons»: малые модели с 7-9B параметрами в задачах по математике и ответах на вопросы часто дают правильный ответ при нарушенной логической цепочке рассуждений. Что еще более удивительно, промпты самокритики (Self-critique) часто вредят производительности, так как малые модели склонны генерировать правдоподобные, но ложные оправдания. Исследование рекомендует внедрять пошаговую проверку (RIS) и RAG для усиления целостности рассуждений, а не слепо доверять конечному результату. (Источник: dair_ai)

NVIDIA Cascade RL: решение проблем обучения многодоменным рассуждениям : Для решения конфликтов между целями обучения в различных областях (математика, код, выравнивание) NVIDIA предложила фреймворк Cascade RL. Он использует последовательный режим обучения с подкреплением: сначала выравнивание RLHF, затем последовательно RL для следования инструкциям, математики, кода и программной инженерии. Эксперименты показали, что модель Nemotron-Cascade 14B превзошла DeepSeek-R1-0528, которая в 84 раза больше ее, в рейтингах по коду. Этот метод доказывает, что последовательное обучение не только предотвращает катастрофическое забывание, но и повышает верхний предел рассуждений в последующих задачах через предварительные этапы. (Источник: omarsar0)

Эпоха после Transformer: три новые архитектуры претендуют на лидерство : Один из изобретателей Transformer отметил, что эта архитектура становится препятствием для прогресса ИИ. В 2026 году вызов бросят три архитектуры: 1. Текстовые диффузионные модели (Text Diffusion), поддерживающие денойзинг целых предложений для улучшения планирования; 2. Машины непрерывного мышления (Continuous Thought Machines), позволяющие модели самостоятельно определять длительность размышлений через нейронную синхронизацию; 3. Вложенное обучение (Nested Learning), имитирующее быстрые и медленные контуры мышления человеческого мозга. Эти архитектуры призваны решить узкие места Transformer в рассуждениях, памяти и управлении. (Источник: Reddit)

🧰 Инструменты

Claude Agent SDK: запуск разработки продвинутых интеллектуальных агентов : Сообщество разработчиков активно обсуждает Claude Agent SDK (ранее Claude Code SDK), считая его гораздо большим, чем просто помощником в программировании. SDK позволяет создавать сложных Agent с многошаговыми рассуждениями, вызовом инструментов и способностью автономно работать в среде. На конференции AI Engineer Тарик продемонстрировал, как использовать этот SDK для создания футуристических оркестраторов агентов. По сравнению с IDE, такими как Cursor, SDK предоставляет разработчикам более низкоуровневый контроль для создания высококастомизированных автоматизированных рабочих процессов. (Источник: omarsar0, swyx)

ik_llama.cpp: скачок производительности инференса на нескольких GPU локально : Высокопроизводительная ветка llama.cpp — ik_llama.cpp — получила крупное обновление, реализовав настоящий тензорный параллелизм (Tensor Parallelism) через интеграцию библиотеки NVIDIA NCCL. В многопроцессорных конфигурациях этот инструмент позволяет увеличить скорость генерации локальных больших моделей в 3-4 раза, эффективно устраняя задержки конвейера. Этот прорыв позволяет разработчикам запускать модели с триллионами параметров на потребительском оборудовании с высокой эффективностью, значительно снижая порог локального развертывания ИИ. (Источник: karminski3, Reddit)

Memvid v2: замена сложных RAG-стеков одним файлом : Вирусный open-source проект Memvid выпустил версию v2, представив концепцию «Smart Frames», которая сохраняет текстовые эмбеддинги в видеокадрах, обеспечивая 100% переносимость памяти. Он может сжать 50 000 документов в файл размером 200 МБ с задержкой поиска менее 17 мс. Memvid стремится полностью заменить сложные векторные базы данных и конвейеры RAG, позволяя Agent носить долгосрочную память как USB-накопитель с возможностью бесшовного переключения между моделями GPT, Claude, Llama и др. (Источник: Reddit)

hf-mem: оценка потребностей в видеопамяти для моделей HuggingFace в один клик : Разработчик Альваро Бартоломе представил легкий Python-инструмент hf-mem. Инструмент использует только метаданные Safetensors, позволяя точно оценить необходимый объем VRAM для инференса без скачивания всей модели. С помощью команды uvx hf-mem --model-id пользователи могут быстро определить, поддерживает ли их оборудование конкретную модель. В условиях взрывного роста параметров моделей этот инструмент обеспечивает большое удобство для локального развертывания, предотвращая напрасную трату ресурсов. (Источник: huggingface)

Unsloth-MLX: мощный инструмент для локальной тонкой настройки на Mac : Разработчик Абдур Рахим выпустил Unsloth-MLX, позволяющий пользователям Mac с Apple Silicon выполнять тонкую настройку (fine-tuning) больших моделей с использованием фреймворка MLX. Инструмент сохраняет API, идентичный Unsloth, поддерживая бесшовный перенос с локального прототипирования на облачные GPU. Это отличная новость для пользователей Mac, желающих обучаться на приватных данных локально, будучи ограниченными стоимостью облачных вычислений. (Источник: awnihannun)

📚 Обучение

Энциклопедия глубокого обучения: выпущена версия Deep Learning Book 2025 : Университет Нотр-Дам опубликовал многостраничное руководство «Deep Learning Book 2025». Книга охватывает всё: от базовых перцептронов до новейших диффузионных моделей, вариаций Transformer и передовых технологий обучения с подкреплением. Содержит подробные математические выводы и интуитивно понятные диаграммы, являясь отличным бесплатным ресурсом для специалистов в 2026 году. (Источник: Reddit)

Инженерное руководство по GRPO + LoRA: создание промышленного цикла RL с нуля : На фоне бума обучения с подкреплением, вызванного DeepSeek-R1, Максим Лабонн поделился «Инженерным руководством по GRPO + LoRA с Verl». Руководство подробно объясняет, как построить стабильный конвейер RLVR в многопроцессорной среде, включая отслеживание экспериментов, советы по отладке и практический опыт выжимания максимума из мощностей A100. (Источник: maximelabonne)

9 книг для понимания ИИ: список обязательного к прочтению на 2025/2026 годы : TheTuringPost рекомендовал 9 книг для глубокого понимания трендов ИИ, включая «Apple in China» (взгляд со стороны цепочки поставок), «The Thinking Machine» (биография Дженсена Хуанга и NVIDIA), «The Path to AGI» и «Source Code» Билла Гейтса. Список охватывает все аспекты: от конкуренции чипов до социального влияния. (Источник: TheTuringPost)

💼 Бизнес

Meta покупает Manus AI: крупная ставка на универсальных агентов : Meta объявила о приобретении стартапа Manus AI, специализирующегося на ИИ-агентах, с целью интеграции их передовых возможностей в потребительские и коммерческие продукты Meta. Ранее Manus оценивался примерно в 500 миллионов долларов и демонстрировал высокие темпы роста выручки. Этот шаг показывает, что Марк Цукерберг, упустив первенство в «физическом ИИ», агрессивно восполняет пробелы в области автономных операционных Agent через слияния и поглощения. (Источник: Reddit)

RayNeo привлекла 1 млрд юаней: China Mobile и China Unicom ставят на «смартфон следующего поколения» : Лидер в области AR-очков RayNeo завершил новый раунд финансирования на сумму более 1 млрд юаней при участии фондов China Mobile и China Unicom. Это первый случай, когда операторы связи коллективно делают ставку на умные очки как на лучший носитель для внедрения больших моделей ИИ. RayNeo представит на CES первые AR-очки с eSIM, использующие граничные вычисления операторов для минимизации задержек. (Источник: 36氪)

Zhipu AI выходит на IPO в Гонконге: претендент на звание «первой в мире публичной компании больших моделей» : Zhipu AI официально запустила процесс размещения акций в Гонконге с планом выхода на биржу 8 января. Являясь лидером среди китайских стартапов, Zhipu завершила несколько раундов финансирования в 2025 году с оценкой более 20 млрд юаней. Среди акционеров — гиганты Alibaba, Tencent и Meituan. Листинг Zhipu рассматривается как лакмусовая бумажка для оценки всей ИИ-индустрии. (Источник: 36氪)

🌟 Сообщество

Vibe Coding против абстрактного проектирования: философский спор об ИИ-программировании : В сообществе развернулась бурная дискуссия о «Vibe Coding». Андрей Карпати и другие считают, что ИИ делает код дешевым, и программирование превращается в искусство, подобное игре на музыкальном инструменте. Однако ученые, такие как Омар Хаттаб, предупреждают, что генерация 100 000 строк низкоуровневого кода через диалоги без высокоуровневых абстракций приведет к засилью «Slop Code» (мусорного кода), который невозможно поддерживать. Настоящее будущее — в разработке языков программирования более высокого уровня, где ИИ будет компилятором, а не просто генератором кода. (Источник: lateinteraction, gfodor)

Исследование Гарварда: эффективность обучения с ИИ-репетиторами выросла вдвое : Рандомизированное контролируемое исследование Гарвардского университета показало, что студенты, изучающие физику с помощью ИИ-репетиторов, получают вдвое больше знаний за вдвое меньшее время по сравнению с традиционными занятиями. ИИ-репетиторы обладают «бесконечным терпением» и «мгновенной персонализированной обратной связью». Обсуждение в сообществе указывает, что это шанс для демократизации образования, но также риск усиления цифрового разрыва. (Источник: Reddit)

Юридическое чудо ИИ: Claude помог выиграть иск на 8000 долларов : Пользователь из отдаленного района поделился опытом использования Claude Opus 4.5 для самостоятельного изучения права и составления искового заявления, что позволило ему выиграть гражданское дело на 8000 долларов в суде. Он отметил, что прецедентное и статутное право, найденное Claude, было «непоколебимым» и без галлюцинаций. Этот случай вызвал дискуссии о том, положит ли ИИ конец «информационной гегемонии» в юридической сфере. (Источник: Reddit)

💡 Другое

LEGO выпускает «умные кирпичики»: крупнейшая эволюция за 50 лет : LEGO объявила о выпуске смарт-кирпичика 2×4 со встроенным микрокомпьютером, который позволяет моделям «оживать». Благодаря датчикам и ИИ модели LEGO могут светиться, издавать звуки и реагировать на движения, например, издавать гул светового меча при взмахе. Это знаменует полный переход традиционной индустрии игрушек к аппаратной интеграции ИИ. (Источник: robrombach)

Массовое производство натрий-ионных аккумуляторов в 2026 году: устранение беспокойства о запасе хода : CATL подтвердила, что натрий-ионные аккумуляторы массово выйдут на рынок в 2026 году. Они обладают плотностью энергии 175 Втч/кг, поддерживают работу при -40°C и крайне дешевы. Сообщество считает, что это ускорит падение спроса на нефть и обеспечит энергией дешевые беспилотные автопарки под управлением ИИ. (Источник: teortaxesTex)

🔥 В фокусе

🎯 Тренды

🧰 Инструменты

📚 Обучение

💼 Бизнес

🌟 Сообщество

💡 Другое

Связанные теги

Related Posts

AI Ежедневник — 2026-07-21

AI Ежедневник — 2026-07-20

AI Ежедневник — 2026-07-19