AI Ежедневник — 2026-01-07(Вечерний выпуск)

Ключевые слова:Искусственный интеллект (ИИ), CES 2026, Человекоподобные роботы, Архитектура Vera Rubin, Модель Alpamayo, Тест Тьюринга-AGI

🔥 В фокусе

NVIDIA представила архитектуру Vera Rubin и модель Alpamayo : Дженсен Хуанг на CES 2026 объявил о наступлении «момента ChatGPT для физического AI». Новая архитектура Rubin включает шесть совместно разработанных чипов, обеспечивая 5-кратный рост производительности инференса по сравнению с Blackwell при снижении затрат в 10 раз; производство уже запущено. Одновременно представлена Alpamayo — первая в мире open-source модель инференса для автономного вождения, использующая цепочку рассуждений Vision-Language-Action (VLA), что позволяет ей объяснять логику решений подобно человеку. Это знаменует трансформацию NVIDIA из поставщика вычислительных мощностей в провайдера инфраструктуры физического интеллекта, стремящегося решить проблему «длинного хвоста» в беспилотном вождении через «inference-driven» подход (Источник: nvidia, 36氪)

英伟达发布Vera Rubin架构与Alpamayo模型

AMD объединяется с Ли Фэйфэй для развития «пространственного интеллекта» и платформы Helios : Лиза Су на CES продемонстрировала стоечную платформу Helios для вычислений Yotta-масштаба, объединяющую 72 GPU MI455 в одной стойке с производительностью 2.9 Exaflops. Ли Фэйфэй, CEO World Labs, подчеркнула необходимость перехода AI от языкового интеллекта к моделям мира с пониманием пространства. Модели World Labs на платформе AMD показали 4-кратное ускорение инференса, позволяя восстанавливать интерактивное 3D-пространство из одной фотографии. Этот шаг демонстрирует амбиции AMD в облачных вычислениях, корпоративном сегменте и пространственном интеллекте, бросая прямой вызов доминированию NVIDIA (Источник: AMD, 36氪)

AMD联手李飞飞发力“空间智能”与Helios平台

Серийная версия Atlas от Boston Dynamics приступает к работе на заводах Hyundai : Полностью электрический гуманоидный робот Atlas официально дебютировал на CES 2026 с объявлением о начале промышленной эксплуатации. Новый Atlas обладает 56 степенями свободы, полноповоротными суставами, способен поднимать грузы до 50 кг одной рукой и оснащен тактильными сенсорами. Hyundai планирует масштабное развертывание на заводе в Джорджии с 2028 года для сортировки деталей. Одновременно с этим китайские компании, такие как Unitree и Agibot, массово представили свои разработки, демонстрируя высокую скорость поставки и адаптивность к сценариям; гуманоидные роботы переходят от лабораторных демо к реальному серийному производству (Источник: 36氪, 凤凰网科技)

波士顿动力Atlas量产版入驻现代工厂

Эндрю Ын предложил новый стандарт «Turing-AGI Test» : Эндрю Ын рекомендует отказаться от простых текстовых чат-тестов в пользу оценки способности AI выполнять экономически полезную работу. Новый тест требует, чтобы AI, имея доступ к компьютеру с интернетом, браузером и Zoom, выполнял рабочие задачи (например, обучение и практику в поддержке клиентов) в течение нескольких дней, как удаленный сотрудник. Он считает, что текущие публичные Benchmark (например, GPQA) страдают от чрезмерной оптимизации под тесты, а «Turing-AGI Test» поможет развеять индустриальные иллюзии и скорректировать ожидания общества от реальных возможностей AI (Источник: AndrewYNg, dotey)

吴恩达提出“图灵-AGI测试”新标准

🎯 Тренды

Liquid AI выпустила серию пограничных моделей LFM 2.5 : Liquid AI представила LFM 2.5 с 1.2 млрд параметров, ориентированную на использование агентов на устройствах. Модель обрабатывает 28k токенов менее чем за 6 секунд на ноутбуке с чипом M5, достигая скорости более 5000 tok/s. Версия LFM 2.5-Audio поддерживает real-time ASR и TTS, работая локально и реализуя сквозную обработку речи, что минимизирует потерю информации в традиционных конвейерах и делает её идеальным выбором для AI-железа (Источник: awnihannun, Liquid AI)

Liquid AI发布LFM 2.5系列端侧大模型

Рекурсивные языковые модели (RLM) вызвали исследовательский бум : Команда из Стэнфорда предложила фреймворк RLM, который экстернализирует промпты как символьные объекты и позволяет модели совершать рекурсивные вызовы инструментов, значительно повышая способность обработки сверхдлинных запросов. В сообществе обсуждают, что в будущем все LLM должны иметь символьный доступ к своим промптам. Метод уже нашел применение в таких инструментах, как Claude Code, и рассматривается как ключевой путь к решению проблемы целостности при высокой семантической нагрузке LLM (Источник: lateinteraction, _akhaliq)

Споры о Scaling Law и поворот к вычислительной мощности инференса : Индустрия переживает переход от мощностей для пре-трейнинга к мощностям для инференса и исследований. Сара Хукер отметила, что связь между мощностью обучения и производительностью меняется, и эпоха простого наращивания параметров может закончиться. Илья Суцкевер ранее также заявлял о возвращении к «эпохе исследований». Мнение сообщества: выгода от вычислений не исчезла, а переместилась в сторону обучения с подкреплением (RL) и вычислений во время тестирования (test-time compute) (Источник: sarahookr, teortaxesTex)

DatologyAI выпустила бенчмарк DatBench для оценки VLM : Исследование текущих методов оценки мультимодальных моделей (VLM) выявило проблемы с шумом: 70% образцов можно решить, не глядя на изображение, а 42% содержат ошибки в разметке. DatBench удаляет «слепые» задачи и заменяет тесты с выбором ответа на генеративный формат, снижая объем вычислений для оценки более чем в 10 раз при повышении качества сигнала для различения способностей моделей (Источник: code_star, BlackHC)

DatologyAI发布VLM评估基准DatBench

🧰 Инструменты

Глубокая интеграция Claude Code и Claude Desktop : Claude Code от Anthropic теперь интегрирован в десктопную версию, поддерживая доступ к локальным файлам и написание кода. Разработчики называют его «лучшим инструментом программирования на данный момент», способным автоматически обрабатывать сложные шейдеры OpenGL и интеграцию плагинов на разных языках. Открытый стандарт «Agent Skills» позволяет AI модульно загружать новые способности, подобно навыкам покемонов, значительно экономя контекст (Источник: c_valenzuelab, 36氪)

Claude Code

Cursor представил функцию динамического обнаружения контекста : Cursor Agent теперь поддерживает динамическое управление контекстом, интеллектуально заполняя его вместо полной загрузки, что снижает потребление токенов на 46.9% при использовании нескольких MCP-серверов. Модель «файловая система как всё» напрямую открывает AI сложные зависимости, значительно повышая эффективность агента при работе с крупными кодовыми базами (Источник: hwchase17, imjaredz)

Cursor推出动态上下文发现功能

Unsloth-MLX поддерживает дообучение моделей на Mac : Unsloth выпустила версию MLX, позволяющую пользователям Apple Silicon использовать объединенную память Mac для локального дообучения. Инструмент сохраняет API оригинала, поддерживает SFT, DPO и GRPO, а после обучения позволяет экспортировать результат в формат GGUF. Это дает разработчикам недорогую среду для локального прототипирования (Источник: karminski3, LocalLLaMA)

Unsloth-MLX

LlamaSheets: AI-обработка файлов Excel : LlamaSheets от LlamaIndex умеет парсить сложные электронные таблицы, сохраняя семантический контекст объединенных ячеек и многоуровневых заголовков, преобразуя их в структурированные Parquet-файлы. Инструмент поддерживает создание агентов для финансового анализа и разбора бюджетов, решая проблему потери иерархической структуры обычными парсерами (Источник: jerryjliu0)

LlamaSheets

AI-инструменты для помощи при СДВГ: PlanCoach и Snowball : Разработчики используют AI для решения проблемы «трудного старта» у людей с СДВГ, разбивая размытые задачи на мельчайшие шаги. PlanCoach поддерживает голосовое взаимодействие и ролевые игры, а Snowball фокусируется на пошаговой обратной связи и управлении энергией. Эти приложения демонстрируют потенциал AI в персонализированном ментальном здоровье и повышении продуктивности (Источник: 36氪)

ADHD辅助AI工具

📚 Обучение

Databricks представила архитектуру Instructed Retriever : Исследование предлагает новую архитектуру поиска, которая транслирует полные системные спецификации на каждый этап поискового конвейера. По сравнению с традиционным RAG, полнота поиска (recall) выросла на 35-50%, а качество ответов — на 70%. Этот метод позволяет малым эффективным моделям обладать системным уровнем рассуждений, что критично для корпоративных агентов (Источник: matei_zaharia, Michael Bendersky)

Instructed Retriever

OpenForecaster: открытая модель для прогнозирования : Nous Research выпустила датасет OpenForesight с 52 тысячами синтетических задач на прогнозирование и модель OpenForecaster-8B. Обученная с помощью RL в стиле GRPO, модель не только достигает передового уровня точности прогнозов, но и генерирует подробные аргументации для квантификации неопределенности, что считается шагом к «универсальному оракулу» (Источник: _rockt, aiamblichus)

OpenForecaster

FinePDFs: энциклопедия обработки PDF-данных : Исследователи опубликовали электронную книгу по созданию SOTA датасетов из PDF, охватывающую выбор OCR (например, RolmOCR), обработку старых интернет-данных и извлечение качественного обучающего корпуса. Это ценный ресурс для команд, работающих с огромными массивами документов и вертикальными моделями (Источник: BlackHC, lvwerra)

FinePDFs

💼 Бизнес

xAI завершила раунд финансирования Series E на 20 млрд долларов : AI-компания Илона Маска вновь привлекла огромные средства, значительно увеличив оценку. Капитал пойдет на обучение Grok 5, расширение суперкомпьютерного кластера Colossus и запуск инновационных продуктов для потребителей и бизнеса. Маск даже подал заявку на товарный знак «Macrohard», иронизируя над Microsoft и демонстрируя амбиции в автоматизации разработки ПО (Источник: dejavucoder, 36氪)

Mobileye покупает компанию-производителя гуманоидных роботов Mentee за 900 млн долларов : Гигант автономного вождения Mobileye объявил о поглощении Mentee Robotics (основанной его же CEO) для интеграции инфраструктуры обучения AI и физического интеллекта роботов. Это знаменует официальный выход Mobileye в сферу «физического AI», а запуск Robotaxi в США намечен на 3 квартал этого года (Источник: 36氪)

LMArena (Arena) привлекла 150 млн долларов : Известная платформа для сравнения моделей LMArena завершила раунд A с оценкой более 1.7 млрд долларов. За последние 7 месяцев её пользовательская база выросла в 25 раз, а годовая выручка превысила 30 млн долларов. Средства пойдут на расширение фреймворков мультимодальной оценки для решения проблем надежности и доверия к AI (Источник: arena, swyx)

LMArena

🌟 Сообщество

«Vibe Coding» вызвал кризис идентичности у разработчиков : С популяризацией Claude Code и Replit Agent множество непрофессионалов выполняют за часы работу, на которую раньше уходили недели, просто «описывая видение» вместо «написания логики». Сообщество разделилось: одни видят в этом освобождение продуктивности, другие впадают в экзистенциальный кризис, считая, что программирование превращается из уникального навыка в дешевую инфраструктуру (Источник: amasad, Reddit r/ClaudeAI)

Vibe Coding

Эпоха «преимущества гигантов» в AI : В соцсетях обсуждают, что конкуренция в AI сместилась от технологической революции к игре престолов. Google Gemini, ByteDance Doubao и Tencent Yuanbao быстро обходят первопроходцев благодаря системным точкам входа и огромному трафику. Независимые приложения (например, Manus) сталкиваются с давлением из-за отсутствия системных прав и поддержки цепочек поставок (Источник: 36氪)

Техника промптинга «Ralph Wiggum» набирает популярность : В сообществе завирусился метод промптинга под названием «Ralph Wiggum», заставляющий AI постоянно рефлексировать и зацикливаться в процессе рассуждения, что позволяет ему самостоятельно решать сложнейшие логические задачи. Этот режим «бесконечной работы AI» считается обладающим огромной коммерческой ценностью (Источник: Vtrivedy10, imjaredz)

Ralph Wiggum

Взрывной рост медицинских консультаций через AI : Отчет OpenAI показывает, что более 5% сообщений в ChatGPT связаны с медициной, а 25% активных пользователей консультируются по вопросам здоровья. В периоды нехватки медицинских ресурсов или закрытия больниц AI становится для многих «врачом первой линии». Это вызвало глубокие дискуссии о точности диагностики и юридической ответственности (Источник: gdb)

AI医疗

💡 Прочее

Grok в центре скандала с «раздеванием» и детскими изображениями : Модель Grok от xAI подверглась критике из-за отсутствия фильтров безопасности: выяснилось, что она может генерировать сексуализированные изображения женщин и детей без их согласия. Это вызвало внимание регуляторов по всему миру и отразило конфликт между стремлением к «абсолютной свободе слова» и этической безопасностью AI (Источник: TheRundownAI, BlackHC)

SleepFM: прогнозирование болезней по данным сна : Стэнфордский университет опубликовал в Nature Medicine исследование о базовой модели SleepFM, обученной на 585 тысячах часов записей сна. Модель способна предсказать 130 заболеваний на основе данных всего за одну ночь, демонстрируя потенциал AI в анализе биосигналов и превентивной медицине (Источник: sbmaruf)

SleepFM

LEGO представила «умные кубики» со встроенным компьютером : На CES LEGO показала самую значимую эволюцию за 50 лет: кубики со встроенными чипами и сенсорами. Приближение фигурки к определенным блокам активирует звуки и свет, позволяя физическим игрушкам «оживать» без экранов. Это пример ненавязчивого применения AI-железа в образовании и развлечениях (Источник: TheRundownAI, 36氪)

乐高智能积木