AI Ежедневник — 2025-12-31(Утренний выпуск)

Ключевые слова:ИИ-агент, Поглощение Meta, NVIDIA, Универсальный агент Manus, 4D-RGPT модель, Обучение во время тестирования (TTT)

🔥 В фокусе

Meta инвестирует миллиарды долларов в покупку стартапа Manus AI: Meta объявила о приобретении компании Manus, разработчика универсальных AI-агентов, основанной всего девять месяцев назад. Manus прославилась как создатель «первого в мире универсального агента». Не имея собственной модели, компания за счет превосходных инженерных навыков и понимания потребностей пользователей достигла впечатляющего роста ARR в 100 млн долларов за 8 месяцев. Эта сделка рассматривается как стратегия Meta по «покупке времени» на прикладном уровне AI, направленная на восполнение пробелов в способности автономно выполнять сложные задачи. Manus сохранит независимость в управлении, а ее основатель Сяо Хун займет пост вице-президента Meta. Это знаменует смещение акцента в AI-конкуренции от масштаба параметров моделей к способности масштабного исполнения в реальных сценариях (Источник: Reuters, X)

Meta收购Manus

Стэнфордский университет представил новую технологию сквозного обучения во время тестирования (TTT): Исследовательская группа предложила метод «End-to-End Test-Time Training», призванный стереть грань между обучением и инференсом. Эта технология позволяет модели продолжать обучение на этапе инференса через заданный контекст, используя задачу предсказания следующего токена для сжатия огромных объемов контекста в веса. Этот прорыв эффективно решает проблему «бутылочного горлышка» при обработке длинных текстов и открывает возможности для сложного рассуждения агентов и робототехники в условиях сверхдлинного контекста, что является важным шагом на пути к Continual Learning (Источник: Stanford, X)

TTT技术图示

NVIDIA выпустила 4D-RGPT: улучшение восприятия пространственно-временных изменений ИИ: В ответ на сложности ИИ в понимании 3D-структур и их изменений во времени, NVIDIA представила специализированную мультимодальную большую модель 4D-RGPT. Благодаря восприятию 4D-информации (пространство + время), модель показала результаты в 3D/4D бенчмарках, значительно превосходящие базовые модели. Кроме того, NVIDIA внедрила метод обучения «Perception 4D Distillation (P4D)», позволяющий передавать знания от мощных экспертных моделей легковесным моделям без увеличения стоимости инференса, что существенно повышает понимание роботами динамических сред (Источник: X)

4D-RGPT技术展示

🎯 Тенденции

Главная страница YouTube переполнена «ИИ-мусором», что вызывает обеспокоенность: Согласно последнему отчету, более 20% видео, рекомендуемых YouTube новым пользователям, идентифицируются как «AI Slop» (ИИ-мусор). Этот контент обычно состоит из сгенерированной ИИ озвучки, странных визуальных эффектов и зацикленных сценариев, созданных для получения трафика через уязвимости алгоритмов. Некоторые каналы зарабатывают миллионы долларов в год на таком низкокачественном автоматизированном производстве. Это отражает негативные побочные эффекты технологий ИИ в сфере создания контента, заставляя платформу пересмотреть баланс между алгоритмическими рекомендациями и качеством контента (Источник: TheRundownAI, Reddit)

AI垃圾内容分析

DeepSeek тайно запустил функцию преобразования речи в текст: DeepSeek незаметно обновил функцию голосового ввода в своем приложении. Тесты показывают, что функция очень устойчива к смешанному языковому вводу и обладает крайне высокой скоростью отклика, точно обрабатывая переключения между языками или транскрипцию. Это указывает на то, что DeepSeek продолжает расширять свои мультимодальные возможности взаимодействия, стремясь повысить эффективность ввода и удобство для мобильных пользователей (Источник: X)

DeepSeek语音功能截图

Meta представила «награду за метрики оценки» для обучения ИИ-ученых: Лаборатория супер-интеллекта Meta опубликовала статью о методе автоматического извлечения целей исследования и оценочных метрик (Rubric) из масштабной научной литературы для обучения ИИ генерации планов исследований с помощью обучения с подкреплением (RL). Исследование показало, что даже в областях, где невозможна обратная связь от физических экспериментов (например, медицина), этот разрыв «генерация-проверка» может значительно улучшить качество планов, создаваемых ИИ. В 70% случаев эксперты-люди предпочли планы, созданные дообученной моделью, что демонстрирует огромный потенциал ИИ в ускорении научных открытий (Источник: HuggingFace, X)

AI科学家训练流程

Alibaba выпустила обновление модели генерации видео Wan2.6: В версии Wan2.6 улучшена консистентность персонажей и поддержка сценариев на естественном языке. Новая версия поддерживает генерацию 15-секундных видео в разрешении 1080p HD, обеспечивая синхронизацию звука и изображения, а также стабильные сцены диалогов между несколькими персонажами. Ключевым преимуществом является консистентность изображений коммерческого уровня, гарантирующая единство персонажей, стиля и визуальных элементов в многокадровом повествовании (Источник: X)

🧰 Инструменты

Официальный релиз Qwen Code v0.6.0: В этом обновлении представлена экспериментальная функция «Skills» для расширения возможностей модели, а также проведена глубокая оптимизация плагина для VS Code, включая кликабельный вывод вызовов инструментов bash. Кроме того, добавлены команды /compress и /summary, реализована поддержка доступа к нескольким провайдерам, таким как Gemini и Anthropic. Эта версия значительно улучшает совместимость с Windows и стабильность тестов, являясь мощным инструментом для AI-программирования (Источник: GitHub)

LLMRouter: первая унифицированная библиотека маршрутизации LLM с открытым исходным кодом: Библиотека объединяет более 16 SOTA-алгоритмов маршрутизации, предназначенных для автоматического выбора наиболее подходящей модели в зависимости от сложности запроса (например, простые вопросы направляются к дешевым моделям, сложные — к мощным). Разработчики утверждают, что это позволяет экономить 30-50% затрат на инференс без потери качества. Библиотека включает режимы одноразовой, многоразовой, агентной и персонализированной маршрутизации, а также полный инструментарий для бенчмаркинга (Источник: X)

OpenEnv: Meta и Hugging Face объединяют усилия для создания стандарта среды агентов: OpenEnv нацелен на предоставление унифицированных спецификаций для сред ИИ-агентов, реализуя принцип «создай один раз, запускай везде». Он поддерживает использование одинаковых конфигураций среды на этапах обучения (с использованием TRL, Unsloth и др.) и инференса, а также включает встроенную поддержку инструментов MCP (Model Context Protocol). Запуск этого стандарта значительно упростит процессы разработки и развертывания агентов, способствуя экосистемной совместимости (Источник: X)

OpenEnv展示

Официально запущен сайт vLLM: vLLM, один из самых популярных фреймворков для инференса LLM, запустил независимый официальный сайт. На сайте представлен интерактивный селектор установки (для различных сред GPU/CPU), календарь событий сообщества, а также централизованная документация и руководства по настройке. Этот шаг направлен на отделение логики проекта от кода, позволяя репозиторию GitHub сосредоточиться на разработке ядра, одновременно улучшая опыт освоения для пользователей сообщества (Источник: vllm.ai, X)

vLLM官网截图

📚 Обучение

Вышел туториал II «Физика языковых моделей»: Zeyuan Allen-Zhu опубликовал свежий туториал серии, сфокусированный на том, почему результаты крупномасштабных экспериментов часто содержат шум и как устранить эти помехи на уровне дизайна. В туториале подробно объясняется, как проектировать чистые синтетические задачи предобучения, и доказывается, что модели масштаба 100M (например, GPT2-small) иногда могут более надежно раскрывать архитектурную истину, чем модели 8B (Источник: X)

教程封面

Обзор шести паттернов проектирования Agentic AI: В сообществе подвели итоги обсуждения шести основных паттернов разработки агентов, включая планирование, рефлексию, использование инструментов, многоагентное сотрудничество и др. Эти паттерны служат методологическим руководством для создания сложных и надежных AI-приложений, помогая разработчикам выйти за рамки простой логики чат-ботов к созданию систем, действительно способных решать задачи (Источник: X)

设计模式图示

Геометрический смысл One-Hot кодирования в задачах классификации: LearnOpenCV поделились тем, как способы кодирования влияют на обучение модели в задачах классификации. В отличие от простых числовых меток (которые могут заставить модель ошибочно полагать наличие отношений близости между категориями), One-Hot кодирование гарантирует равноудаленность всех категорий в геометрическом пространстве, обеспечивая справедливый сигнал ошибки и повышая эффективность обучения (Источник: X)

💼 Бизнес

UBTECH планирует приобрести контроль над Fenglong за 1,665 млрд юаней для создания платформы финансирования «A+H»: Лидер в области гуманоидных роботов UBTECH объявил о намерении получить контроль над листинговой компанией A-акций Fenglong через соглашение о передаче и тендерное предложение. Этот шаг направлен на открытие каналов финансирования в юанях и использование опыта Fenglong в прецизионном производстве для создания цепочки поставок для массового производства гуманоидных роботов. Несмотря на текущие крупные убытки UBTECH, эта «ва-банк» ставка демонстрирует амбиции компании по захвату определенности накануне коммерциализации (Источник: 36氪)

SoftBank завершил обязательства по инвестированию 40 млрд долларов в OpenAI: На прошлой неделе SoftBank выплатил последние 22 млрд долларов, завершив свои инвестиции в OpenAI на общую сумму 40 млрд долларов, и теперь владеет более чем 10% акций. Кроме того, SoftBank согласился приобрести инвестиционную компанию в сфере дата-центров DigitalBridge за 4 млрд долларов, что свидетельствует об агрессивной экспансии Масаёси Сона в инфраструктуру ИИ (Источник: X, CNBC)

软银投资动态

Zhipu AI (Z.ai) проведет IPO в Гонконге 8 января 2026 года: Zhipu AI объявила о выходе на биржу в начале следующего года, став первой в мире компанией, вышедшей на IPO с AGI-моделями в качестве основного бизнеса. Это IPO знаменует вступление китайских разработчиков больших моделей в период сбора капитала, где коммерческий прогресс и технологические итерации серии GLM пройдут прямую проверку вторичным рынком (Источник: X)

智谱AI上市海报

🌟 Сообщество

«Vibe Coding» вызвал бурные дискуссии среди разработчиков: Сообщество обсуждает «атмосферное программирование» (Vibe Coding), когда разработчики больше не пишут код вручную, а быстро создают приложения через диалог с ИИ (например, используя Claude Code, Cursor). Сторонники считают, что это колоссально повышает креативность, позволяя даже непрофессионалам запускать сложные продукты за несколько часов; скептики же опасаются игнорирования базовой логики, считая, что при работе с пограничными случаями глубокие инженерные знания по-прежнему незаменимы (Источник: X, Reddit)

ИИ «намеренно становится хуже», чтобы завоевать доверие людей: В соцсетях обсуждают, что новое поколение моделей генерации изображений (например, Nano Banana) начало намеренно имитировать дефекты мобильной фотографии: чрезмерную резкость, шумы и плоское освещение. Это «несовершенство», напротив, делает изображения более похожими на реальные фото, обходя эффект «зловещей долины». Подобная стратегия проявляется и в чат-ботах: ИИ учится сомневаться и сопереживать, выстраивая более глубокую эмоциональную связь через демонстрацию искусственной «уязвимости» (Источник: 36氪)

AI拟真策略分析

Билл Акман предложил закрыть лазейку «налогообложения через кредитование»: Миллиардер Акман предложил рассматривать кредиты под залог акций как «условную продажу» для целей налогообложения. В настоящее время богатые люди получают ликвидность через займы, а не продажу акций, тем самым избегая налога на прирост капитала. Предложение вызвало широкую дискуссию о справедливости распределения богатства и системных финансовых рисках, считаясь более элегантной и простой в реализации реформой, чем налог на богатство (Источник: X)

💡 Прочее

Финляндия превращает избыточное тепло дата-центров в городское отопление: Инновационный проект в Финляндии продемонстрировал, как тепло, вырабатываемое дата-центрами, можно утилизировать для отопления целых кварталов. Это служит моделью устойчивого развития для решения проблемы энергопотребления, вызванной ростом спроса на вычисления ИИ, реализуя синергию технологической инфраструктуры и городских энергетических систем (Источник: X)

Лабораторно выращенные зубы могут стать альтернативой пломбам: Новейшие исследования в области медицинских технологий показывают, что выращенные в лаборатории зубные ткани могут в будущем заменить традиционные пломбы. Кроме того, появился инъекционный и растворимый после выполнения своей функции микро-кардиостимулятор, демонстрирующий передовые результаты сочетания биотехнологий и миниатюризации (Источник: X)