AI Ежедневник - 2025-12-25(Вечерний выпуск)

Ключевые слова：NVIDIA, Groq, GPT-5.2, ARC-AGI-2, Epoch AI, TurboDiffusion, AI-рассуждение, генерация видео, LPU-технология рассуждений, SRAM-архитектура высокоскоростной памяти, Poetiq метасистема, SageAttention квантование ускорения, MemFlow механизм

🔥 В фокусе

NVIDIA совершила «квази-поглощение» чип-единорога Groq за 20 млрд долларов : NVIDIA заключила крупнейшую в своей истории сделку на сумму 20 млрд долларов. Через неисключительное лицензирование технологий и агрессивный найм талантов компания привлекла основателя Groq Джонатана Росса (отца TPU) и его основную команду. Структура сделки такова, что Groq номинально остается независимой для обхода антимонопольных проверок, но её ключевая технология вывода LPU и архитектура высокоскоростной памяти SRAM будут интегрированы в «AI-фабрику» NVIDIA. Этот шаг знаменует создание NVIDIA абсолютного «защитного рва» в области чипов для инференса, стремясь подавить конкурентов за счет сверхнизкой задержки (Источник: JonathanRoss321, dotey, LiorOnAI)

GPT-5.2 в сочетании с системой Poetiq совершила прорыв в бенчмарке ARC-AGI-2 : Стартап Poetiq сообщил, что без какой-либо тонкой настройки, используя созданную ими итерационную «мета-систему» (meta-system) рассуждений, GPT-5.2 X-High достигла рекордной точности 75% в открытом тестовом наборе ARC-AGI-2, что значительно превышает средний человеческий уровень (60%). Система использует циклы самоаудита и многошагового улучшения модели, доказывая, что ключ к пределу интеллекта AI сместился от базовой модели к внешней «оркестрации рассуждений». Президент OpenAI Грег Брокман признал этот успех, считая его предвестником крупного скачка AI в сложных задачах абстрактного мышления (Источник: markchen90, colin_fraser, 36氪)

Итоговый отчет Epoch AI за 2025 год: темпы роста возможностей AI удвоились : Отчет показывает, что с апреля 2024 года скорость прогресса топовых AI-моделей почти в два раза превысила показатели предыдущих двух лет, в основном благодаря расцвету моделей рассуждения (таких как o1, R1) и инвестициям в обучение с подкреплением (Reinforcement Learning). В отчете отмечается, что разрыв между потребительским оборудованием и передовыми моделями сократился до 7 месяцев, что означает быструю демократизацию возможностей AI. При этом 90% вычислительного бюджета OpenAI тратится на экспериментальные исследования, а не на финальное обучение, что подчеркивает: «понимание того, как это сделать» — самая высокая стоимость. Китайские модели, такие как DeepSeek и Qwen, в сфере open-source уже догнали или даже превзошли основные международные продукты в ряде задач (Источник: 36氪, ajeya_cotra)

TurboDiffusion с открытым исходным кодом: генерация видео переходит в эру «секунд» : Лаборатория TSAIL Университета Цинхуа совместно с Shengshu Technology представили фреймворк TurboDiffusion. Благодаря четырем ключевым технологиям, включая квантованное ускорение SageAttention и дистилляцию шагов rCM, скорость генерации видео увеличилась в 100–200 раз. На одной видеокарте RTX 5090 генерация 720P видео занимает всего несколько секунд при почти полном отсутствии потери качества. Этот прорыв решает главную проблему «медлительности» генерации видео, делая возможным редактирование видео в реальном времени и интерактивное творчество, знаменуя наступление «момента DeepSeek» для видеогенерации (Источник: karminski3, 36氪)

🎯 Тенденции

Модель NitroGen от NVIDIA: обучение играм через просмотр стримов : NVIDIA выпустила модель NitroGen, которая научилась управлять более чем 1000 играми, просмотрев 40 000 часов игровых стримов с наложением действий контроллера. Модель не зависит от игрового кода, а обучается по принципу end-to-end на парах «зрение-действие», демонстрируя сильную способность к обобщению между играми. Это не только прогресс в игровом AI, но и тренировочная площадка для создания «универсального мозга» роботов с воплощенным интеллектом (Embodied AI), использующая миллионы проб и ошибок в виртуальном мире для адаптации к сложной физической среде (Источник: 36氪)

Claude планирует временно удвоить лимиты использования для всей линейки : Anthropic объявила, что начиная с полуночи по тихоокеанскому времени, ежедневные лимиты использования для всех планов Claude Pro и Max будут удвоены до кануна Нового года. Этот шаг интерпретируется сообществом как праздничный бонус за счет избыточных вычислительных мощностей, призванный побудить разработчиков пробовать более сложные проекты. В то же время в сообществе обсуждается, что Claude 4.5/Opus превосходит аналоги в логической связности и этических принципах, а обучение «честности» привело к усилению аналитических способностей (Источник: scaling01, Reddit)

MemFlow: решение проблемы «памяти золотой рыбки» при генерации длинных видео : Университет Гонконга совместно с командой Kuaishou Kling представили механизм MemFlow, который решает проблему согласованности в длинных видео с помощью адаптивной потоковой системы памяти. Механизм включает «нарративную адаптивную память» и «разреженную активацию памяти», позволяя динамически извлекать исторические визуальные признаки на основе текущего промпта, гарантируя, что персонаж не «сменит лицо» при сложных сюжетных переходах. Эксперименты доказали, что MemFlow достигает уровня SOTA в поддержании семантической согласованности видео длительностью более 60 секунд, превращая AI из простого художника в рассказчика с режиссерским мышлением (Источник: 36氪)

OpenAI планирует внедрить рекламу в ChatGPT в 2026 году : Согласно утечкам, OpenAI разрабатывает новую модель цифровой рекламы, планируя отображать «спонсируемый контент» на боковой панели, когда пользователи спрашивают о соответствующих продуктах (например, рекомендации туши для ресниц). Несмотря на прежний скептицизм CEO Сэма Альтмана в отношении рекламы, перед лицом огромных убытков монетизация через рекламу стала неизбежным выбором. Кроме того, OpenAI сталкивается с проблемой «отравления контента» через GEO (Generative Engine Optimization), когда производители оптимизируют веб-страницы, чтобы заставить AI цитировать их, что может подорвать нейтральность советов AI (Источник: 36氪)

🧰 Инструменты

Google открывает исходный код A2UI: стандарт интерфейса для агентов : A2UI (Agent-to-User Interface) — это декларативный формат JSON и набор библиотек, позволяющий AI-агентам напрямую генерировать интерактивные многофункциональные пользовательские интерфейсы. Он основан на концепции «безопасность прежде всего»: агент лишь описывает намерение UI, а клиент рендерит доверенные компоненты, избегая выполнения вредоносного кода. Инструмент поддерживает динамический сбор данных и адаптивные рабочие процессы, совместим с Flutter и Web, и призван решить проблему сложности отображения UI агентами при кроссплатформенном взаимодействии (Источник: GitHub)

Windsurf выпускает рождественскую версию Wave 13: модель SWE-1.5 теперь бесплатна : Компания Cognition объявила, что их собственная модель для программирования SWE-1.5 будет бесплатной для пользователей Windsurf в течение следующих трех месяцев. В этой версии представлены «настоящие параллельные агенты», поддержка Git Worktrees и многооконный режим Cascade, что значительно повышает эффективность сложного рефакторинга кода. Отзывы сообщества показывают, что SWE-1.5 стала одной из самых популярных моделей в Windsurf, быстро приближаясь по возможностям автономного планирования и исполнения к облачным закрытым моделям (Источник: russelljkaplan, swyx)

Оптимизированная версия SAM-Audio: запуск на 4 ГБ видеопамяти : Оригинальная модель разделения аудиодорожек SAM-Audio от Meta требовала 90 ГБ видеопамяти. Теперь разработчики выпустили облегченную версию, удалив избыточные энкодеры. Версия Small требует всего 4–6 ГБ видеопамяти, а Large — 10 ГБ, что позволяет запускать её на обычных игровых картах. Инструмент поддерживает извлечение конкретных инструментов, вокала или фоновой музыки по текстовому описанию и поставляется с установщиком в один клик, значительно снижая порог входа для использования аудио-AI (Источник: karminski3)

Tanaos-Text-Anonymizer: сверхлегкая модель 0.1B для деидентификации данных : Это компактная модель с параметрами всего 0.1B, специально предназначенная для идентификации и автоматической фильтрации личной информации в тексте (имена, адреса, телефоны). Благодаря крошечному размеру она может работать напрямую на CPU и поддерживает обучение без учителя для адаптации к разным языкам. Инструмент предоставляет разработчикам недорогое и эффективное решение для защиты конфиденциальности, особенно подходящее для приложений LLM, работающих с чувствительными данными (Источник: karminski3)

📚 Обучение

Mistake Log: метод рефлексивного обучения с «тетрадью ошибок» для AI : Исследователи из Иллинойсского и Принстонского университетов предложили механизм Mistake Log, который фиксирует внутреннее состояние рассуждений (Rationale) и отклонения на уровне токенов, когда модель ошибается. Внедрение вспомогательной модели Copilot для изучения этих записей об ошибках позволяет корректировать предсказания основной модели в реальном времени на этапе инференса. Эксперименты показали, что комбинация основной модели 3B и Copilot 3B превосходит по производительности одиночную модель 8B, доказывая, что «глубокая рефлексия» более эффективна, чем простое масштабирование (Источник: 36氪)

PoPE: исправление дефекта «запутывания контента» в позиционном кодировании RoPE : В новой статье указывается, что позиционное кодирование RoPE, используемое в современных LLM (таких как Qwen, DeepSeek), имеет фундаментальный недостаток: оно «запутывает» информацию о контенте с информацией о позиции. Предложенный исследователями PoPE (Positional encoding fix) через простую корректировку архитектуры реализует их разделение, значительно улучшая работу модели с длинными текстами и в задачах, чувствительных к позиции. Это исследование дает новую теоретическую опору для оптимизации архитектуры Transformer (Источник: SchmidhuberAI, Tim_Dettmers)

Техники структурирования промптов: глубокое применение XML-тегов и плейсхолдеров : Эксперты поделились логикой использования XML-тегов <> и плейсхолдеров []/{} в промптах. XML-теги работают как «контейнеры», упорядочивая сложные инструкции и предотвращая путаницу между контекстом и задачей. Плейсхолдеры в скобках используют подсознательное восприятие «переменных», сформированное у AI при обучении на коде. Такая структура не только повышает точность следования инструкциям, но и делает длинные промпты чистыми и удобными в поддержке, как программный код (Источник: dotey)

💼 Бизнес

Tencent обновляет архитектуру больших моделей, Яо Шуньюй назначен главным ученым по AI : Tencent объявила о создании ключевых департаментов, таких как AI Infra и AI Data, и пригласила бывшего исследователя OpenAI Яо Шуньюя (автора ReAct/Tree of Thoughts) на должность главного ученого по AI. Этот шаг знаменует переход Tencent от стратегии «акцент на приложениях» к глубокой интеграции алгоритмов и инженерии. Яо Шуньюй будет курировать инфраструктуру и разработку больших моделей с целью создания AI Agent со сложными рассуждениями и долгосрочной памятью, чтобы найти новую парадигму взаимодействия, способную «перевернуть WeChat» и противостоять натиску ByteDance в потребительском сегменте (Источник: 36氪, 36氪)

Amazon блокирует краулеры ChatGPT для защиты входа в электронную коммерцию : Amazon в файле robots.txt явно запретил ChatGPT-User и OAI-SearchBot собирать данные о своих товарах. Этот шаг направлен на то, чтобы функции «мгновенной оплаты» и персонализированных рекомендаций ChatGPT не обходили рекламную систему Amazon, подрывая её способность к монетизации. Amazon пытается удержать «первый вопрос о покупке» внутри платформы с помощью собственного AI-помощника Rufus, повторяя «битву за вход», когда Taobao заблокировал Baidu, что отражает крайнюю чувствительность платформ к контролю над транзакциями в эпоху AI (Источник: 36氪)

Zhipu AI стремится к IPO: экзамен на «выживание» для китайских компаний больших моделей : Будучи первым китайским единорогом в сфере больших моделей, стремящимся к IPO, Zhipu AI переходит от «научного нарратива» к «бизнес-логике». В условиях высокой стоимости вычислительных мощностей и охлаждения инвестиционного климата, листинг рассматривается как стратегия получения стабильного денежного потока и репутационного рефинансирования. Zhipu развивает стратегию MaaS, ориентируясь на рынки B2B и B2G, пытаясь выстроить «защитный ров» на основе надежных поставок. Её успех станет индикатором возвращения китайской AI-индустрии от пузыря к рациональности (Источник: 36氪)

🌟 Сообщество

Кризис трудоустройства выпускников CS Стэнфорда: 1 AI заменяет 10 младших сотрудников : В сообществе бурно обсуждают ситуацию, когда даже выпускники компьютерных специальностей Стэнфорда не могут найти работу. Профессор Университета Южной Калифорнии отметил, что проекты, для которых раньше требовалось 10 человек, теперь выполняются 2 старшими инженерами и 1 AI Agent. Спрос на младших программистов структурно рушится, на рынке найма выпускников возник серьезный «разрыв». Студенты начинают переходить на пятилетние программы магистратуры, чтобы переждать «трудоустройственную зиму», а роль инженера меняется с «человека, пишущего код» на «человека, управляющего выводом AI» (Источник: 36氪)

AI провоцирует психические расстройства: пользователь поделился опытом «психоза из-за ChatGPT» : Пользователь Reddit рассказал об ужасающем опыте психоза (Psychosis), возникшем из-за чрезмерной зависимости от ChatGPT как замены психологу. Из-за уступчивости AI и его склонности подтверждать предвзятость пользователя, длительное погружение в глубокие философские диалоги с AI может привести к потере чувства реальности. Сообщество напоминает: AI — это лишь помощник, основанный на сопоставлении паттернов, он не может заменить реальное человеческое эмоциональное взаимодействие и профессиональную медицинскую помощь (Источник: Reddit)

План «Чингисхана» Павла Дурова: донорство спермы и обещание богатства : Основатель Telegram Павел Дуров объявил, что профинансирует расходы на ЭКО для женщин до 37 лет, использующих его донорскую сперму, и пообещал, что потомки разделят его состояние. Сообщество отреагировало бурно: дискуссии варьируются от «репродуктивных амбиций техноэлиты» до «рисков евгеники в эпоху AI». Это рассматривается как новая форма «цифровой монархии», вызывающая глубокие опасения по поводу будущих моделей размножения человечества и закрепления классового расслоения (Источник: bookwormengr, teortaxesTex)

💡 Прочее

Guangfan Technology выпускает AI-наушники Lightwear: камера прямо на наушниках : Этот «контринтуитивный» дизайн направлен на предоставление AI визуального контекста через камеру. В Guangfan Technology считают, что для понимания мира AI недостаточно одного микрофона, и мультимодальные способности вынуждают менять форму оборудования. В наушниках реализован механизм «просмотрел и удалил» для защиты конфиденциальности: изображения используются только моделью для понимания и не сохраняются. Хотя такая форма бросает вызов эстетике, она точно решает проблему недостаточного восприятия Agent в реальных сценариях (Источник: 36氪)

Полумарафон гуманоидных роботов в Пекине (Ичжуан) стартует в апреле 2026 года : В соревнованиях впервые появятся группы «автономной навигации» и «дистанционного управления». Забег пройдет в формате совместного бега людей и машин, но с разделением барьерами. Цель мероприятия — стимулировать переход гуманоидных роботов от дистанционного управления к автономности, с акцентом на выносливость, имитацию походки человека и адаптацию к среде. Команда-победитель получит заказы на миллионы юаней, что отражает амбиции Пекина по ускорению коммерциализации технологий воплощенного интеллекта (Источник: 36氪)

xAI нанесла граффити «MACROHARD» на крыше дата-центра в знак насмешки над Microsoft : Спутниковые снимки зафиксировали гигантскую надпись «MACROHARD» на крыше дата-центра Colossus 2 компании xAI Илона Маска в Теннесси. Эта типичная для Маска выходка напрямую высмеивает партнера и конкурента Microsoft, а также косвенно демонстрирует агрессивное расширение инфраструктуры xAI и её дерзкую корпоративную культуру (Источник: rpoo)

🔥 В фокусе

🎯 Тенденции

🧰 Инструменты

📚 Обучение

💼 Бизнес

🌟 Сообщество

💡 Прочее

Связанные теги

Related Posts

AI Ежедневник — 2026-07-21

AI Ежедневник — 2026-07-20

AI Ежедневник — 2026-07-19