Ключевые слова:большая языковая модель, AI-единорог, OpenAI, NVIDIA, Meta, AI-вывод, вычислительная мощность ИИ, AI-музыка, модель GLM-4.7, GPT-5.2-Codex-XMas, архитектура Groq LPU, Self-play SWE-RL, серия Nemotron 3
🔥 В фокусе
Zhipu и MiniMax соревнуются за звание «первой в мире публичной компании в сфере LLM» : Пекинская Zhipu AI и MiniMax (Xiyu Technology) последовательно прошли слушания на Гонконгской фондовой бирже и раскрыли свои проспекты эмиссии (prospectus), что ознаменовало начало процесса капитализации китайских AI-единорогов. Выручка Zhipu в 2024 году достигла 312 млн юаней при темпе роста CAGR более 130%, однако из-за резкого роста затрат на вычислительные мощности убытки в первой половине 2025 года составили 2,358 млрд юаней. В то же время Zhipu выпустила open-source модель GLM-4.7, которая заняла первое место среди открытых моделей в Code Arena, обойдя GPT-5.2 и продемонстрировав мощные возможности итерации технологий. Это IPO является не только инструментом привлечения финансирования, но и «эталонным» событием для рыночной оценки стоимости компаний, специализирующихся исключительно на больших моделях (Источник: 36氪, 市值水晶)

OpenAI выпустила рождественскую версию Codex, углубляя «агентное программирование» : В период Рождества OpenAI запустила GPT-5.2-Codex-XMas. Модель получила персональное обновление при сохранении производительности GPT-5.2, а подписчики получили удвоенные лимиты использования. Это обновление — не просто праздничный маркетинг, оно отражает стратегический сдвиг OpenAI в позиционировании Codex как «инженерного агента» (Engineering Agent): усилено понимание длинного контекста, обработка задач между файлами и оптимизация нативной цепочки инструментов Windows. Разработчики отмечают, что степень завершенности сложных проектов у этой модели уже выше, чем у большинства конкурентов, что предвещает переход от эпохи «AI пишет код» к «AI управляет инженерией» в 2026 году (Источник: 新智元, op7418)

Axiom Math: определение нового стандарта «приемки» для AI-рассуждений : Компания Axiom Math, основанная 24-летней выпускницей Стэнфорда Кариной Хонг (Carina Hong), привлекла 64 млн долларов при оценке в 300 млн долларов. Компания занимается разработкой «AI-математика», способного автономно проверять логическую правильность. Ключевой прорыв заключается во внедрении языка программирования Lean, что позволяет каждому шагу рассуждений AI иметь формальное доказательство, решая проблему доверия к результатам больших моделей. В математическом конкурсе Putnam система автономно решила 9 сложных задач, и все они прошли верификацию. Этот прогресс означает, что AI переходит от расплывчатой «генерации ответов» к строгой «логической самопроверке», становясь надежным партнером в науке и промышленности (Источник: AI 深度研究员)
NVIDIA и Groq заключили соглашение о лицензировании технологий для борьбы с дефицитом памяти : На фоне резкого роста цен на память HBM и нехватки производственных мощностей NVIDIA заключила неисключительное лицензионное соглашение с Groq. Основатель и основная команда Groq присоединятся к NVIDIA для помощи в интеграции технологий инференса. Архитектура LPU от Groq использует SRAM в качестве основной памяти, пропускная способность которой в несколько раз выше, чем у традиционной HBM, что значительно смягчает узкие места доступа к памяти при инференсе. Этот шаг рассматривается как открытие NVIDIA «второго фронта» в условиях дефицита памяти, направленного на поиск новых технологических путей, хеджирование рисков в цепочке поставок DRAM и укрепление доминирования на рынке AI-инференса (Источник: 机器之心, op7418)

🎯 Тренды
Meta представила Self-play SWE-RL для самоэволюции Agent : Исследовательская группа Meta опубликовала фреймворк SSR, позволяющий агентам программной инженерии обучаться самостоятельно через механизм самоигры (self-play) «внедрение бага» и «исправление бага» без участия человека. Методу требуется только доступ к песочнице с исходным кодом; агент в замкнутом цикле саморазвития генерирует высококачественные задачи и автономно их решает. Эксперименты доказали, что производительность SSR постоянно растет в процессе обучения и превосходит базовые методы обучения с подкреплением (RL). Это знаменует переход AI Agent к «суперинтеллекту», способному превзойти человеческие возможности в понимании систем и автономном создании ПО (Источник: 学术头条)

Liquid AI выпустила мощнейшую модель 3B с выдающимися результатами RL : Liquid AI представила экспериментальную модель LFM2-2.6B-Exp, созданную исключительно с помощью обучения с подкреплением (RL). Она показала отличные результаты в тестах на следование инструкциям, знания и математику. Ее показатель IFBench даже превзошел DeepSeek R1, которая в 263 раза больше по размеру. Отзывы сообщества показывают, что модель обладает «знаниями уровня доктора наук» и плавно работает на оконечных устройствах, таких как iPhone. Этот прогресс снова доказывает, что благодаря эффективному дизайну алгоритмов и оптимизации RL модели с малым количеством параметров могут демонстрировать производительность, сопоставимую с топовыми моделями в специфических областях (Источник: maximelabonne, huggingface)

Утечка кода Android-версии ChatGPT раскрыла планы по внедрению рекламы : Разработчики обнаружили в коде бета-версии ChatGPT для Android строки, связанные с рекламой, такие как «ads feature» и «search ad». Хотя Сэм Альтман ранее заявлял, что реклама — это «крайняя мера», на фоне финансового давления (расходы в первой половине 2025 года составили 2,5 млрд долларов) OpenAI, очевидно, начала подготовку к монетизации бесплатных пользователей. Планируемые форматы рекламы могут включать спонсорские сообщения в боковой панели или «диалоговые рекомендации», направленные на монетизацию намерений без прерывания естественного диалога. Это предвещает конец эпохи «абсолютной чистоты» AI-поиска (Источник: 直面AI)
NVIDIA выпустила серию Nemotron 3 с упором на длинный контекст и возможности Agent : NVIDIA представила семейство Nemotron 3 (Nano, Super, Ultra), использующее гибридную архитектуру Mamba-Transformer и технологию Mixture-of-Experts (MoE). Серия поддерживает длину контекста до 1M и прошла пост-тренировочную оптимизацию для рассуждений Agent и многошагового вызова инструментов. Версия Nano лидирует по точности среди малых моделей при крайне низких затратах на инференс, в то время как Ultra нацелена на производительность уровня SOTA. NVIDIA пообещала открыть веса моделей, программное обеспечение для обучения и рецепты, обогащая open-source экосистему (Источник: Reddit)
SAM 3: эволюция от клика по пикселям к «именованию концепций» : Meta выпустила SAM 3 (Segment Anything with Concepts), обновив технологию сегментации видео с режима «кликни и выбери» до «распознавания концепций». Пользователю достаточно ввести «человек в очках», и модель автоматически локализует все подходящие объекты на изображении или видео. Благодаря автоматизированному обучению на 4 миллионах уникальных концепций точность SAM 3 в сложном видео-бенчмарке MOSEv2 выросла с 47,9% до 60,3%. Этот прорыв значительно усилил семантическое понимание визуального мира искусственным интеллектом, решив проблемы перекрытия и согласованности при сегментации видео (Источник: ylecun)

🧰 Инструменты
GAIT и GaitHub: система контроля версий «Git» для AI-рассуждений : Для решения проблем непрослеживаемости и невоспроизводимости решений AI разработчики представили GAIT. Система рассматривает взаимодействие с AI как контентно-адресуемые объекты, охватывающие намерения пользователя, ответы модели, ветви рассуждений и состояния памяти. С помощью GAIT разработчики могут управлять процессом рассуждений AI так же, как кодом: контролировать версии, проводить эксперименты с ветвлением и объединять решения. Сопутствующая облачная платформа GaitHub поддерживает совместную работу и аудит, предоставляя необходимую инженерную инфраструктуру для корпоративных рабочих процессов AI и решая проблему «черного ящика» (Источник: Reddit)

DeepFabric: фреймворк для тонкой настройки вызова инструментов для специфических MCP-сервисов : DeepFabric — это open-source инструмент, позволяющий разработчикам автоматически генерировать наборы данных для рассуждений в конкретных областях для любого MCP-сервера или набора инструментов. Выполняя реальные траектории инструментов в изолированной среде WebAssembly, фреймворк может настраивать малые модели, такие как Qwen3-4B, позволяя им превосходить Claude 4.5 и Gemini 2.5 в специфических задачах (например, управление Blender). Это открывает четкий путь к созданию высокопроизводительных и недорогих специализированных Agent для вертикальных рынков (Источник: Reddit)
Quint: прощай CLI, интерактивный UI для чат-ботов : Quint — это библиотека React, призванная перевести взаимодействие на базе LLM от чистого текста к структурированному и детерминированному UI. Она позволяет разработчикам определять явные опции, клик по которым вызывает отображение конкретной информации или структурированный ввод. Основная концепция заключается в разделении приема модели, визуального восприятия пользователя и рендеринга вывода, что делает взаимодействие в таких сценариях, как MCQs или ролевые игры с ветвлением, более контролируемым. Quint не зависит от конкретного поставщика AI, предвещая будущее, где LLM будут напрямую рендерить динамические компоненты UI (Источник: Reddit)

📚 Обучение
Hugging Face выпускает серию бесплатных курсов по AI : В праздничный период Hugging Face представила матрицу бесплатных курсов, охватывающих новейшие технологии AI. Содержание включает: курс Robotics по созданию роботов с помощью LeRobot, курс MCP по изучению протокола контекста моделей, курс Agents по созданию и развертыванию агентов, а также глубокие технические руководства по LLM, глубокому обучению с подкреплением, диффузионным моделям и др. Эти курсы опираются на экосистему библиотек HF и призваны помочь разработчикам быстро освоить практические навыки от базовых моделей до передовых архитектур Agent (Источник: huggingface)

WildVideo: первый бенчмарк для системной классификации галлюцинаций в видео-вопросах : Команда из Оборонного научно-технического университета и Университета Сунь Ятсена выпустила бенчмарк WildVideo, определив 9 типов задач (восприятие, когниция, понимание контекста и др.) для изучения проблемы «галлюцинаций» мультимодальных моделей при взаимодействии с видео. Эксперименты показали, что даже точность GPT-4o в многораундовых задачах составляет всего 52,7%, при этом модель хуже справляется с видео от первого лица. Этот бенчмарк предоставляет точный инструмент для диагностики дефектов моделей в динамическом восприятии, глубоких рассуждениях и последовательности длинных диалогов (Источник: 新智元)

PhononBench: новая шкала для оценки стабильности кристаллов, сгенерированных AI : PhononBench — это первый крупномасштабный бенчмарк для динамической стабильности кристаллов, созданных AI. С помощью потенциала MatterSim были проведены эффективные вычисления для более чем 100 000 структур, созданных шестью ведущими генеративными моделями. Результаты выявили общие ограничения текущих моделей: средняя стабильность составляет всего 25,83%. Эта работа не только указывает на слабые места генеративных моделей в плане физической осуществимости, но и отбирает 28 000 фонон-стабильных кристаллических структур, предоставляя надежный пул кандидатов для будущих исследований новых материалов (Источник: HuggingFace)
💼 Бизнес
«Призрачный долг» гигантов AI в 120 миллиардов долларов вызывает опасения : Технологические гиганты, такие как Meta, xAI и Oracle, выводят более 120 млрд долларов расходов на дата-центры за пределы балансовых отчетов через компании специального назначения (SPV). Хотя эта модель внебалансового финансирования защищает кредитные рейтинги компаний, она скрывает огромные финансовые риски. Если спрос на AI окажется ниже ожидаемого, огромные долги могут вызвать цепную реакцию на Уолл-стрит. Данные UBS показывают, что в этом году около 125 млрд долларов влилось в такое «проектное финансирование», что отражает переход гонки вооружений AI в стадию высокорискованных капитальных игр (Источник: 财联社)

Индийская «AI-акция-монстр» взлетела в 550 раз без бизнеса по производству чипов : Акции индийской компании RRP Semiconductor Ltd за последние 20 месяцев выросли на 55 000%, а рыночная стоимость подскочила до 1,7 млрд долларов, обогнав по темпам роста NVIDIA. Однако расследование показало, что в компании работают всего 2 официальных сотрудника, она не ведет никакой деятельности по производству полупроводников, а ее выручка отрицательна. Этот абсурдный феномен отражает слепую погоню индийских розничных инвесторов за концепцией AI и пробелы в регулировании, становясь типичным предупреждением о пузыре AI в 2025 году (Источник: 新智元)

Спрос на вычислительные мощности AI привел к тому, что цена 256 ГБ памяти превысила стоимость RTX 5090 : Поскольку такие гиганты, как OpenAI, зарезервировали 40% мировых поставок DRAM, на рынке памяти возник структурный дефицит. Рыночная цена одной планки DDR5 на 256 ГБ взлетела до 3500–5000 долларов, что значительно превышает стоимость топовых видеокарт. Это явление отражает то, как высокие ставки серверов AI на HBM и высокопроизводительную память «перехватывают» потребительские мощности. Не только комплектующие для ПК, но и жесткие требования концепции AI PC к большому объему памяти еще больше повышают порог входа; обычные потребители сталкиваются с резким ростом стоимости оборудования из-за «AI-премии» (Источник: 机器之心)

🌟 Сообщество
Итоги 2025 года: горячие слова в сфере AI — от «Vibe Coding» до «Slop» : MIT Technology Review выбрал слова года в сфере AI. «Vibe Coding» (программирование по вайбу) заняло первое место, подчеркивая, что человеку достаточно выразить цель, а AI берет на себя реализацию. В то же время «модели рассуждений» и «модели мира» отражают эволюцию глубины технологий, а «Slop» (AI-мусор) и «пузырь» отражают рефлексию сообщества по поводу избытка контента и перегрева капитала. Кроме того, «GEO» (Generative Engine Optimization) заменяет SEO, становясь новым полем битвы брендов за трафик в эпоху AI (Источник: 腾讯科技, 硅星GenAI)

Ян Лекун репостнул: «Семь трещин» в суждениях людей и LLM : В статье сравниваются различия в суждениях людей и LLM на семи когнитивных стадиях, указывая на фундаментальные недостатки LLM в перцептивном закреплении, мотивационном руководстве, причинно-следственных рассуждениях и метапознании. Хотя язык, генерируемый LLM, беглый и обманчивый, его суть — вероятностное предсказание, а не «разум». В ходе обсуждения в сообществе было отмечено, что это «ощущение ума ИИ» крайне вводит в заблуждение при отсутствии проверки, и люди часто чрезмерно доверяют выводам AI из-за «предвзятости доверия», что представляет собой структурный вызов эпохи AI (Источник: ylecun)

Обсуждение на Reddit: использование ChatGPT как инструмента когнитивной реабилитации : Пользователь с ПТСР поделился опытом использования ChatGPT для структурированной когнитивной поддержки. Благодаря длительному интерактивному диалогу пользователь добился значительного прогресса в эмоциональной регуляции, логическом упорядочивании и самозащите, что было признано клиницистами. Сообщество бурно отреагировало на это, сосредоточившись на том, как AI может служить «зеркалом последовательности» для психологической реабилитации, одновременно предостерегая от чрезмерной зависимости и возможных вводящих в заблуждение эффектов «эха» (Источник: Reddit)
💡 Прочее
Полное обращение всплеска болезни Альцгеймера в экспериментах на животных : Исследовательская группа из Университета Кейс Вестерн Резерв опубликовала в Cell Reports Medicine прорыв: с помощью соединения P7C3-A20 удалось восстановить баланс NAD+ в мозге, что привело к полному восстановлению нейронных функций у мышей с поздней стадией болезни Альцгеймера. В отличие от слепого приема добавок NAD+, эта терапия фокусируется на точной регуляции, не только исправляя патологические повреждения, но и восстанавливая память. Хотя до применения на людях еще далеко, это открывает дверь надежды на «полное излечение» от деменции (Источник: dotey)

Робот с тросовым приводом от Stardust Intelligence начал продавать «слепые коробки» : В Рождество человекоподобный робот S1 с тросовым приводом, разработанный Stardust Intelligence, официально начал «работать» в торговых центрах Пекина, Шанхая и Гуанчжоу, отвечая за голосовое приветствие, захват «слепых коробок» (blind boxes) и доставку товаров. Технология тросового привода придает роботу гибкость и точность контроля силы, аналогичную человеческим мышцам, что делает его более безопасным и отзывчивым при взаимодействии с людьми. Концепция «распределенного интеллекта», предложенная компанией, направлена на то, чтобы роботы через телеуправление первыми входили в реальные сценарии, такие как токсичные лаборатории или удаленное обслуживание (Источник: 智能涌现)

AI-хит «Семидневный любовник» вызвал споры об авторском праве и внимании : Песня «Семидневный любовник» (《七天爱人》), созданная программистом с помощью DeepSeek и музыкальных AI-инструментов, набрала более 2 млн прослушиваний на NetEase Cloud Music, а авторские права были проданы за десятки тысяч юаней. Это событие доказывает, что AI-музыка уже обладает реальной способностью к монетизации и бросает вызов традиционной системе авторского права. Приложение Qishui Music от ByteDance определяет путь создания хитов через экосистему Douyin, в то время как Tencent и NetEase строго контролируют аудит и распределение доходов. «Бесконечное предложение», приносимое AI, заставляет платформы переходить от гонки авторских прав к войне за эффективность распределения внимания (Источник: 市象)
