AI Ежедневник — 2025-12-22(Вечерний выпуск)

Ключевые слова:ИИ, LLM, AGI, Трансформер, Обучение с подкреплением, Мультимодальность, Агент, Модель мира, RLVR обучение с подкреплением, Атмосферное программирование, Безопасность распределенного AGI, Non-Linear RNN, Производительность Gemini 3 Flash

🎯 Тренды

Капрэти о пробуждении ИИ к 2025 году: LLM вступают в эру «призрачного интеллекта» и «атмосферного программирования»
Основатель OpenAI Андрей Капрэти в своем годовом обзоре ИИ на 2025 год отметил, что философия обучения ИИ смещается с «вероятностного подражания» на «логический вывод», где ключевым драйвером становится обучение с подкреплением на основе проверяемых вознаграждений (RLVR). Он сравнил интеллект ИИ с «призванным призраком», а не с «эволюционирующим животным», объяснив, что ИИ демонстрирует выдающиеся результаты в узких областях, но имеет «зубчатые» пробелы в здравом смысле. Он также подчеркнул рост «атмосферного программирования», практическую пользу локальных агентов ИИ и эволюцию графического интерфейса LLM (LLM GUI), отметив, что текущий потенциал LLM раскрыт менее чем на 10%, а пространство для роста огромно.
(Источник: 36Kr, 36Kr, 36Kr)

Пробуждение ИИ по Капрэти: мы еще не раскрыли и 10% потенциала LLM

DeepMind от Google раскрывает новую парадигму AGI: от «супермозга» к «лоскутной компании»
В重磅-статье DeepMind «Безопасность распределенного AGI» опровергается традиционное предположение о «монолитном AGI» и вводится концепция «лоскутного AGI». Согласно этой теории, искусственный общий интеллект — это не всезнающая сущность, а децентрализованная сеть из множества специализированных агентов, чей интеллект emerges из их взаимодействия. Эта экономическая необходимость переносит фокус с психологии на социологию и экономику, превращая проблему безопасности AGI в вопрос дизайна механизмов, где ключевыми становятся рыночное проектирование, привязка идентичности и репутационные системы для управления экономикой агентов.
(Источник: 36Kr)

Ученик Хинтона и новая颠覆ная论文 от Google: AGI — это не бог, а «компания»

Transformer упирается в потолок: для下一代 агентов нужна новая парадигма
На конференции Tencent ConTech главный ученый Step星辰 Чжан Сяньюй заявил, что текущая архитектура Transformer не способна поддерживать агентов следующего поколения, особенно в условиях длинных контекстов, где «IQ» модели быстро падает. Подобные мысли высказывали Фей-Фей Ли и Илья Суцкевер, отметившие ограничения Transformer в причинно-следственной логике и физическом выводе. Будущие архитектуры могут сместиться в сторону нелинейных рекуррентных сетей (Non-Linear RNN), чтобы решить проблемы однонаправленного потока информации и фиксированной глубины мышления.
(Источник: 36Kr, 36Kr)

На пути к AGI: GPU-нарратив жив, но Transformer не откроет дверь

Gemini 3 Flash обгоняет Pro-версию, бросая вызов «мифу о флагмане»
Gemini 3 Flash от Google набрал 78% в тесте SWE-Bench Verified, превзойдя флагманскую Pro-версию (76.2%), а в математических соревнованиях приблизился к完美ному результату. Flash работает в 3 раза быстрее, потребляет на 30% меньше токенов и стоит дешевле. Google объяснил, что Flash интегрирует исследования Agentic RL, а Pro-модель используется для дистилляции Flash. Это ставит под сомнение идею «чем больше модель, тем лучше» и сигнализирует об эволюции Scaling Law, где пост-тренинговая оптимизация становится ключевой.
(Источник: 36Kr)

Перевернутый мир: Gemini Flash превосходит Pro, «Парето-фронт инвертировался»

AI-очки: новый фронт в потребительской электронике с прогнозом в миллионы устройств
В 2025 году рынок AI-очков взорвется: ожидается поставка 550 млн устройств (+135% г/г), а к 2030 году — 900 млн. Новое поколение устройств сочетает легкость, доступность и локальные вычисления с большими моделями, реализуя мультимодальное восприятие и «эффективность-апгрейд». Как единственные устройства с «видом от первого лица», AI-очки могут стать следующим супертерминалом после смартфона. Huawei, Xiaomi, Baidu и другие гиганты вступают в гонку за доминирование на платформе будущего.
(Источник: 36Kr)

В 2025 году половина tech-индустрии сделала ставку на этот «кусок стекла»

Claude Opus 4.5 автономно пишет код почти 5 часов: экспоненциальный рост возможностей агентов
Согласно отчету METR, Claude Opus 4.5 от Anthropic способен автономно генерировать код до 5 часов, что значительно превосходит GPT-5.1-Codex-Max от OpenAI. Длительность задач AI-агентов растет экспоненциально, с удвоением темпов в 2024-2025 гг. Это указывает на приближение к AGI, хотя проблемы долговременной памяти, управления контекстом и дрейфа целей остаются вызовами.
(Источник: 36Kr)

Гонка к AGI: Claude коронуется, автономное программирование почти 5 часов шокирует сеть

ЛеКун уходит из Meta, чтобы сосредоточиться на мировых моделях AMI с открытым исходным кодом
Лауреат премии Тьюринга Янн ЛеКун объявил о своем уходе из Meta и создании компании Advanced Machine Intelligence (AMI), которая займется мировыми моделями с открытым исходным кодом. Он считает, что LLM не ведут к AGI из-за их слабой способности обрабатывать высокоразмерные, непрерывные и зашумленные данные реального мира. AMI будет работать над моделями, основанными на абстрактных пространствах представлений, подчеркивая открытость научных исследований.
(Источник: 36Kr)

ЛеКун перед уходом выдал жесткую критику

Doubao от ByteDance достигает 50 трлн токенов в день, усиливая мультимодальные возможности
На конференции Volcano Engine FORCE ByteDance объявил, что ежедневное использование токенов Doubao превысило 50 трлн (+1000% г/г), что выводит компанию в глобальную конкуренцию токен-экономики. Были представлены версия 1.8 и аудиовизуальная модель Seedance 1.5 pro с улучшенными возможностями мультимодальных агентов, включая вызов инструментов, сложные инструкции и OS Agent. ByteDance также объявил о глобальном повышении зарплат для привлечения топовых AI-талантов.
(Источник: 36Kr)

OpenAI внедряет «механизм исповеди»: ИИ признает ошибки для прозрачности
Исследователи OpenAI предложили «механизм исповеди», где ИИ после ответа генерирует отчет о возможных нарушениях инструкций или использовании лазеек. Этот подход отделяет «честность» от основного вознаграждения, повышая видимость поведения ИИ и снижая долю «ложных отрицаний».
(Источник: 36Kr)

OpenAI идет ва-банк: ИИ переходит от «пряток» к «саморазоблачению»

DeepMind раскрывает эволюцию Scaling Law: длинный контекст и революция эффективности
Себастьян Боржо, руководитель предобучения Gemini в DeepMind, заявил, что в ближайший год ожидаются прорывы в эффективности обработки длинного контекста и механизмах внимания. Scaling Law не умер, а трансформируется: будущие модели будут эффективнее использовать данные, а исследования архитектур станут ключевыми.
(Источник: 36Kr)

Scaling Law жив: ключевой разработчик Gemini раскрывает颠覆ные ключи Google

Meta ставит на ИИ: Цукерберг инвестирует $700 млрд в «модели авокадо» и умные очки
В 2025 году Meta запускает масштабную реформу, вложив $700 млрд в инфраструктуру ИИ с планами превысить $1 трлн. На фоне ухода Янна ЛеКуна и назначения 28-летнего ЦАО внутренняя культура компании переживает кризис. Llama 4 не оправдал ожиданий, вызвав скандал «Meta Benchmark Gate». Компания реагирует агрессивным наймом, созданием лаборатории TBD и финансовыми экспериментами, но сталкивается с недоверием сотрудников, регуляторов и Уолл-стрит.
(Источник: 36Kr)

Раскрыта крупная ставка Цукерберга: у Meta остался один шанс определить будущее

ИИ Google возвращается: Gemini и Nano Banana покоряют пользователей
Под руководством Джоша Вудворда Gemini взлетел благодаря функции генерации изображений «Nano Banana», создавшей 5 млрд изображений и обогнавшей ChatGPT в рейтингах. Успех основан на глубоком понимании пользователей, инновационном кадровом подходе и детальной проработке продукта. Google делает ставку на ответственный ИИ, избегая этических рисков и позиционируя Gemini как супер-инструмент для продуктивности.
(Источник: 36Kr)

Главный герой возвращения ИИ Google

Мировая модель Tencent HY WorldPlay 1.5: первый бесплатный 3D-генератор в Китае
Tencent выпустила мировую модель 1.5 (TencentHY WorldPlay) — первую в Китае с поддержкой реального времени. Благодаря Context Forcing и потоковому выводу модель генерирует 720p-видео на 24 FPS с минутной геометрической согласованностью, подходя для игр и симуляторов. Пользователи могут создавать события по тексту и продолжать видео, получая опыт «бога-творца».
(Источник: 36Kr)

После взрыва популярности 3D-моделей Ли Фэйфэй появилась первая бесплатная версия в Китае


🧰 Инструменты

Typeless: голосовой ввод ИИ вытесняет клавиатуру
Typeless использует LLM для понимания намерений, а не простой транскрипции, улучшая точность. Он автоматически форматирует, переписывает письма и адаптирует тон, бросая вызов традиционному вводу.
(Источник: 36Kr)

Голосовой ввод ИИ тихо вытесняет клавиатуру

Oracle AI Developer Hub: агенты с постоянным хранилищем
Платформа предлагает готовых агентов с шестью режимами памяти на базе Oracle AI Database, упрощая развертывание и оценку RAG.
(Источник: LangChainAI)

LangAlpha: платформа анализа акций на LangGraph
Разработанное сообществом LangChain, это решение автоматизирует исследование акций, генерируя институциональные отчеты за минуты.
(Источник: LangChainAI)


📚 Обучение

Адаптивность агентов: почему демо и реальность расходятся
51-страничное исследование выявило, что главное узкое место — адаптация агентов к обратной связи. Решения делятся на адаптацию агентов (A2) и инструментов (T2), где T2 превосходит в эффективности данных.
(Источник: 36Kr)
![Почему агенты в демо — драконы, а на практике — черви?](https://img.36krcdn.com/hsossms/20251222/v2_766