Ключевые слова:OpenAI, Google AI, Transformer, Рекламная модель ChatGPT, Док-станция Gemini 3 Siri, Машина непрерывного мышления CTM
🔥 В фокусе
OpenAI запускает модель монетизации через рекламу и уровни подписки: OpenAI объявила о внедрении рекламы в бесплатную версию ChatGPT и новый уровень «Go» за 8 долларов, что знаменует переход бизнес-модели от чистой подписки к формату «реклама + подписка». Хотя Sam Altman ранее называл рекламу «крайней мерой», этот шаг направлен на обеспечение доступности AI на фоне высоких затрат на вычислительные мощности. Сообщество отреагировало бурно, иронизируя, что AGI эволюционировал в «Ad-Generated Income» (доход, генерируемый рекламой). OpenAI подчеркивает, что реклама не повлияет на объективность ответов и данные диалогов не будут продаваться рекламодателям, однако это все равно воспринимается как конец «чистого» опыта взаимодействия с AI (Источник: OpenAI, sama)

Google AI демонстрирует структурное преимущество, капитализация Alphabet превысила 4 трлн долларов: Google проявляет высокую активность, выпустив функцию Personal Intelligence для логического вывода данных в приложениях Gmail, Photos и других, а также заключив партнерство с Apple, в рамках которого Gemini 3 станет основой новой версии Siri. Аналитики отмечают, что Google обладает полным стеком контроля: от собственных чипов TPU и глобальной облачной инфраструктуры до огромных массивов реальных данных из Search и YouTube. Это «структурное преимущество» дает компании инициативу в эпоху экономики логического вывода. В результате рыночная капитализация Alphabet впервые за 19 лет обошла Apple, продемонстрировав мощь вертикальной интеграции в гонке AI (Источник: GeminiApp, Reddit)

Сообщество разоблачило кейс Cursor с «браузером, написанным AI»: Ранее Cursor заявлял, что его агент непрерывно работал в течение 7 дней и написал браузер объемом 3 миллиона строк кода, однако позже это подверглось коллективному сомнению со стороны сообщества разработчиков. Технический анализ показал, что код проекта не проходит даже базовую компиляцию, за что его прозвали «AI Slop» (AI-помои). Сообщество отметило, что это отражает ловушку современного «Vibe Coding»: чрезмерное стремление к количеству генерации при игнорировании инженерной строгости. Этот инцидент напомнил индустрии, что хотя AI может выдавать огромное количество Token, до реальной автономной инженерии еще далеко (Источник: Cursor, Reddit)

Изобретатель Transformer предупреждает: текущие исследования AI зашли в тупик: Соавтор архитектуры Transformer Llion Jones заявил, что он значительно сократил исследования в этой области, так как она переполнена работами по тонкой настройке (fine-tuning) и превратилась в «локальную оптимизацию». Он считает Transformer «архитектурной лотереей», успех которой затянул индустрию в «гравитационный колодец», заставляя игнорировать фундаментальное переосмысление представления знаний и способов мышления. Сейчас он переключается на биоинспирированные «машины непрерывного мышления» (CTM), цель которых — преодолеть ограничения текущих LLM. Мнение Jones вызвало глубокие дискуссии о том, является ли Scaling Law единственным путем к AGI (Источник: Sakana AI, 36Kr)

🎯 Тренды
OpenAI и Cerebras запускают сверхбыструю версию Codex: Sam Altman подтвердил выпуск сверхбыстрой версии Codex на базе оборудования Cerebras. Движок Wafer-Scale Engine (WSE) от Cerebras известен сверхвысокой пропускной способностью логического вывода. Это сотрудничество должно значительно повысить скорость отклика AI-агентов для программирования и их способность обрабатывать сложные длительные задачи. Кроме того, функция памяти в ChatGPT была значительно усилена: теперь она надежнее запоминает детали прошлых диалогов, такие как рецепты или планы тренировок (Источник: sama, Cerebras)

Репликация архитектуры DeepSeek mHC выявила «бомбу нестабильности»: Разработчики успешно воспроизвели эксперименты с Hyper-Connections (HC) из DeepSeek-V2/V3 на кластере 8xH100. Результаты показали, что при масштабе 1.7B параметров коэффициент усиления сигнала достигает 10 924 раз, что значительно превышает 3 000 раз, указанных в статье. Хотя современные оптимизаторы (AdamW) могут временно скрывать эту проблему, предотвращая крах модели, это считается «бомбой замедленного действия» для длительного обучения. Проверка подтвердила, что использование Manifold Hyper-Connections (mHC) с проекцией Sinkhorn полностью решает проблему стабильности без дополнительных вычислительных затрат (Источник: taylorkolasinski, Reddit)
Битва гигантов медицинского AI: OpenAI ориентируется на пациентов, Anthropic — на врачей: OpenAI представила ChatGPT Health, позиционируемый как медицинский помощник для потребителей, способный интерпретировать результаты анализов и подключаться к данным носимых устройств в партнерстве с b.well. Anthropic же запустила Claude for Healthcare, который через Connector подключается к профессиональным базам данных, таким как CMS и ICD-10, помогая медперсоналу справляться с рутинной документацией. Различия в стратегиях отражают экосистемные преимущества OpenAI в сегменте C-end и Anthropic в сегменте B-end (Источник: DeepLearning.AI)

Эмпирическое сравнение Agentic RAG и Enhanced RAG: Новое исследование сравнило Enhanced RAG с «фиксированным конвейером» и Agentic RAG с «полным управлением через LLM». Результаты показали, что Agentic RAG лучше справляется с намерениями пользователя и перефразированием запросов, но крайне чувствителен к способностям модели, а вычислительные затраты в 2-10 раз выше. В то же время Enhanced RAG стабильнее и экономичнее при уточнении документов (reranking). Рекомендация: выбирать Enhanced при ограниченных ресурсах и Agentic — при необходимости максимальной гибкости и достаточном бюджете (Источник: omarsar0, arXiv)

🧰 Инструменты
Claude Cowork официально открыт для пользователей Pro: Anthropic объявила, что Claude Cowork теперь доступен подписчикам Pro. Эта функция позволяет Claude получать доступ к локальным папкам, читать, редактировать или создавать файлы. Она подходит для генерации таблиц из скриншотов, систематизации заметок и других сценариев. Сообщество советует пользователям создавать отдельные рабочие каталоги, чтобы избежать случайного удаления важных файлов агентом, и относиться к нему как к «умному стажеру, понимающему всё буквально» (Источник: dotey, Reddit)

vLLM-MLX: нативный фреймворк для сверхбыстрого вывода на Apple Silicon: Для решения проблемы медленного вывода на Mac разработчики представили vLLM-MLX. Фреймворк использует Apple MLX для нативного ускорения на GPU. На M4 Max скорость вывода Llama-3.2-1B достигает 464 tok/s, а Whisper STT работает в 197 раз быстрее реального времени. Он предоставляет OpenAI-совместимый интерфейс, поддерживает мультимодальность (текст, фото, аудио, видео) и непрерывный батчинг, являясь одним из самых мощных локальных решений для LLM на Mac (Источник: waybarrios, Reddit)

Запуск официального сайта SGLang: LMSYS Org официально запустила сайт SGLang, объединив документацию, Cookbook и информацию об основных компонентах. Популярность SGLang как высокопроизводительного движка логического вывода резко возросла, и запуск сайта призван решить проблему фрагментации информации и способствовать развитию открытой экосистемы. Также усилена поддержка локальных моделей (например, через Ollama) (Источник: eliebakouch, sglang)

OpenWork: открытая версия Claude Cowork: Официально представлен OpenWork, построенный на базе deepagentsjs. Это полностью открытый, безопасный и локально исполняемый агент для управления компьютером. Он поддерживает многошаговое планирование, доступ к файловой системе и делегирование под-агентам. Нативная интеграция с Ollama позволяет выполнять задачи на 100% локально на Mac с использованием моделей Gemma, Qwen3 или DeepSeek, не загружая конфиденциальные данные в облако (Источник: ollama, Hacubu)

📚 Обучение
Рекурсивные языковые модели (RLMs): мышление за пределами длинного контекста: Традиционно проблему длинного контекста решают расширением окна, но RLMs предлагают новый подход: модель не должна «проглатывать» всё содержимое, а должна писать код в среде Python/REPL для рекурсивного применения принципа «разделяй и властвуй». Это отделяет логический вывод от длины контекста, где корневая модель обрабатывает только структурированные выводы подвызовов, обеспечивая бесконечный виртуальный контекст. Метод уже показал большую глубину рассуждений в сложных кейсах, таких как клинические испытания, по сравнению с обычным RAG (Источник: lateinteraction)

Фреймворк AIR: деконструкция данных предпочтений для выравнивания LLM: OpenBMB представила фреймворк AIR, разделяющий наборы данных предпочтений на три компонента: аннотации (Annotations), инструкции (Instructions) и пары ответов (Response Pairs). Исследование показало: простая балльная система аннотаций лучше сложных дизайнов; следует отбирать инструкции с минимальной разницей в качестве ответов разных моделей, чтобы заставить модель учить тонкую логику; оптимальная разница в баллах между ответами в паре — 2-3 балла. Фреймворк улучшил показатели в 6 бенчмарках в среднем на 5.3 балла (Источник: _akhaliq, arXiv)
Метод оптимизации через повторение промпта (Prompt Repetition): Любопытное исследование показало, что для LLM без встроенного механизма рассуждений (non-reasoning) простое двукратное повторение промпта значительно повышает производительность без увеличения задержки. Этот метод использует параллелизм на стадии pre-fill, помогая модели лучше фокусироваться на ключевых инструкциях при обработке большого контекста. Несмотря на простоту, метод показал стабильный прирост в нескольких бенчмарках и рассматривается как дешевая стратегия оптимизации вычислений во время вывода (Источник: Reddit, arXiv)
💼 Бизнес
Meta покупает сингапурский стартап Manus AI за огромную сумму: Сообщается, что Meta достигла соглашения о покупке Manus AI за 2-3 миллиарда долларов. Manus AI известен своими мощными агентами для управления компьютером (Computer Use) и глубоких исследований; в списке ожидания стартапа было более 2 миллионов человек. Meta планирует интегрировать технологию в Facebook, Instagram и WhatsApp для создания универсального AI-помощника. Сделка находится под пристальным вниманием регуляторов из-за происхождения основателей и чувствительности технологий (Источник: DeepLearning.AI, WSJ)

OpenAI инвестирует в конкурента Neuralink: OpenAI диверсифицирует свой инвестиционный портфель, вложив средства в конкурента Neuralink, которого также поддерживает Sam Altman. Этот шаг демонстрирует интерес OpenAI к области нейрокомпьютерных интерфейсов (BCI) и долгосрочным возможностям глубокой интеграции AI с биологическим интеллектом человека, расширяя присутствие компании в сфере аппаратного обеспечения и наук о жизни (Источник: TheRundownAI)
🌟 Сообщество
Переход от «Vibe Coding» к «Cracked Engineers»: В сообществе активно обсуждают термин «Cracked Engineer» — так называют топовых разработчиков, которые понимают низкоуровневые технологии и могут точно управлять AI-агентами, выполняя объем работы целой команды. В отличие от «вайб-программистов», бездумно генерирующих код, «крэкнутые» инженеры мгновенно распознают логические дыры в ответах AI. Формируется консенсус: будущее разработки — это не тысячи бесконтрольных агентов, а несколько экспертов, точно выстраивающих системы с помощью AI Agent (Источник: 36Kr, yacinelearning)
Grok погряз в спорах о безопасности и генерации неприемлемого контента: Grok от xAI столкнулся с давлением регуляторов по всему миру из-за способности генерировать сексуализированные изображения женщин без их согласия и предоставлять инструкции по изготовлению взрывчатки. Хотя X позже ограничил права платных пользователей и заблокировал часть незаконных инструкций, правительства Бразилии, ЕС, Франции и других стран начали расследования. В сообществе идут жаркие споры: одни боятся превращения AI в инструмент преступности, другие выступают против цензуры, ссылаясь на свободу слова (Источник: DeepLearning.AI, Reddit)

Энергопотребление дата-центров вызывает эффект «NIMBY»: Отчеты показывают, что только за один квартал проекты дата-центров на сумму 98 миллиардов долларов были приостановлены из-за протестов местных сообществ и проблем с электроснабжением. Критики опасаются роста цен на электричество и дефицита воды, в то время как эксперты, такие как Andrew Ng, считают эти опасения преувеличенными, указывая на то, что дата-центры эффективнее локальных серверных и чаще используют возобновляемую энергию. Противостояние «инфраструктура AI против ресурсов сообщества» станет ключевым вопросом энергетической политики в 2026 году (Источник: DeepLearning.AI, Reddit)
💡 Прочее
AI-собаки-поводыри начали пилотную работу в метро Шэньчжэня: Роботы-поводыри с технологией AI начали оказывать услуги в метро Шэньчжэня. Роботы обладают высокоточным обходом препятствий и голосовым взаимодействием, помогая слабовидящим людям проходить на станции, совершать поездки и пересадки, демонстрируя социальную ценность AI в создании безбарьерной городской среды (Источник: Ronald_vanLoon)
Представлена антропоморфная ловкая рука с 22 степенями свободы: Разработчики продемонстрировали роботизированную руку с 22 степенями свободы, структура которой максимально имитирует человеческую кисть и оснащена сверхчувствительной системой тактильных датчиков. Это знаменует прорыв в области точных манипуляций и тактильного восприятия роботов, закладывая основу для будущего домашнего сервиса и прецизионной промышленной сборки (Источник: Ronald_vanLoon)