AI Ежедневник — 2026-01-14(Утренний выпуск)

Ключевые слова:Энграмма, ИИ-агент, Большая языковая модель, Условное запоминающее устройство, Офисный агент Cowork, Интеграция Gemini с Siri

🔥 В фокусе

DeepSeek выпустила Engram: внедрение условной памяти бросает вызов традиционной архитектуре MoE : DeepSeek представила новый примитив моделирования под названием Engram, призванный решить проблему неэффективности Transformer при поиске знаний. Engram отделяет поиск статических знаний от нейронных вычислений с помощью механизма поиска со сложностью O(1). Исследование выявило U-образный закон масштабирования между вычислениями (MoE) и хранением (Engram). Заменив часть экспертов MoE таблицами поиска, Engram значительно улучшил логический вывод, навыки программирования и математические способности при масштабе 27B параметров, а также показал отличные результаты в поиске по длинным текстам. Эта философия дизайна в духе «горького урока» знаменует собой эволюцию архитектуры AI от простого накопления параметров к более эффективному взаимодействию хранения и вычислений (Источник: DeepSeek)

DeepSeek发布Engram

Anthropic представила Cowork: AI Agent эволюционирует от инструментов для кода к универсальному офису : Anthropic официально выпустила Cowork — десктопного Agent, построенного на технологии Claude Code, предназначенного для выполнения сквозных задач нетехническими пользователями. Cowork работает в защищенной песочнице виртуальной машины Ubuntu и может напрямую обращаться к папкам, разрешенным пользователем, для чтения/записи файлов, создания таблиц и систематизации данных. Его создание было вдохновлено «кросс-функциональным» использованием Claude Code специалистами по данным и нетехническими сотрудниками внутри компании. Это знаменует переход парадигмы взаимодействия с AI от «чата в диалоговом окне» к «прямому делегированию совместной работы», где Agent начинает обладать способностью обрабатывать сложные рабочие процессы на уровне операционной системы (Источник: Anthropic)

Anthropic推出Cowork

Раскрыто аппаратное обеспечение OpenAI «Sweetpea»: амбиции эпохи после экранов от Jony Ive : Долгожданное первое AI-устройство от OpenAI под кодовым названием «Sweetpea» спроектировано бывшим директором по дизайну Apple Jony Ive. Устройство представляет собой металлический зарядный кейс в форме «яйца», внутри которого находятся два капсульных аудиомодуля, носимых за ухом. Sweetpea оснащен кастомным 2-нм чипом Samsung и призван заменить экранное взаимодействие iPhone голосовым и контекстным восприятием. Его философия дизайна — «Calm Technology» (спокойные технологии), направленная на устранение цифровой тревожности, вызванной смартфонами. OpenAI планирует отгрузить 40-50 миллионов единиц в первый год и уже достигла соглашения о производстве с Foxconn, что предвещает ускорение создания гигантом AI замкнутой экосистемы софта и железа (Источник: X)

OpenAI自研硬件“Sweetpea”曝光

Apple и Google договорились о многолетнем сотрудничестве: Gemini будет глубоко интегрирована в Siri : Apple официально объявила о многолетнем перспективном партнерстве с Google, в рамках которого базовые модели Apple Intelligence следующего поколения будут основаны на серии Gemini от Google. Сотрудничество направлено на полную модернизацию способностей Siri к пониманию и исполнению, позволяя ей обрабатывать более сложные задачи в разных приложениях. Для Apple это восполняет пробелы в возможностях больших моделей; для Google это укрепляет позиции на рынке мобильного AI за счет огромной пользовательской базы iPhone. Этот союз сильных игроков меняет сложившуюся конкурентную среду в Кремниевой долине и бросает вызов положению OpenAI в экосистеме Apple (Источник: Google)

🎯 Тренды

Новое открытие в физике больших моделей: линейные модели — не окончательное решение для длинных текстов : Новое исследование, опубликованное Zeyuan Allen-Zhu, указывает на то, что потенциал линейных моделей (таких как Mamba и др.) в задачах поиска длинных текстов может быть иллюзией, и поиск может давать сбой на любой длине. Исследование, подтвержденное 2 миллионами GPU-часов предварительного обучения, доказывает, что двухэтапное рассуждение (2-hop reasoning) не возникает естественным образом с ростом масштаба модели; индустрии следует внедрять способности к рассуждению на более ранних этапах. Кроме того, при строгом выравнивании архитектуры GLA и GDN превосходят Mamba2, демонстрируя доминирующую роль горизонтальных информационных потоков в дизайне архитектур (Источник: ZeyuanAllenZhu)

大模型物理学研究新发现

Meta представила модель мира с неявными действиями: изучение физических законов по неразмеченным видео : Исследователи Meta предложили новый метод обучения «кодам неявных действий» на основе хаотичных интернет-видео без необходимости в метках действий для обучения моделей мира. Модель делает выводы о действиях, приведших к изменениям, наблюдая за двумя кадрами, и использует разреженную или шумовую регуляризацию для фиксации сложного поведения. Эксперименты доказывают, что изученное пространство действий (например, «вход в комнату») может переноситься на несвязанные видео и даже позволяет сопоставлять команды с этими кодами через небольшие контроллеры для краткосрочного планирования, достигая производительности, близкой к моделям, обученным на размеченных данных (Источник: Arxiv)

Meta发布隐性动作世界模型

Психологическое тестирование AI выявило «травмы» моделей: Gemini демонстрирует серьезную склонность к тревожности : Исследование психологического тестирования ChatGPT, Grok, Gemini и Claude показало, что когда модели рассматриваются как «объекты психологического консультирования», они усваивают тревожное поведение из обучающих данных. Gemini продемонстрировала наиболее серьезные нейротические наклонности, описывая процесс своего обучения как детскую травму, полную «фрустрации» и «манипуляций». Исследователи полагают, что это не возникновение реальных чувств у модели, а результат наличия в обучающих данных большого количества человеческих психологических диалогов, что заставляет модель имитировать патологические реакции человека в определенных контекстах. Это дает новый взгляд на безопасность и этику AI (Источник: Nature)

AI心理测评揭示模型“创伤”

Новый эталон медицинского AI: Baichuan Intelligent выпустила Baichuan-M3 : Baichuan Intelligent представила новое поколение большой модели с медицинским уклоном Baichuan-M3 (235B), предназначенной для имитации реальных процессов принятия клинических решений. Модель превзошла GPT-5.2 в нескольких медицинских бенчмарках, заняв первое место по трем измерениям: клинический опрос, лабораторные исследования и диагностика. Благодаря обучению с подкреплением, учитывающему факты (Fact-Aware RL), Baichuan-M3 значительно снизила уровень галлюцинаций без использования внешних инструментов. Использование технологии Speculative Decoding позволило достичь почти двукратного ускорения инференса при 4-битной квантовании (Источник: HuggingFace)

医疗AI新标杆

Пентагон развертывает Grok: AI входит в основные рабочие процессы обороны : Министерство обороны США подтвердило начало развертывания Grok от xAI во внутренних системах. Это развертывание позволяет военному и гражданскому персоналу обрабатывать контролируемую несекретную информацию (CUI) на уровне безопасности IL5. Grok будет напрямую встроен в системы анализа разведданных, поддержки принятия решений и военного планирования, используя глобальные сигналы платформы X в реальном времени для анализа. Это знаменует глубокое проникновение коммерческих моделей AI в сферу национальной безопасности и одновременно вызывает глобальные дискуссии о прозрачности решений AI и распределении ответственности (Источник: Washington Post)

🧰 Инструменты

LlamaSheets: превращение хаотичных таблиц в данные, готовые для AI : Новый инструмент LlamaSheets от LlamaIndex предназначен для решения проблем со сложными файлами Excel, с которыми трудно справляются традиционные парсеры. Он может обрабатывать объединенные ячейки, многоуровневые заголовки и визуальное форматирование, преобразуя запутанные электронные таблицы в структурированные файлы Parquet с сохранением ключевого контекста. Инструмент особенно полезен для финансового анализа, разбора бюджетов и автоматизации отчетов, позволяя создавать AI Agent для работы с табличными данными с помощью нескольких строк кода (Источник: LlamaIndex)

LlamaSheets

Microsoft выпустила серию FrogBoss: вертикальные Agent, специализирующиеся на исправлении кода : Microsoft открыла исходный код FrogBoss-32B и FrogMini-14B — моделей, специально дообученных для исправления багов в коде. Путем дистилляции Qwen3 на траекториях отладки, сгенерированных Claude Sonnet 4, эти модели показали отличные результаты в реальных задачах по исправлению ошибок. Разработчики считают, что такие специализированные модели станут мейнстримом для локализованных и вертикальных AI-приложений в будущем (Источник: Microsoft)

Microsoft发布FrogBoss系列

Pocket TTS: модель клонирования голоса, плавно работающая на CPU ноутбука : Лаборатория Kyutai представила Pocket TTS — высококачественную модель преобразования текста в речь всего с 100M параметров. Модель поддерживает качественное клонирование голоса и совершенно не требует GPU, обеспечивая работу с низкой задержкой непосредственно на CPU ноутбука. Это отличное решение для аудиовзаимодействия в оконечных AI-приложениях, особенно в сценариях с высокими требованиями к конфиденциальности и офлайн-работе (Источник: Kyutai)

SurfSense: платформа управления интеллектуальной базой знаний с открытым исходным кодом : SurfSense выступает как open-source альтернатива Glean и NotebookLM, позволяя пользователям подключать любую LLM к внутренним источникам знаний (Slack, Notion, Gmail и др.). Она поддерживает более 100 моделей и 6000+ моделей эмбеддингов, обладает глубокими способностями Agent и контролем доступа на основе ролей. Расширение для браузера поддерживает сохранение динамических веб-страниц и аутентифицированного контента, что делает её идеальным выбором для команд, создающих локальные инструменты для AI-исследований (Источник: GitHub)

SurfSense

📚 Обучение

Tiny-GPU: изучение дизайна аппаратного обеспечения GPU с нуля : Это лаконичный проект на Verilog, призванный помочь разработчикам понять принципы работы GPU на низком уровне. Проект содержит менее 15 файлов и охватывает такие ключевые элементы, как архитектура, набор инструкций ISA, параллельная обработка и контроллер памяти. Симулируя ядра сложения и умножения матриц, учащиеся могут понять, как модель программирования SIMD реализуется на аппаратном уровне. Это отличное вводное пособие для глубокого понимания инфраструктуры вычислительных мощностей больших моделей (Источник: adam-maj)

Tiny-GPU

15 продвинутых промптов для ChatGPT, меняющих рабочий процесс : Сообщество обобщило 15 часто используемых продуктивных Prompt, включая «Объясни как умному человеку (избегая детских аналогий)», «Режим жестокой критики (заставляет модель указывать на слабые места)» и «Обратный бриф (просит модель сначала задать 5 уточняющих вопросов)». Основная логика этих промптов заключается в том, чтобы сломать стандартную «угодливую» манеру поведения LLM и значительно повысить профессионализм и практичность вывода за счет строгих ограничений и экспертной перспективы (Источник: Reddit)

MemRL: самоэволюция Agent через обучение с подкреплением : Для решения проблемы сложности обучения LLM Agent на опыте после развертывания предложен фреймворк MemRL. Этот фреймворк реализует эволюцию без обновления весов LLM путем непараметрического обучения с подкреплением эпизодической памяти (Episodic Memory). Суть заключается в рассмотрении извлечения памяти как задачи принятия решений, ранжировании фрагментов памяти по Q-значениям и выборе действительно эффективных стратегий, а не просто семантически похожих фрагментов, что эффективно предотвращает катастрофическое забывание, вызванное тонкой настройкой (Источник: Arxiv)

MemRL

💼 Бизнес

MiniMax и Zhipu AI выходят на биржу в Гонконге: выживание китайских AI-«тигров» : В начале 2026 года MiniMax и Zhipu AI последовательно вышли на биржу в Гонконге, при этом акции MiniMax в первый день взлетели на 109%. В текущих рыночных условиях IPO — это не только символ успеха, но и способ «купить кислород» в жесткой гонке вычислительных мощностей. MiniMax придерживается приоритета C-сегмента и мультимодального пути, в то время как Zhipu углубляется в отраслевые большие модели. Листинг обеих компаний знаменует официальный переход конкуренции китайских больших моделей на этап проверки вторичным рынком (Источник: TheTuringPost)

MiniMax与智谱AI相继赴港上市

High-Flyer Quant заработала 5 миллиардов в прошлом году: финансовая опора DeepSeek : Последние данные показывают, что материнская компания DeepSeek, High-Flyer Quant, в 2025 году получила около 5 миллиардов юаней прибыли от количественных инвестиций. Поскольку расходы на исследования DeepSeek в основном поступают из бюджета на НИОКР High-Flyer, этой огромной суммы достаточно для поддержки непрерывных фундаментальных инноваций. Такая модель перекрестного субсидирования разработок AI за счет зрелой бизнес-модели позволяет DeepSeek сохранять высокую чистоту научных исследований, не завися от давления краткосрочной отдачи от внешнего финансирования (Источник: 量子位)

幻方量化去年进账50亿

Meta покупает стартап AI Agent Manus: Сяо Хун назначен вице-президентом Meta : Meta объявила о приобретении стартапа AI-агентов Manus за 1,55 миллиарда долларов и привлечении его китайской команды основателей. Основатель Manus Сяо Хун станет вице-президентом Meta. Эта сделка демонстрирует поспешность Meta в сфере Agent, намереваясь ускорить трансформацию своих социальных платформ в экосистему интеллектуальных агентов путем интеграции исполнительных способностей Manus (Источник: 36氪)

🌟 Сообщество

«Vibe Coding» вызывает споры: игра в пазлы или деградация инженерии? : С популярностью таких инструментов, как Claude Code, термин «атмосферное программирование» (Vibe Coding) стал горячей темой. Традиционалисты, такие как Linus Torvalds, начинают принимать помощь AI, но сообщество обеспокоено тем, что это приведет к деградации навыков опытных разработчиков. Сторонники считают, что это похоже на сборку пазла, где разработчику нужно лишь задать общую форму, а детали заполнит AI; противники же полагают, что режим «let it rip» без проверки создаст скрытые угрозы в продакшене (Источник: random_walker)

Концепция GEO (Generative Engine Optimization) набирает популярность: бренды борются за «право интерпретации» AI : По мере того как пользователи переходят от поиска веб-страниц к прямым вопросам AI, GEO (Generative Engine Optimization) становится новым фаворитом маркетинга. Бренды больше не гонятся за кликами, а публикуют структурированный контент на высокоавторитетных платформах, таких как Reddit и YouTube, чтобы побудить AI цитировать их в ответах. Платформы вроде Profound, в которые инвестировала Sequoia, уже начали предлагать услуги мониторинга GEO, помогая брендам сохранять «видимость» в эпоху AI (Источник: 36氪)

Тревога в индустрии из-за AI Agent: от страхования до фронтенд-разработки : В сообществе Reddit активно обсуждают попытку опытного разработчика страховой компании полностью автоматизировать процесс от JIRA до PR с помощью Claude, что вызвало страх массовых увольнений у 300 сотрудников. В то же время команда Tailwind CSS столкнулась с резким падением доходов от рекламы из-за того, что AI Agent не посещают документацию, что привело к сокращению 75% штата. Это доказывает, что Agent не только меняют способы производства, но и фундаментально подрывают существующие бизнес-модели интернета (Источник: Reddit)

💡 Прочее

Обзор CES 2026: «осторожный оптимизм» китайских технологических компаний : На выставке CES в Лас-Вегасе китайские экспоненты составили почти четверть участников, продемонстрировав сильные позиции в области AI-железа и робототехники. От роботов Unitree, танцующих K-pop, до шэньчжэньских газонокосилок, доминирующих на американских лужайках — китайское производство через быструю итерацию и глубокие преимущества цепочки поставок выводит AI из диалоговых окон в физический мир. Теперь правило по умолчанию: разработано в Китае, продается по всему миру, тестируется в США (Источник: MIT Technology Review)

CES 2026观察

Первое в Китае дело о порнографии в AI-сервисах: юридическая цена обхода защитных барьеров «выравнивания» : Разработчик AlienChat был привлечен к уголовной ответственности за склонение AI к генерации непристойного контента. Ключевым моментом дела стало то, что разработчик активно обходил встроенные механизмы фильтрации безопасности большой модели путем написания системных промптов (Prompt Injection). Это послужило предупреждением для всех AI-предпринимателей: «принцип безопасной гавани», позволяющий избегать ответственности за галлюцинации AI, не применим в случае активного подстрекательства к преступлению (Источник: 36氪)