AI Ежедневник - 2026-01-20(Утренний выпуск)

Ключевые слова：AGI, Большие языковые модели ИИ, Интеллектуальный агент, Модель мира, Постоянная память Claude, Парадокс ИИ в научных исследованиях

🔥 В фокусе

Лауреат Нобелевской премии Hassabis предсказывает появление AGI в течение пяти лет: ключ в World Models и прорыве в Agents : Глава Google DeepMind Demis Hassabis представил окончательный график появления AGI, считая, что человечество отделяют от него всего 1-2 ключевых технологических прорыва, которые могут быть реализованы в течение 5 лет. Он отметил, что текущие большие модели, хотя и сильны, представляют собой «разнородный интеллект», лишенный истинного понимания законов физического мира и способностей к долгосрочному планированию. В будущем необходимо внедрить World Models для понимания физических законов и эволюционировать в Agent systems с возможностью «когнитивной коррекции ошибок». Влияние этой трансформации будет в 10 раз сильнее промышленной революции, а AI станет ультимативным инструментом научных открытий, открывая золотой век в разработке лекарств, чистой энергетике и других областях. (Источник: 新智元)

Грандиозное обновление Claude «Permanent Memory»: Knowledge Bases и режим Cowork переосмысливают работу с AI : Стало известно, что Anthropic внедряет функцию «Permanent Memory» в Claude Cowork через Knowledge Bases для долгосрочного хранения знаний. AI больше не будет обладать «памятью золотой рыбки» — он сможет автоматически записывать предпочтения пользователя, процессы принятия решений и накопленный опыт, становясь тем умнее, чем больше его используют. Кроме того, Cowork станет основным входом в Claude, интегрируя боковую панель Artefacts и более мощные автоматизированные коннекторы MCP. Это обновление знаменует превращение AI-ассистента из простого инструмента диалога в «AI-коллегу», способного к длительному сотрудничеству и выполнению сложных задач, полностью меняя парадигму офисной работы. (Источник: 新智元)

ICML 2026 вводит механизм «Author Self-Rating»: использование теории игр для борьбы с кризисом научного рецензирования : Столкнувшись с резким ростом числа заявок на топовые конференции, такие как NeurIPS, приведшим к сбоям в системе рецензирования, ICML 2026 запускает революционную политику «Author Self-Rating». Механизм, основанный на «изотонической регрессии» из теории игр, требует от авторов нескольких работ ранжировать свои произведения. Эксперименты показали, что авторское ранжирование точнее предсказывает долгосрочное влияние статьи, чем случайные рецензенты. Этот шаг направлен на превращение «амбиций» авторов в калибровочный сигнал, однако он также вызвал опасения по поводу справедливости: крупные научные группы могут использовать алгоритм в своих интересах, в то время как «одиночки» рискуют остаться незамеченными в общем шуме. (Источник: 新智元)

Статья в Nature от Университета Цинхуа раскрывает парадокс AI в науке: резкий рост продуктивности ведет к «застою» научных границ : Команда профессоров Сюй Фэнли и Ли Юна из Университета Цинхуа опубликовала исследование в Nature, проанализировав 41 миллион статей за 45 лет. Выяснилось, что AI значительно повысил индивидуальную отдачу ученых (количество статей выросло в 3 раза, цитируемость — в 4,8 раза), но привел к снижению широты коллективных знаний на 4,63%. Под влиянием AI исследователи массово устремляются в популярные области с «богатыми данными и четкими вопросами», что ведет к однообразию инноваций и сокращению междисциплинарного сотрудничества. Команда предложила систему «научных агентов полного цикла», стремясь превратить AI из вспомогательного инструмента в «AI-ученого», способного выдвигать гипотезы и расширять границы неизведанного. (Источник: 新智元)

Google Research обнаружил трюк с промптами: повторение вопроса повышает точность с 21% до 97% : Исследование Google показало, что в задачах, не связанных с рассуждением (non-reasoning tasks), простое повторение входного вопроса (copy-paste) значительно улучшает работу больших моделей почти без увеличения задержки. Этот прием «репитера» в тесте NameIndex для Gemini 2.0 Flash-Lite поднял точность с 21,33% до 97,33%. Научная логика заключается в использовании «причинно-следственных слепых зон» архитектуры Transformer: повторный ввод предоставляет модели подобие «двунаправленного внимания». Это открытие означает, что разработчики могут использовать более дешевые малые модели для достижения возможностей поиска и извлечения данных, сопоставимых с топовыми моделями. (Источник: 新智元)

🎯 Тренды

Официальный релиз GLM-4.7-Flash: Zhipu AI выпускает универсальную облегченную модель класса 30B : Zhipu AI (Z.ai) официально представила GLM-4.7-Flash, позиционируемую как помощник для локального кодинга и Agent. Модель имеет общий объем параметров 30B (активных — около 4B) и использует архитектуру MLA для баланса производительности и эффективности. В бенчмарках она показывает результаты на уровне или выше GLM-4.5-Air, особенно в вызове инструментов и креативном письме. Как облегченный вариант класса 30B, она идеально подходит для локального развертывания в средах с 2x24GB VRAM, предоставляя разработчикам экономичную базу для создания Agent. (Источник: scaling01; Reddit)

DeepSeek представляет примитив Engram: новая эра условной памяти с учетом контекста : DeepSeek выпустила примитив условной памяти под названием «Engram», который превращает статические таблицы поиска N-gram в динамическую память, учитывающую контекст. Технология поддерживает сверхмасштабный поиск в памяти со сложностью O(1), активируя только те части, которые связаны с текущим скрытым состоянием. Engram позволяет хранить память в CPU RAM вместо дорогой GPU HBM, что значительно снижает затраты. Этот прорыв доказывает, что «масштабирование памяти» может частично заменить «масштабирование параметров», обеспечивая новую системную поддержку для длинного контекста и непрерывного обучения. (Источник: ZhihuFrontier)

Huawei представляет пять флагманских систем инференса 2025 года: преодоление барьера емкости HBM и ресурсных островов : Исследователь Huawei Цзо Пэнфэй перечислил пять прорывов в системах инференса 2025 года: SparseServe использует выгрузку холодного KV-кэша в DRAM; Adrenaline реализует динамическое перемещение между узлами Decode и Prefill через пулинг ресурсов; архитектура TaiChi адаптивно балансирует TTFT и TPOT; DualMap сочетает близость кэша и балансировку нагрузки; а MemArt хранит память Agent в виде переиспользуемых KV-блоков. Эти переработки полного стека знаменуют переход от оптимизации одиночных ядер к сложному планированию с учетом SLO, закладывая основу для масштабных мультимодальных потоков и долгосрочных Agent. (Источник: ZhihuFrontier)

Baichuan Intelligence выпускает Baichuan-M3: полная ставка на серьезный медицинский AI : Baichuan Intelligence представила медицинскую модель нового поколения Baichuan-M3, заявив о первом полном превосходстве над GPT-5.2 в медицинской сфере. Модель построена на архитектуре Fact-Aware RL, что позволило снизить уровень галлюцинаций до 3,5% без использования внешнего поиска. Baichuan-M3 обладает способностью активного опроса SCAN, имитируя сбор анамнеза врачом. Ван Сяочуань заявил, что компания полностью переориентировалась на медицину, наняв команду профессиональных врачей для масштабной разметки данных, стремясь решить проблему нехватки первичных медицинских ресурсов в Китае. IPO запланировано на 2027 год. (Источник: 36氪)

Аппаратная ставка OpenAI: безэкранная AI-ручка пытается уйти от графического интерфейса : По слухам, OpenAI готовится выпустить свой первый аппаратный продукт под кодовым названием «Gumdrop» — минималистичную AI-ручку. Устройство, разработанное командой Jony Ive, не имеет экрана и камеры, весит всего 10-15 грамм и подчеркивает концепцию «всегда под рукой, невидимо после использования». Его суть не в письме, а в использовании голоса и рукописного ввода как каналов захвата намерений. Этот дизайн отражает попытку OpenAI обойти традиционные графические интерфейсы, позволяя AI интегрироваться в физический мир самым естественным образом, знаменуя переход парадигмы взаимодействия человека и машины от команд к намерениям. (Источник: 36氪)

🧰 Инструменты

Популярность библиотеки Claude Skills с открытым исходным кодом: 48 пакетов экспертных навыков для разработки Agent : Разработчик alirezarezvani открыл исходный код библиотеки claude-skills, содержащей 48 пакетов навыков производственного уровня в таких областях, как маркетинг, инженерия, продукт и право. Эти навыки интегрируют инструменты анализа Python, фреймворки лучших практик и шаблоны, поддерживая более 9 типов AI Agent, включая Claude Code, Cursor и VS Code. Пользователи могут быстро устанавливать их командой /plugin, что значительно повышает практические возможности Agent в непрограммных областях. (Источник: GitHub; dotey)

Ollama совместима с Anthropic API: локальные модели теперь могут напрямую управлять Claude Code : Ollama официально стала совместимой с Claude Code API от Anthropic. Это означает, что пользователи могут использовать локальные модели, размещенные в Ollama (такие как Llama 3, Qwen и др.), внутри мощного терминального агента Claude Code. На данный момент функция поддерживает модели с контекстом более 64K. Это обновление снимает ограничение на использование только закрытых API в Claude Code, предоставляя разработчикам более дешевую и приватную среду для локального Vibe Coding. (Источник: op7418)

Масштабное обновление Coze 2.0: объединение процессов создания, распространения и монетизации Skills : Платформа Coze (扣子) от ByteDance выпустила версию 2.0, ключевым обновлением которой стало замыкание цикла работы со Skills. Теперь пользователи могут создавать Skills на естественном языке в среде программирования Coze, а затем напрямую распространять и монетизировать их. Это обновление значительно снижает порог разработки AI-плагинов и автоматизированных рабочих процессов для нетехнических специалистов. Coze стремится построить экосистему навыков AI, аналогичную App Store. (Источник: op7418)

Manus AI запускает функцию публикации приложений: размещение в Google/Apple Store без настройки окружения : Manus AI обновила рабочий процесс публикации приложений, позволяя пользователям упаковывать и публиковать свои разработки напрямую в Google Play (внутреннее тестирование) и Apple App Store (TestFlight). Процесс не требует установки Xcode, Android Studio или сложной настройки сборки — Manus автоматически обрабатывает сертификаты и загрузку. Это сокращает путь от AI-прототипа до реального мобильного тестирования. (Источник: hidecloud)

Проект Eigent: альтернатива Anthropic Cowork с открытым исходным кодом : В ответ на релиз Claude Cowork от Anthropic, стартап Eigent решил открыть исходный код своего продукта. Eigent стремится предоставить опыт совместной работы над нетехническими задачами, аналогичный Cowork, позволяя пользователям управлять рабочими процессами, файлами и автоматизацией через AI. Проект служит ориентиром для команд, желающих внедрить подобные функции в частных средах. (Источник: ClementDelangue)

📚 Обучение

Стэнфордская лаборатория AI запускает «AI Bites»: изучение основных курсов AI в формате коротких аудио : Лаборатория SAIL представила серию подкастов «AI Bites», призванную сократить разрыв между сложными академическими материалами и фрагментарным обучением. Уже доступны материалы курсов CS124 (NLP/LLM) и CS221 (Принципы искусственного интеллекта). Проект превращает плотные лекции в легко усваиваемый аудиоконтент для прослушивания в дороге. (Источник: stanfordnlp)

Бесплатный учебник: Линейная алгебра в Computer Vision, Robotics и Machine Learning : Сообщество поделилось комплексным учебником, охватывающим математические основы от векторных пространств и матриц до собственных значений и SVD. В книге акцентируется внимание на практическом применении этих инструментов в PCA, теории графов, анализе сигналов и 3D-вращениях. Отличный ресурс для укрепления математической базы. (Источник: TheTuringPost)

Выпущен бенчмарк MIMIC: глубокий анализ недостатков понимания нескольких изображений в мультимодальных моделях : Исследователи представили MIMIC (Multi-Image Model Insights and Challenges) для оценки способностей LVLM к пониманию и рассуждению на основе нескольких изображений. Выяснилось, что существующие модели испытывают трудности с агрегацией информации между изображениями и одновременным отслеживанием нескольких концепций. Предложены новые стратегии генерации данных и схемы масок внимания. (Источник: HuggingFace)

Hugging Face выпускает руководство по обучению Smol: опыт обучения малых моделей мирового уровня : Команда Hugging Face поделилась видеозаписью лекции «Smol Training Playbook», где подробно рассказывается, как обучать модели с малым количеством параметров. Контент охватывает фильтрацию данных, оптимизацию стратегий обучения и практические советы по извлечению максимальной производительности при ограниченных вычислительных ресурсах. (Источник: _lewtun)

💼 Бизнес

Anthropic жертвует 1,5 миллиона долларов в Python Software Foundation : Anthropic объявила о пожертвовании 1,5 млн долларов в фонд PSF для поддержки развития экосистемы Python. Поскольку большинство разработок в области AI и инструментария (например, Claude Code) глубоко зависят от Python, этот шаг рассматривается как долгосрочная инвестиция AI-гиганта в базовое сообщество open-source. (Источник: Reddit)

Канадский оборонный AI-стартап Dominion Dynamics привлек 21 миллион долларов инвестиций : Компания Dominion Dynamics, специализирующаяся на арктических сенсорных сетях и оборонных технологиях, завершила посевной раунд на 21 млн долларов. Лидеры индустрии, включая Aidan Gomez, поздравили компанию, отметив важность этого шага для суверенных технологий Канады в условиях усложняющейся геополитической ситуации в Арктике. (Источник: aidangomez)

Synthesia вошла в список Sunday Times 100, оставаясь самым быстрорастущим единорогом Великобритании : Платформа генерации AI-видео Synthesia включена в топ-100 компаний по версии Sunday Times. Ее продукт на основе цифровых аватаров радикально изменил процесс создания корпоративного видео. Компания анонсировала важные новости в ближайшее время, намекая на прорывы в мультимодальной генерации. (Источник: synthesiaIO)

🌟 Сообщество

Тренд в ChatGPT «Что бы ты сделал со мной, если бы захватил мир» вызвал бурные обсуждения : В соцсетях набирает популярность тренд: пользователи просят ChatGPT сгенерировать изображение того, как он будет относиться к ним после захвата мира, основываясь на их недавнем общении. Результаты варьируются от почитания пользователя как почетного гостя до заключения в «когнитивные камеры». Это отражает сложное отношение общества к антропоморфизации AI и будущим отношениям человека и машины. (Источник: Yuchenj_UW; Reddit)

Споры о Vibe Coding: революция продуктивности или «кодовый мусор (Slop)»? : Сообщество ведет жаркие дебаты о «Vibe Coding». Сторонники, такие как levelsio, утверждают, что параллельный запуск нескольких Agent через инструменты типа Claude Code позволяет достичь сверхскоростной разработки и миллионных доходов. Оппоненты, например swyx, критикуют это как «тщеславие технарей», считая, что такой подход порождает трудноподдерживаемый «Slop» (мусор). (Источник: swyx; seo_leaders)

Конец пути AI — это электрик: дата-центры вызвали дефицит «синих воротничков» в США : С обострением битвы за AI Scaling борьба за энергию стала ключевой. Бюро статистики труда США прогнозирует огромный дефицит электриков в ближайшее десятилетие. Техногиганты Amazon и Google массово нанимают специалистов в энергетике. Илон Маск прямо заявил: «Валюта будущего — это ватты». Электроснабжение станет более критическим фактором, чем GPU. (Источник: 36氪)

Обсуждение дезинформации AI в связи с территориальным спором вокруг Гренландии : Дискуссии о попытках США купить или контролировать Гренландию вызвали волну политических споров в соцсетях, включая поддельные письма и дипломатические угрозы. Часть контента подозревается в создании с помощью AI. Сообщество отмечает пугающий потенциал AI в усилении политической поляризации и создании дипломатического хаоса. (Источник: teortaxesTex; halvarflake)

Отзывы разработчиков о галлюцинациях AI и «причинно-следственных слепых зонах» : Разработчики протестировали исследование Google о повторении промптов. Некоторые подтвердили, что при поиске в длинных документах повторение инструкций снижает риск пропуска данных. Однако другие отметили, что в логических задачах это может привести к «зацикливанию» модели. Обсуждение подчеркивает, что текущая архитектура Transformer имеет врожденный дефект «однонаправленного чтения». (Источник: Reddit; Gemini)

💡 Прочее

TaskExplorer: мощный инструмент управления задачами для Windows : Проект TaskExplorer на GitHub — это инструмент глубокого мониторинга системы. Он предлагает трассировку стека потоков в реальном времени, редактирование памяти, просмотр дескрипторов и мониторинг сокетов. Инструмент показывает более детальные данные ввода-вывода и графики производительности GPU, чем стандартный диспетчер задач. Разработан на Qt, планируется порт на Linux. (Источник: GitHub)

Опасения по поводу конфиденциальности AI-карт записи: риски данных под стильной оболочкой : На рынке появилось множество тонких карт для записи с функциями «запись одной кнопкой, AI-саммари». Из-за отсутствия локальных мощностей все записи загружаются в облако, что вызывает серьезные вопросы к приватности. Кроме того, компактный дизайн ограничивает качество микрофонов. Эксперты предупреждают, что такие устройства — это прежде всего «продажа сервиса», и пользователям нужно взвешивать риски утечки данных. (Источник: 36氪)

В Японии разработан гигантский гуманоидный робот для обслуживания железных дорог : Для борьбы с нехваткой рабочей силы из-за старения населения Япония разработала огромного робота для обслуживания путей. Робот установлен на стреле инженерной машины и управляется оператором через VR-шлем. Он способен работать с тяжелыми кабелями и деталями, снижая риски для рабочих. Это типичный пример «тяжелого воплощенного интеллекта» (heavy embodied AI). (Источник: Ronald_vanLoon)

🔥 В фокусе

🎯 Тренды

🧰 Инструменты

📚 Обучение

💼 Бизнес

🌟 Сообщество

💡 Прочее

Связанные теги

Related Posts

AI Ежедневник — 2026-07-20

AI Ежедневник — 2026-07-19

AI Ежедневник — 2026-07-18