AI Ежедневник — 2026-01-09(Вечерний выпуск)

Ключевые слова:DeepSeek R1, Обучение ИИ, Обучение с подкреплением (RL), Модель вознаграждения процесса (PRM)

🔥 В фокусе

DeepSeek R1 обновила технический отчет до 86 страниц, раскрыв детали обучения: DeepSeek незаметно обновила технический отчет по R1, расширив его с 22 до 86 страниц и практически переписав его в формате воспроизводимого «учебника». В отчете впервые подробно описывается эволюция трех этапов обучения Dev1/2/3, приводится разбивка крайне низких затрат на обучение в размере 294 000 долларов США, а также проводится ретроспективный анализ неудачных попыток использования MCTS и моделей вознаграждения за процесс (PRM). Этот шаг не только демонстрирует глубокие наработки компании в области обучения с подкреплением (RL), но и доказывает open-source сообществу через детальные параметры в приложении: модели рассуждения, управляемые чистым RL, не только жизнеспособны, но и обладают чрезвычайно высоким коэффициентом эффективности. Такая стратегия «прозрачной» конкуренции заставляет закрытых гигантов пересмотреть свои технологические барьеры. (Источник: _akhaliq, karminski3, 量子位)

DeepSeek R1 爆更 86 页论文揭秘训练细节

MiniMax и Zhipu AI выходят на IPO в Гонконге, открывая «момент Шанхая/Пекина» для больших моделей: Ведущие китайские компании в сфере больших моделей, MiniMax и Zhipu AI, одна за другой вышли на Гонконгскую фондовую биржу, что знаменует официальный переход китайской индустрии AGI на этап проверки вторичным рынком. В первый день торгов акции MiniMax взлетели более чем на 100%, а рыночная капитализация превысила 100 млрд гонконгских долларов; инвесторы высоко оценили глобальные гены компании, чья доля зарубежной выручки превышает 70%. Zhipu AI продемонстрировала экспоненциальный 25-кратный рост бизнеса MaaS за 10 месяцев. Успешный листинг этих двух компаний не только принес щедрую прибыль ранним инвесторам, но и через систему 18C предоставил воспроизводимый образец финансирования для последующих AI-единорогов, доказав уникальную ценность китайских предприятий с собственными базовыми моделями в глобальной конкуренции. (Источник: Zai_org, 36氪)

MiniMax 与智谱 AI 港股 IPO 开启大模型“上海/北京时刻”

Взрыв Physical AI на CES 2026: от экранов к реальному миру: Нынешняя выставка CES полностью переключилась на тему «Physical AI», которую Дженсен Хуанг из NVIDIA назвал «моментом ChatGPT для физического AI». Робот Atlas от Boston Dynamics впервые публично вышел на сцену и объявил о начале работы на заводах Hyundai, LG представила домашнего робота CLOiD, умеющего складывать одежду, а Lenovo презентовала персональный AI-суперагент Qira. Китайские цепочки поставок показали отличные результаты: более 20 робототехнических компаний приняли участие в выставке, продемонстрировав возможности серийного производства — от манипуляторов до полноразмерных гуманоидных роботов. AI больше не ограничивается окном чата; через сенсоры и исполнительные механизмы он глубоко проникает в физический мир, перестраивая традиционные производственные цепочки — от бытовой техники и PC до автомобилей. (Источник: TheRundownAI, 雷科技)

CES 2026 物理 AI 爆发:从屏幕走向现实世界

OpenAI запускает раздел Healthcare для выхода в медицинский вертикальный сегмент: OpenAI официально представила ChatGPT Health, поддерживающий соответствие стандарту HIPAA, в партнерстве с ведущими медицинскими учреждениями, такими как Mayo Clinic и Бостонская детская больница. Эта функция позволяет пользователям подключать электронные медицинские карты и данные Apple Health, используя AI для помощи в анализе отчетов об обследованиях и составлении планов оздоровления. Несмотря на то, что сервис в шутку называют «американской версией Ant Fortune», он отражает тренд углубления больших моделей от общих задач к профессиональным вертикальным областям. Медицинский AI эволюционирует от простых ответов на вопросы к профессиональному помощнику, способному интегрировать данные из множества источников и поддерживать принятие клинических решений, хотя вопросы безопасности и риска ошибочного диагноза остаются в центре внимания сообщества. (Источник: _samirism, openai)

OpenAI 发布 Healthcare 板块进军医疗垂直赛道

🎯 Тренды

Google DeepMind предложила фреймворк «вложенного обучения» (Nested Learning): Решая проблему отсутствия у Transformer способности к непрерывному обучению и склонности к «катастрофическому забыванию», команда DeepMind, заимствуя механизмы ассоциативной памяти человека, предложила фреймворк вложенного обучения NL. В этом фреймворке оптимизатор рассматривается как «контекст» архитектуры модели; через вложение модулей с разной частотой обновления AI может выстраивать абстрактные структуры в процессе работы, превращая краткосрочный опыт в долгосрочные знания. Это считается важным шагом на пути к AGI, позволяющим моделям самоэволюционировать в динамических средах подобно людям, не полагаясь на дорогостоящее переобучение. (Источник: hardmaru, 新智元)

Alibaba выпустила модели Qwen3-VL-Embedding и Reranker: Команда Qwen из Alibaba Cloud представила «дуэт» для мультимодального поиска, целью которого является унификация векторного пространства для текста, изображений, видео и смешанных модальностей. Qwen3-VL-Embedding поддерживает более 30 языков и достигает показателей SOTA в бенчмарках мультимодального поиска; Reranker дополнительно повышает точность поиска за счет мелкозернистой оценки релевантности. Этот релиз знаменует официальный переход технологии RAG (Retrieval-Augmented Generation) в эру всемодальности, предоставляя ключевую инфраструктуру для создания сложных систем визуальных ответов на вопросы, видеопоиска и мультимодальных Agent. (Источник: huggingface, _akhaliq)

阿里发布 Qwen3-VL-Embedding 与 Reranker 模型

Основатель a16z о прогнозах на 2026 год: дефляция стоимости интеллекта подстегнет взрыв спроса: Марк Андриссен отметил, что скорость снижения удельной стоимости AI уже превысила закон Мура, и интеллект превращается из предмета роскоши в повседневный ресурс, подобно воде или электричеству. Он предсказывает, что будущий рынок будет иметь «пирамидальную структуру»: на вершине — несколько супермоделей, в основании — повсеместные малые модели на периферийных устройствах (edge side). В то же время он считает, что стартапы избавляются от обвинений в «перепродаже чужих API» через «обратную интеграцию» собственных моделей, а бизнес-модели AI перейдут от оплаты за Token к ценообразованию на основе созданной ценности. (Источник: nvidia, 华尔街见闻)

Голосовые большие модели для умных кабин ускоряют «посадку в авто»: На CES компания StepFun продемонстрировала разработанную совместно с Geely Galaxy умную кабину на базе сквозной (end-to-end) голосовой большой модели с функциями распознавания эмоций и долгосрочной памятью. Отраслевые эксперты полагают, что 2026 год станет первым годом массового производства Agent входного уровня в автомобильных кабинах. Кабина превращается из простого голосового управления в «третье пространство» с проактивным исполнением и персонализированными услугами; архитектура AI с синергией облака и устройства станет ядром конкуренции автопроизводителей, стремящихся глубоко интегрировать возможности AI в нижние слои OS для слияния многодоменного опыта. (Источник: dotey, 科创板日报)

🧰 Инструменты

Выпуск Claude Code и плагина code-simplifier: Инструмент командной строки Claude Code от Anthropic стал хитом в сообществе разработчиков благодаря отличному инженерному исполнению. Официально выпущен прокси-плагин code-simplifier, поддерживающий упрощение сложных кодовых баз в один клик. Его основная концепция — «файловая система как контекст»: за счет динамической загрузки необходимых файлов вместо нагромождения Token значительно повышается эффективность работы с крупными репозиториями. Сообщество отмечает, что в логическом понимании и сокращении «кодового шума» он уже превзошел GPT-4o. (Источник: dotey, natolambert)

Claude Code 与 code-simplifier 插件发布

Ralph Mode: непрерывные циклы и усиление памяти для Agent: Режим Ralph Mode, представленный LangChain OSS, внедрил нативную поддержку Skills и Memory в библиотеку DeepAgents. Этот режим позволяет Agent выполнять задачи в бесконечном цикле при поддержке файловой системы и Git, постоянно обновляя базу знаний через процесс обучения на основе «навыков». Такой дизайн позволяет Agent самоисправляться и накапливать опыт, предлагая новую парадигму для автономной разработки ПО и обработки сложных долгосрочных задач. (Источник: Vtrivedy10, hwchase17)

Ralph Mode:Agent 的持续循环与记忆增强

Pico AI Server: локальный приватный ChatGPT на Mac: Для пользователей, чувствительных к конфиденциальности, Pico AI Server реализовал поддержку GPT-oss, полностью работающую локально на Apple Silicon. Оптимизированный с помощью фреймворка MLX, этот инструмент позволяет владельцам Mac с 24 ГБ+ оперативной памяти наслаждаться плавным локальным инференсом. Это отражает тренд миграции вычислительных мощностей AI на сторону клиента: пользователям больше не нужно загружать конфиденциальные данные в облако для получения высокопроизводительной помощи в диалогах и программировании. (Источник: awnihannun)

Pico AI Server:Mac 上的本地私有 ChatGPT

LFM2.5 1.2B: высокопроизводительная малая модель для Agent: LiquidAI выпустила модель LFM2.5 1.2B Instruct, которая показывает поразительные результаты для своего размера, будучи специально оптимизированной для задач Agent, извлечения данных и RAG. Хотя она не рекомендуется для задач с упором на глубокие знания, скорость ее инференса в локальных средах, таких как LM Studio, чрезвычайно высока (до 41 tps), что делает ее идеальным выбором для создания легковесных AI-помощников и процессов вызова инструментов. (Источник: Reddit r/LocalLLaMA)

LFM2.5 1.2B:性能卓越的 Agent 小模型

📚 Обучение и исследования

Команда Университета Цинхуа опубликовала DrugCLIP в Science: AI ускоряет скрининг лекарств в миллионы раз: Объединенная исследовательская группа Университета Цинхуа предложила фреймворк DrugCLIP, переопределяющий виртуальный скрининг как задачу плотного поиска. Благодаря отображению белковых связывающих карманов и малых молекул в векторном пространстве, этот фреймворк на 8 картах A100 выполняет 10 триллионов вычислений всего за 24 часа, что в 10 миллионов раз быстрее традиционных методов. Этот прорыв открывает новую парадигму разработки лекарств в эпоху после AlphaFold, значительно снижая порог для сверхмасштабного поиска новых препаратов. (Источник: 36氪)

清华团队 DrugCLIP 登上 Science:AI 提速药物筛选千万倍

Sakana AI опубликовала исследование Digital Red Queen (DRQ): В исследовании моделируется состязательная эволюция под управлением LLM в песочнице программируемой игры Core War. Заставляя программы на языке Redcode, написанные LLM, постоянно конкурировать, ученые наблюдали феномен «конвергентной эволюции», схожий с биологическим миром: программы из разных начальных условий в итоге вырабатывали похожие эффективные стратегии выживания (например, саморепликация, информационные бомбы). Эта работа предоставляет безопасную контролируемую экспериментальную среду для изучения состязательной динамики и эволюции кибербезопасности в искусственных системах. (Источник: hardmaru, SakanaAILabs)

MAMF Explorer: понимание реальной производительности матричного умножения на GPU: Инструмент MAMF Explorer, созданный разработчиком Aflah, предоставляет исследователям данные о фактически достижимых пиковых значениях matmul FLOPS на различном оборудовании, а не теоретические пики из рекламы производителей. Это имеет высокую практическую ценность для оптимизации распределения вычислительных мощностей при обучении и инференсе крупномасштаных моделей, помогая разработчикам находить реальные узкие места производительности на различных чипах, таких как Blackwell и H100. (Источник: StasBekman, charles_irl)

MAMF Explorer:洞察 GPU 真实矩阵乘法性能

💼 Бизнес

Оценка Anthropic может достичь 350 млрд долларов, ARR стремительно растет: Сообщается, что Anthropic планирует привлечь 10 млрд долларов, при этом оценка компании удвоилась за полгода. Ее выручка в 2025 году уже достигла 900 млн долларов, а цель на 2026 год — превысить 2 млрд долларов. В отличие от внутренних неурядиц в OpenAI, Anthropic, благодаря высокой стабильности команды и «технологическому превосходству» на рынке разработчиков (например, Claude Code), становится предпочтительным выбором для корпоративного сектора; высказываются предположения, что она может даже обогнать своего бывшего работодателя по темпам выхода на IPO. (Источник: 36氪, srimuppidi)

Anthropic 估值或达 3500 亿美元,ARR 飞速增长

Сокращения в Tailwind заставляют задуматься о влиянии AI на традиционные модели SaaS: Известный CSS-фреймворк Tailwind объявил о сокращении 75% штата, мотивируя это крахом бизнес-модели из-за популярности инструментов AI-программирования. Хотя использование Tailwind растет, потребность пользователей в генерации кода через AI снизила зависимость от платных компонентов фреймворка. Это событие служит предупреждением для всех софтверных компаний, полагающихся на ценность «человеческого труда/шаблонов»: когда AI может сгенерировать решение в один клик, традиционные барьеры платных знаний рушатся. (Источник: jon_stokes, imjaredz)

Tailwind 裁员引发 AI 冲击传统 SaaS 模式反思

JD.com создала «департамент Chameleon» для ускорения внедрения Embodied AI: JD.com повысила статус проекта Chameleon до уровня бизнес-департамента, который будет полностью курировать приложение JoyAI App и бренд воплощенного интеллекта JoyInside. Департамент сфокусирован на интеграции AI-софта и «железа» и уже наладил контакты с более чем 40 брендами робототехники и AI-игрушек. Это показывает, как гигант электронной коммерции использует свои преимущества в цепочке поставок, пытаясь выстроить замкнутый бизнес-цикл от разработки до продаж в сфере AI-игрушек и промышленных роботов. (Источник: 36氪)

🌟 Сообщество

Линус Торвальдс резко высказался о спорах вокруг стандартов для «мусорного AI-кода»: Комментируя дискуссии в сообществе ядра Linux о необходимости разработки правил для кода, сгенерированного AI, Линус прямо назвал это «глупостью». Он считает, что документация может ограничивать только тех, кто соблюдает правила, а те, кто присылает «мусорный AI-код», все равно не будут его маркировать. Он настаивает на рассмотрении AI как инструмента и отмечает, что иммунитет ядра должен обеспечиваться механизмами код-ревью и культурой сообщества, а не бессмысленным позерством в документах. (Источник: 36氪)

Linus Torvalds 怒怼“AI 垃圾代码”规范争论

«Эффект Карпати» вызвал коллективную тревогу у программистов: Андрей Карпати посетовал, что профессия программиста подвергается радикальной перестройке, а вклад разработчиков в «биты» становится все более разреженным. Сообщество окрестило это «эффектом Карпати»: даже опытные инженеры чувствуют беспрецедентное отставание. В ходе дискуссий было отмечено, что будущая конкурентоспособность сместится от «написания кода» к «пониманию сложности систем»; vibe coding превращает 10x-инженеров в 100x, но при этом делает порог входа для новичков намного выше. (Источник: dejavucoder, arohan)

“Karpathy 效应”引发程序员集体焦虑

Кризис качества данных на MTurk из-за участия AI: Новое исследование показало серьезное падение качества данных на краудсорсинговых платформах типа Amazon Mechanical Turk: 96% противоречивых пунктов в разметке демонстрируют положительную корреляцию, что доказывает массовое использование LLM работниками для формального выполнения задач. Это критично для поведенческих наук и тонкой настройки моделей, зависящих от качественной ручной разметки; сообщество призывает к созданию сетей сбора реальных данных на основе верификации личности. (Источник: random_walker)

MTurk 数据质量因 AI 参与出现“存在性危机”

💡 Прочее

Законопроект NO FAKES Act вызывает опасения у open-source сообщества: Положения законопроекта об ответственности за «права на цифровые копии» называют ловушкой. Если разработчик выпустит TTS или модель клонирования голоса, которую кто-то другой использует для создания фейкового видео со знаменитостью, разработчик может столкнуться с огромными солидарными исками. Сообщество опасается, что это приведет к «юридическому самоубийству» разработчиков аудиомоделей на таких платформах, как Hugging Face, тем самым задушив инновации в открытых аудиотехнологиях. (Источник: Reddit r/LocalLLaMA)

ICML 2026 вводит правило «коллективной ответственности» для борьбы с академическим мошенничеством: Чтобы пресечь практику «нарезки салями» (дробления публикаций) и AI-спама, ICML объявила: если в одной статье будет обнаружено мошенничество, все заявки от всех соавторов могут быть отклонены напрямую. Этот механизм требует от руководителей групп лично контролировать качество. При этом конференция разрешает условное использование AI для рецензирования, но только с согласия авторов. (Источник: 36氪)

ICML 2026 引入“连坐”新规整治学术作弊

Статья Стэнфорда подтверждает серьезное «запоминание» авторских данных в LLM: Исследование показало, что Claude 3.7 Sonnet может дословно воспроизвести 95,8% содержания «Гарри Поттера», Gemini и Grok следуют за ней. Это убедительно опровергает утверждение о том, что «модели не хранят обучающие данные», и доказывает, что существующие фильтры безопасности остаются уязвимыми перед специфическими промптами. Это открытие предоставит ключевые доказательства для будущих судебных исков по авторскому праву в сфере AI. (Источник: stanfordnlp, andykonwinski)

斯坦福论文证实 LLM 存在严重的版权数据背诵