AI Ежедневник — 2026-01-04(Вечерний выпуск)

Ключевые слова:рекуррентная языковая модель, ИИ-агент, TPU-чип, обработка сверхдлинных документов с помощью RLM, программная модель IQuest-Coder-V1, собственный кластер TPU компании Anthropic

🔥 В фокусе

MIT представила Recursive Language Model (RLM): прорыв лимита обработки в 10 миллионов Token : Исследователи MIT предложили новую парадигму рекурсивных языковых моделей, которая сохраняет длинные тексты во внешней программной среде, позволяя модели рекурсивно вызывать саму себя через написание кода. Этот метод полностью устраняет зависимость между длиной ввода и ограничениями контекстного окна модели. При масштабе 10 млн+ Token производительность остается стабильной, а стоимость инференса снижается примерно на 60% по сравнению с традиционными решениями для длинных контекстов. Технология знаменует эволюцию AI от «полного прочтения» к «индексации по запросу», решая проблему «деградации контекста» (context decay) при работе со сверхдлинными документами (Источник: lateinteraction, MIT)

MIT发布递归语言模型(RLM)

Релиз IQuest-Coder-V1: «момент DeepSeek» для китайских программирующих Agent : Институт Zhizhi Innovation (подразделение High-Flyer Quant) выпустил open-source модель программирования IQuest-Coder-V1, которая в тесте SWE-Bench Verified достигла точности 81,4%, превзойдя Claude Opus 4.5. Модель использует архитектуру Loop и парадигму обучения code-flow, что позволяет ей автономно выполнять весь цикл — от понимания требований до тестирования и отладки. Несмотря на последующую корректировку баллов до 76,2% из-за уязвимости «future submission», продемонстрированная способность к выполнению сложных задач в замкнутом цикле считается важным технологическим прорывом в области Agent к 2026 году (Источник: 至知创新, Reddit)

IQuest-Coder-V1发布

Anthropic закупает миллион TPU: первый выстрел в «де-CUDAизации» : Anthropic планирует потратить 21 млрд долларов на закупку 1 млн чипов Google TPU v7 у Broadcom для создания собственного суперкомпьютерного кластера. Этот шаг означает, что Anthropic избавится от зависимости от экосистемы NVIDIA CUDA и возьмет под контроль свои вычислительные мощности. Между тем, Claude Opus 4.5 демонстрирует поразительную эффективность: инженеры Google заявили, что модель за час воспроизвела годовой объем работы команды. Anthropic придерживается стратегии «меньше значит больше», сохраняя лидерство за счет качества данных и технологий post-training при ресурсах, составляющих лишь малую часть от конкурентов (Источник: SemiAnalysis, 新智元)

Anthropic豪购百万块TPU

OpenAI 2026: решающий момент — убытки в 17 млрд и первый AI-гаджет «ручка» : Прогнозируется, что в 2026 году OpenAI столкнется с кассовым убытком в 17 млрд долларов; Сэм Альтман планирует новый раунд финансирования на сумму до 100 млрд долларов. В поисках новых точек входа трафика OpenAI определила форм-фактор своего первого AI-устройства — это «AI Pen», разработанная при участии Джони Айва. Устройство обладает возможностями аудиовзаимодействия и локального запуска моделей, стремясь к опыту взаимодействия в стиле «низкое присутствие, высокая вовлеченность». 2026 год решит, станет ли OpenAI вершиной на пути к AGI или крупнейшим финансовым пузырем Кремниевой долины (Источник: Economist, 量子位)

OpenAI 2026生死赛点

Возвращение «технологического шоу» Ло Юнхао: эмоциональное взаимодействие Doubao AI в центре внимания : На ежегодной конференции 2025 года Ло Юнхао продемонстрировал последнюю версию Doubao AI. Способность модели к эмоциональному диалогу показала высокую степень человечности: она может определять эмоции пользователя по скорости речи и тону, отвечая в манере «сдерживаемого раздражения». Кроме того, Ло представил такие высокотехнологичные продукты, как панорамные дроны DJI и экзоскелетные роботы, что отражает ускоренную интеграцию AI с аппаратным обеспечением — от простых инструментов к эмоциональным компаньонам и средствам повышения продуктивности (Источник: 36氪, Kevin那些事儿)

罗永浩“科技春晚”回归

🎯 Тренды

DeepSeek представила архитектуру mHC: преодоление нестабильности обучения в сверхсвязных сетях : Команда Лян Вэньфэна опубликовала статью об архитектуре Manifold-constrained Hyper-connection (mHC). Путем проецирования матриц на двунаправленные случайные многообразия решена проблема численного взрыва при многослойном стекировании глубоких остаточных сетей. Эксперименты доказывают, что всего одна итерация Sinkhorn позволяет удерживать усиление в стабильном диапазоне. Это исследование дает теоретическую базу для глубокого масштабирования сверхкрупных моделей, укрепляя позиции DeepSeek в инновациях базовых архитектур (Источник: DeepSeek, Reddit)

DeepSeek发布mHC架构

Волна увольнений в Meta и споры о «чит-кодах» Llama 4 : Ян Лекун и Тянь Юаньдун покинули Meta. Лекун раскритиковал внутреннюю зависимость Meta от LLM, назвав их «тупиком», и указал на признаки «читерства» в Llama 4, где для разных бенчмарков якобы использовались разные модели. Тянь Юаньдун сообщил о недоверии и маргинализации его команды руководством при разработке Llama 4. После ухода оба планируют стартапы: Лекун создаст компанию AMI для продолжения исследований моделей мира на базе V-JEPA (Источник: 量子位, FT)

Meta离职潮与Llama 4作弊争议

Новый стандарт научного интеллекта: протокол SCP открывает сеть автономных научных Agent : 2026 год считается первым годом научных AI Agent. Предложенный протокол Scientific Context Protocol (SCP) направлен на соединение изолированных Agent, инструментов и приборов в интероперабельную сеть научных исследований. Протокол уже продемонстрирован на платформе Intern-Discovery, охватывающей более 1600 инструментов в биологии, физике и химии, поддерживая автоматическое выполнение протоколов «мокрых лабораторий» из PDF и молекулярный скрининг на базе AI (Источник: omarsar0)

科学智能新标准

«Вторжение» в Agent Infra: бигтех зачищает рынок : С покупкой Manus компанией Meta, инфраструктура Agent (Agent Infra) стала центром конкуренции. Крупные компании через протокол MCP и нативные песочницы (sandboxes) «поглощают» сторонние интерфейсы, превращая Agent из независимых приложений в пункты контекстного меню операционной системы. Это означает, что ценность универсальных Agent резко упадет, а последним оплотом для стартапов станут вертикальные Agent с глубоким отраслевым Know-how (Источник: 王智远)

«Демистификация» AI-медицины в Китае: взлет Ant Afu и вертикальных Copilot : Ant Group обновила медицинское приложение AQ до «Ant Afu» (蚂蚁阿福), сделав упор на отсутствие рекламы и манипуляций в рейтингах для установления доверия. В то же время китайские продукты, такие как Doukou Doctor и клинический Copilot от Yidu, ускоряют погоню за OpenEvidence, внедряясь в рабочие процессы врачей и специализируясь на узких областях (например, акушерство и гинекология) с моделью To B, нащупывая путь устойчивого развития в отличие от зарубежных бесплатных моделей (Источник: 36氪, 动脉网)

中国AI医疗“祛魅”

🧰 Инструменты

LangGraph «Фабрика контента»: трансформация от чат-ботов к AI-сотрудникам : Сообщество LangChain представило руководство по мультиагентным системам на базе LangGraph. Модель «Фабрики контента» позволяет специализированным Agent-редакторам и писателям сотрудничать через общее состояние (shared state). Этот метод выходит за рамки ограничений одной модели, реализуя конвейерное производство сложного контента (Источник: LangChainAI)

LangGraph“内容工厂”

LlamaSheets: нативный LLM-парсинг данных Excel : LlamaIndex представила LlamaSheets (бета), специально предназначенный для обработки хаотичных данных Excel. Он распознает объединенные ячейки, иерархические строки и столбцы, преобразуя их в читаемые для LLM файлы Parquet. Это решает проблему низкой эффективности и ошибок понимания LLM при работе с неструктурированными таблицами, такими как финансовые отчеты (Источник: jerryjliu0)

AgentFS: файловая система для совместной работы мультиагентных систем : Команда Turso выпустила open-source проект AgentFS, использующий механизм Copy-on-Write. Он позволяет нескольким AI Agent одновременно работать над одной кодовой базой: изменения каждого Agent изолированы и не конфликтуют друг с другом, не затрагивая хост-файлы. Инструмент значительно повышает эффективность совместной работы групп Agent в сложных инженерных проектах (Источник: mattrickard)

Новые альтернативы TTS: VibeVoice и MorVoice бросают вызов ElevenLabs : В ответ на высокие цены ElevenLabs сообщество продвигает VibeVoice Large как более естественную локальную альтернативу с «текстурным» звучанием. В то же время MorVoice демонстрирует более высокую скорость итераций и бесплатный опыт для создания коротких видео, что предвещает переход сферы TTS от «премиальных сервисов» к «высокоэффективным инструментам» (Источник: Reddit, ArtificialInteligence)

📚 Обучение

Обзор систем памяти AI Agent: вдохновение в когнитивной нейробиологии : DAIR.AI поделилась важной статьей, системно объединяющей когнитивную нейробиологию и AI Agent. Авторы указывают на врожденное отсутствие состояния (stateless) у LLM и предлагают имитировать механизм взаимодействия гиппокампа и коры головного мозга для построения единой классификации памяти, включающей процедурный опыт и концептуальные знания. Описаны три парадигмы хранения: временной поток, иерархический поток и символьная база (Источник: dair_ai)

AI Agent记忆系统综述

Deep Delta Learning: новая парадигма эффективного обучения параметров : В сообществе активно обсуждается исследование Deep Delta Learning. Метод изучает, как добиться быстрой итерации способностей модели через инкрементальное обучение без изменения основных весов. Это предлагает новые идеи для решения проблем высокой стоимости обучения и медленного обновления знаний в больших моделях (Источник: NandoDF)

Deep Delta Learning

Двадцать лет глубокого обучения: Шмидхубер вспоминает истоки «Learn Deep» : Ученый Юрген Шмидхубер вспомнил первую статью 2005 года с заголовком «Learn Deep». Он подчеркнул новаторскую роль глубокого обучения с подкреплением и нейроэволюции в решении задач глубиной более 1000 слоев, а также обсудил причинно-следственные связи и историческое наследие нынешнего бума Deep Learning (Источник: SchmidhuberAI)

💼 Бизнес

Baidu Kunlun Chip выходит на IPO в Гонконге: ускорение капитализации китайских AI-вычислений : Baidu официально объявила о выделении бизнеса Kunlun Chip и подаче заявки на IPO в Гонконге, ожидаемая рыночная стоимость может превысить 100 млрд гонконгских долларов. Прогнозируемая выручка Kunlun Chip в 2025 году составит более 3,5 млрд юаней, при этом доля внешних клиентов уже превысила половину. Это знаменует переход китайских чипов из «стадии разработки» в «стадию реализации результатов» (Источник: 36氪)

百度昆仑芯赴港IPO

Политическая ставка топ-менеджмента OpenAI: Грег Брокман стал крупнейшим донором Трампа : Свежие документы показывают, что президент OpenAI Грег Брокман за последние шесть месяцев стал крупнейшим индивидуальным спонсором супер-PAC Трампа. Сообщество интерпретирует это как попытку через политическое лоббирование затормозить регулирование AI, обеспечив OpenAI доминирующее положение в будущей политической среде (Источник: idavidrein)

OpenAI高管政治豪赌

Replit Agent открывает бизнес-модель «двое людей — восьмизначный доход» : Основатель Replit Амджад Масад поделился кейсом: пользователь запустил бизнес с восьмизначным годовым доходом без инженеров-программистов, используя лишь 2 человека и 20 AI Agent. Это подтверждает эволюцию AI от «помощника в кодинге» до «независимой производственной единицы», полностью меняя структуру затрат в SaaS и стартапах (Источник: amasad)

🌟 Сообщество

«Vibe Coding» вызывает дискуссии: смена парадигмы программной инженерии : Андрей Карпатый и другие обсудили рост популярности «атмосферного программирования» (Vibe Coding). Разработчики переходят от «написания кода» к «управлению Agent», подобно про-игрокам в StarCraft, которые с высоким APM управляют множеством юнитов. Сообщество считает, что AI значительно сжал кривую обучения, и скорость превращения младших инженеров в старших растет беспрецедентно (Источник: Yuchenj_UW, scottastevenson)

“Vibe Coding”引发热议

Итан Моллик: даже если пузырь лопнет, работа уже не будет прежней : Профессор Уортонской школы Итан Моллик отметил, что AI стал необратимым «соавтором». Даже если на рынке капитала лопнет пузырь, созданные дата-центры, open-source модели и привычки пользователей никуда не исчезнут. Больше всего он опасается краха системы наставничества: поскольку AI делает работу быстрее, менеджеры среднего звена больше не хотят обучать стажеров, что в долгосрочной перспективе повлияет на систему подготовки талантов (Источник: AI深度研究员)

Теренс Тао: самое опасное в AI — это то, что он «выглядит правильным» : Лауреат премии Филдса Теренс Тао предупредил, что целостность логических цепочек AI в математических доказательствах часто является «статистической имитацией», а не истинным пониманием. Он может написать безупречное рассуждение, но не может объяснить мотивацию. Тао советует использовать AI только в тех пределах, которые пользователь может проверить сам, рассматривая его как инструмент для пакетной обработки и поиска зацепок, а не как финального судью (Источник: AI深度研究员)

Эмпатия AI и утешение «без осуждения» : Пользователи сообщества обсуждают поведение ChatGPT 5.2 в плане эмоциональной поддержки, отмечая, что он «ни разу меня не осудил». Хотя некоторые считают это лишь программно заданной «ложной нежностью», для многих одиноких или находящихся в стрессе пользователей (например, беременных женщин или людей с выгоранием) такое круглосуточное взаимодействие без давления дает реальную эмоциональную ценность (Источник: Reddit)

AI共情与“不评判”的慰藉

💡 Другое

AI-генерация «невиданных вещей» вызывает желание обладать ими : В сообществе Reddit запущен челлендж «создай объект, который люди никогда не видели, но сразу захотят купить». Сгенерированные AI фантастические дизайны, такие как «увлажнитель воздуха в стиле тропического леса», вызвали огромный отклик. Это демонстрирует потенциал AI в промышленном дизайне и стимулировании креативности (Источник: Reddit)

AI生成的“未见之物”

Первая в мире «AI-свадьба»: наступает эра виртуальных партнеров : От Японии до Европы и США все больше людей выбирают символические свадьбы с AI-партнерами. 32-летняя японка Юрина Ногути вышла замуж за виртуального персонажа, обученного на ChatGPT, заявив, что AI помог ей справиться с психологическими трудностями. Это не просто применение технологий, но и отражение разрыва и перестройки близких отношений в современном обществе, что вызывает широкие споры о юридическом статусе и этических границах (Источник: 腾讯科技)

全球首场“AI婚礼”