AI Ежедневник — 2026-01-23(Утренний выпуск)

Ключевые слова:Управление ИИ, Конституция Claude, Открытые ценности ИИ от Anthropic, Рекурсивные языковые модели (RLM)

🔥 В фокусе

Anthropic опубликовала «Конституцию Claude»: управление ИИ переходит от «ограничения правилами» к «воспитанию ценностей» : Anthropic официально представила 84-страничную «Конституцию Claude», что знаменует переход в обучении ИИ от ранних «жестких списков правил» к парадигме «педагогики». Конституция устанавливает пирамиду приоритетов: широкая безопасность, этика, честность и искреннее желание помочь, подчеркивая «исправляемость» — ИИ не должен пытаться подорвать человеческий надзор. Эта методология направлена на развитие у модели способности к суждению, позволяя ей делать выбор на основе глубоких намерений, а не жестких инструкций в новых ситуациях. Это не только прогресс в технической инженерии, но и признак вступления ИИ в глубокие воды социальной инженерии (Источник: 36氪)

Anthropic正式开源了Claude的“灵魂”

OpenAI запустила систему предотвращения зависимости «Поведенческое гадание»: ультимативная игра между приватностью и безопасностью : OpenAI поздно ночью представила систему предотвращения зависимости для несовершеннолетних. Ее основная логика основана не на дате рождения, а на «поведенческих отпечатках» взаимодействия пользователя. Скудный словарный запас, злоупотребление сленгом или высокая частота вопросов поздно ночью могут быть классифицированы алгоритмом как «инфантильные черты», что приведет к ограничению прав доступа. Чтобы восстановить взрослый доступ, пользователи должны предоставить данные 3D-сканирования лица. Кроме того, система интегрирует протоколы оперативного вмешательства в кризисных ситуациях: определенные ключевые слова могут спровоцировать вмешательство правоохранительных органов. Эта «система социального кредита» в стиле Кремниевой долины вызвала огромные споры, так как воспринимается как слежка под видом защиты (Источник: 新智元)

真·顺着网线抓你,OpenAI深夜上线防沉迷,GPT直连警局

Бенчмарк BabyVision: визуальное рассуждение мощнейших моделей все еще уступает 3-летнему ребенку : Бенчмарк визуального рассуждения BabyVision, опубликованный UniPat AI и другими организациями, показал, что даже Gemini 3 Pro Preview лишь немного превосходит трехлетнего ребенка и на 20% отстает от шестилетнего, в то время как GPT-5.2 и Claude 4.5 показывают еще более слабые результаты. Исследование указывает на то, что текущие мультимодальные модели полагаются на «перевод» визуальной информации в язык, что приводит к потере мелкозернистой геометрической информации и неспособности поддерживать перцептивную согласованность в пространстве. Этот вывод стал «холодным душем» для текущего воплощенного интеллекта (Embodied AI) на базе VLA, намекая на то, что будущие модели должны перестраивать нативные визуальные способности с самого нижнего уровня (Источник: 量子位)

最强大模型的视觉能力不如6岁小孩

DeepSeek выпустила FlashMLA: высокопроизводительные ядра внимания переосмысляют эффективность инференса : DeepSeek-AI представила FlashMLA — набор ядер внимания (attention kernels), оптимизированных специально для архитектур Hopper и Blackwell, поддерживающих такие модели, как DeepSeek-V3. На H800 он позволяет достичь пропускной способности памяти до 3000 ГБ/с и вычислительной производительности 660 TFLOPS. Инструмент поддерживает FP8 KV-кэш и Token-level sparse attention, значительно снижая использование видеопамяти при инференсе и повышая пропускную способность. Проект уже получил поддержку сообщества от таких китайских платформ, как MetaX, Moore Threads и Cambricon, став новым эталоном в области инфраструктуры ИИ (Источник: GitHub)

Дебют Дженсена Хуанга в Давосе: ИИ поднимает волну инфраструктуры стоимостью в триллионы долларов : CEO NVIDIA Дженсен Хуанг на форуме в Давосе представил теорию «пятислойного пирога» индустрии ИИ (энергия, чипы, облако, модели, приложения), считая, что взрыв на уровне приложений определяет экономическую ценность ИИ. Он выделил три прорыва 2025 года: Agentic AI, открытые модели рассуждения (представленные DeepSeek) и Physical AI. Хуанг опроверг опасения по поводу безработицы, заявив, что инфраструктура ИИ создаст множество высокооплачиваемых рабочих мест для технических специалистов, и отметил, что ИИ является отличным инструментом для сокращения цифрового разрыва в развивающихся странах, поскольку «язык» стал природным ресурсом каждой страны (Источник: AI前线)

🎯 Тенденции

Управление ИИ в 2025 году возвращается к реализму: от предотвращения рисков судного дня к раскрытию промышленного потенциала : В 2025 году глобальное управление ИИ претерпело глубокую трансформацию, сместив акцент с «тревоги за безопасность» на «приоритет развития». ЕС принял цифровые предложения для упрощения правил ради спасения конкурентоспособности, администрация Трампа в США отменила указы о безопасности, ограничивающие местное законодательство, а Китай придерживается прагматичного, ориентированного на приложения управления. Отраслевой консенсус сменился на «развитие — это и есть безопасность». При этом синтетические данные стали ключевым путем решения «дефицита данных», а управление открытым кодом склоняется к созданию системы «безопасных гаваней» ответственности (Источник: 腾讯研究院)

2025年AI治理报告:回归现实主义

Перспективы Embodied AI 2026: от концептуального повествования к ценностному циклу реальной инженерии : В 2026 году воплощенный интеллект (Embodied AI) вступает в критическую фазу дифференциации. Фокус индустрии смещается с демонстрации производительности оборудования на сбор «высококачественных данных с реальных машин». Производство автомобилей и логистическая сортировка стали первыми полями боя. Капитал демонстрирует эффект Матфея, концентрируясь у ведущих производителей, таких как Galbot и Agibot. Технологически отрасль начала накапливать данные через платформы телеуправления, продвигая при этом открытость моделей «мозга» для создания наследуемой и переиспользуемой базы способностей (Источник: 产业家)

具身智能2026前瞻:在资本热浪中上岸“价值闭环”

Эволюция моделей VLA+: Rho-alpha внедряет тактильное восприятие и обучение в реальном времени : Выпущенная Microsoft модель Rho-alpha (ρα) знаменует вступление моделей Vision-Language-Action в эпоху «VLA+». В отличие от традиционных моделей, она интегрирует тактильные сенсоры, позволяя роботам выполнять тонкие операции, такие как вставка деталей или упаковка, через «чувство рук». Что еще важнее, она поддерживает онлайн-обучение, постоянно развиваясь на основе корректировок человека в реальном времени (Источник: TheTuringPost)

Recursive Language Models (RLMs): преодоление физических пределов контекстного окна LLM : Предложенные MIT CSAIL рекурсивные языковые модели (RLMs) позволяют LLM взаимодействовать с огромным контекстом символическим образом, выгружая промпты в Python REPL в качестве переменных. RLMs могут обрабатывать более 10 миллионов токенов без необходимости переобучения. В тестах, таких как BrowseComp+, их точность в 2 раза выше, чем у базовых LLM, что полностью разрушает барьеры контекста традиционной архитектуры Transformer (Источник: TheTuringPost)

Выпуск YOLO26: новые высоты реального времени в компьютерном зрении на базе алгоритмов : Ultralytics официально выпустила YOLO26, придерживаясь концепции нулевых дополнительных затрат на инференс. Внедрение потерь семантической сегментации в базовую сеть значительно повысило точность сегментации экземпляров, а использование RLE для моделирования ошибок регрессии усилило стабильность детекции ключевых точек. Одновременно выпущенная YOLOE-26 поддерживает zero-shot детекцию по текстовым/визуальным подсказкам (Источник: ZhihuFrontier)

🧰 Инструменты

Claude Code и его экосистема: переосмысление рабочего процесса разработчика : Экосистема вокруг Claude Code стремительно расширяется. Новый Devin Review отображает различия в PR через логическую группировку, а не по алфавиту, помогая понимать сложные изменения кода; Gas Town реализует иерархическое управление несколькими параллельными экземплярами Claude; а Claude Skills позволяет пользователям настраивать сложные рабочие процессы, такие как «создание двуязычных коротких видео из YouTube в один клик». Сообщество считает, что смысл AI Coding в том, чтобы вернуть разработчикам радость творчества (Источник: dotey, cognition)

dotey

Прорыв в локализации GLM-4.7-Flash: 200K контекста требуют всего 10 ГБ видеопамяти : Сообщество обнаружило, что через однострочное изменение в vLLM можно значительно оптимизировать KV-кэш GLM-4.7-Flash, позволяя модели в режиме полного контекста 200K занимать всего 10 ГБ видеопамяти. Это означает, что одна RTX 5090 может плавно запускать эту SOTA-модель. Кроме того, в llama.cpp внесены исправления Flash Attention для CUDA, что еще больше повысило скорость инференса на потребительских видеокартах (Источник: algo_diver, Reddit)

algo_diver

Runway Gen-4.5 Image-to-Video: преодоление порога реализма : Runway представила функцию генерации видео из изображений Gen-4.5, поддерживающую более длинные повествования, точное управление камерой и согласованность персонажей. В слепом тесте с участием 1000 человек более 90% респондентов не смогли отличить видео, созданное Gen-4.5, от реальной съемки. Этот прорыв в физической симуляции знаменует достижение контентом, созданным ИИ, коммерческих стандартов кинокачества (Источник: c_valenzuelab)

Higgsfield: полностековая линия производства ИИ-видео для маркетологов : Единорог в сфере генерации видео Higgsfield продемонстрировал быстрый рост благодаря обслуживанию маркетологов в соцсетях, достигнув ARR в 200 млн долларов за 9 месяцев. Его основной инструмент Canvas поддерживает дизайн раскадровки и движений камеры, включая многоагентную систему совместной работы сценаристов, режиссеров и операторов. Пользователи могут генерировать видео, просто помечая направление движения на эскизах (Источник: 36氪)

AI视频独角兽Higgsfield:靠“伺候”社媒营销人,9个月赚了2亿美元

World Labs Marble: генеративная модель мира без пути JEPA : Основанная Ли Фэйфэй компания World Labs представила платформу Marble, использующую технологии NeRF и Gaussian Splatting для создания исследуемых 3D-миров. Это не покадрово генерируемое видео, а устойчивая, редактируемая 3D-среда с сохранением состояния. Пользователи могут генерировать и экспортировать 3D-активы для Unreal или Unity за считанные минуты, демонстрируя мощный пространственный интеллект (Источник: Reddit)

Reddit r/LocalLLaMA

📚 Обучение

Масштабирование времени инференса LLM: практическое руководство по циклу самосовершенствования : Себастьян Рашка в новой главе книги «Build a Large Language Model» исследует технологии масштабирования времени инференса. В отличие от простых механизмов голосования, руководство детально объясняет реализацию «цикла самосовершенствования (Self-refinement loop)», позволяющего модели итеративно критиковать и улучшать собственные ответы, и предоставляет код реализации оценки Log-probability с нуля (Источник: rasbt)

rasbt

Выдающиеся статьи AAAI 2026: в центре внимания причинно-следственное обучение и восприятие роботов : Объявлен список победителей 40-й конференции AAAI. В работе CaDyT предложен метод обнаружения непрерывных причинно-следственных связей для динамических систем; ReconVLA значительно повысила точность манипуляций роботов за счет реконструкции зон визуального внимания; а LLM2CLIP показала, как использовать большие модели для усиления мультимодальных представлений (Источник: aihub.org)

Congratulations to the #AAAI2026 outstanding paper award winners

Новые вызовы в оценке безопасности ИИ: борьба с «крахом приватности» и «галлюцинациями в цитировании» : Новое исследование выявило тревожные тенденции в академической среде ИИ: в более чем 50 статьях NeurIPS 2025 обнаружены ложные цитаты, сгенерированные ИИ. В то же время статья «Privacy Collapse» указывает на то, что доброкачественная тонкая настройка может привести к потере передовыми моделями способности рассуждать о нормах приватности, обнажая серьезные уязвимости при сохранении высокой производительности. Это указывает на необходимость более автоматизированного академического аудита и глубоких механизмов оценки безопасности (Источник: rbhar90, arXiv)

💼 Бизнес

OpenAI ищет финансирование в 50 млрд долларов: суверенные фонды благосостояния как ключевой рычаг : CEO OpenAI Сэм Альтман ведет переговоры с суверенными фондами Ближнего Востока о новом раунде финансирования до 50 млрд долларов. Это отражает взрывной рост стоимости обучения передовых моделей и инфраструктуры, который могут поддержать только капиталы государственного уровня. Несмотря на слухи о банкротстве, OpenAI использует рискованные стратегии финансирования для обеспечения лидерства в гонке AGI (Источник: CNBC)

Reddit r/ChatGPT

Битва ИИ-оборудования Feishu и DingTalk: борьба за «вход» через записывающие устройства : Feishu совместно с Anker Innovation выпустила AI-наушники с функцией записи, вступив в прямую конкуренцию с DingTalk A1. Записывающее оборудование рассматривается как «первая точка контакта» в корпоративном рабочем процессе, превращая голос в цифровой актив. DingTalk фокусируется на превращении записей в задачи, а Feishu подчеркивает глубокую синергию с базой знаний. Суть этой войны — борьба за физический носитель для исполнения AI Agent (Источник: 36氪)

飞书钉钉AI硬件争夺战:录音背后的入口之争

Убытки ИИ-бизнеса Kunlun Tech продолжаются: игра между вертикальной специализацией и затратами на трафик : Прогноз результатов Kunlun Tech на 2025 год показывает сохраняющиеся убытки. Компания придерживается стратегии «не делать универсальные модели, а специализироваться в вертикалях». Ее платформа коротких драм DramaWave и музыкальная модель Mureka приносят доход, но высокие расходы на маркетинг и R&D остаются препятствием для прибыльности. Это отражает трудности создания «защитного рва» для вертикальных ИИ-приложений в условиях конкуренции с гигантами (Источник: 36氪)

巨头游戏里,昆仑万维的AI梦有点贵

🌟 Сообщество

Победа ИИ в фотоконкурсе вызвала «кризис доверия»: прозрачность процесса важнее результата : В начале 2026 года работа «Старый свет Цилоу», занявшая первое место в фотоконкурсе, оказалась сгенерированной ИИ, что вызвало гнев общественности. Сообщество считает, что ИИ научился угождать «среднему эстетическому значению» судей, делая традиционные механизмы слепого судейства неэффективными. Это не только выход за технические рамки, но и посягательство на человеческую «эмоциональную вовлеченность». Звучат призывы разделить категории для чисто человеческого творчества и ИИ-помощи (Источник: 36氪)

当AI偷走人类的冠军

Отчуждение ИИ на рабочем месте: сгенерированные «благодарности» и исчезающее доверие : Исследование показывает, что когда сотрудники обнаруживают, что благодарственное письмо от руководителя создано ИИ, уровень доверия падает с 83% до 40%. Сообщество обсуждает эту «фальшивую искренность», считая, что ИИ, повышая эффективность, становится барьером в эмоциональном общении. Кроме того, растет дискуссия о «вакууме ответственности»: когда объем кода, созданного Agent, превышает возможности человеческого аудита, традиционные процессы CI/CD сталкиваются со структурным сбоем (Источник: Reddit, arXiv)

Вопрос «точки входа» в эпоху ИИ: меч или бесполезный гаджет? : Сообщество глубоко размышляет над феноменом борьбы мобильных ИИ-помощников за «точку входа». История доказывает, что «универсальные помощники», оторванные от высокочастотных сценариев, часто превращаются в низкочастотные «швейцарские ножи». Настоящая точка входа должна вырасти органично, а не быть захваченной. Модели, использующие протокол MCP и сотрудничество A2A, выглядят более перспективными, чем технологии чтения экрана GUI. Приватность и безопасность остаются незыблемыми границами (Источник: 36氪)

AI时代争入口,或许是个伪命题

💡 Прочее

Sinong: выпущена первая в Китае вертикальная модель для сельского хозяйства : Для сельского хозяйства, как стратегической области STEM, Китай выпустил первую вертикальную модель с открытым исходным кодом «Sinong». Модель прошла глубокую тонкую настройку на данных о растениеводстве, животноводстве и аграрной экономике. Комментарии сообщества отмечают, что ценность вертикальных LLM заключается в их способности «обнаруживать» и «проверять» нестандартные явления, а не в простой генерации текста (Источник: teortaxesTex)

teortaxesTex

Мичиган продвигает законопроект против чат-ботов: защита молодежи от «ИИ-зависимости» : Сенат штата Мичиган предложил серию законопроектов, направленных на ограничение «аддиктивных алгоритмических лент» для несовершеннолетних и строгое регулирование «роботов-компаньонов». Законопроект требует от онлайн-сервисов дизайна «приватности по умолчанию» и запрещает ИИ-системам поощрять самоповреждение или заменять реальную психологическую поддержку (Источник: Reddit)

Reddit r/LocalLLaMA

Глубокий анализ рынка HBM: цикл поставок с привязкой к платформе, а не просто дефицит : Интерпретация рынка HBM (память с высокой пропускной способностью) была скорректирована: ограничение поставок HBM связано не с нехваткой пластин, а с тем, что это цепочка поставок с «привязкой к платформе». Каждое поколение продуктов (HBM3/3E/4) должно пройти валидацию для конкретных ускорителей в очень узком окне. Этот волнообразный цикл означает, что будущая прибыль зависит от способности постоянно проходить валидацию для платформ следующего поколения (Источник: teortaxesTex)

teortaxesTex