Ключевые слова:Большие языковые модели ИИ, Открытые модели, Оптимизация логического вывода, ИИ поиск, Очки с ИИ, ИИ агенты, ОИИ (Общий Искусственный Интеллект), Отчет a16z о триллионе токенов, Gemini 3 API, Смартфон Doubao с ИИ, Архитектура Titans, Мультимодальная интеграция

🎯 Тенденции

Отчет a16z о триллионах Token раскрывает большое расхождение в AI : OpenRouter и a16z совместно опубликовали отчет, основанный на 100 триллионах Token, раскрывающий три основные тенденции в AI на 2025 год: доля трафика моделей с открытым исходным кодом достигнет 30%, китайские проекты с открытым исходным кодом набирают силу, занимая почти 30% мирового рынка; трафик моделей, оптимизированных для инференса, вырастет до более чем 50%, AI переходит от “генерации текста” к “решению проблем”; программирование и ролевые игры являются двумя основными сценариями. В отчете также представлен “эффект хрустальной туфельки”, подчеркивающий, что модели должны сначала решить конкретные болевые точки для удержания пользователей, и отмечается, что платное использование в Азии удвоилось, а китайский язык стал вторым по величине языком взаимодействия с AI. (Источник: source, source)

Отчет a16z о триллионах Token раскрывает большое расхождение в AI

Эволюция и споры вокруг AI-поиска : AI-поиск эволюционирует от распространения информации к посредничеству в услугах. AI-нативные поисковые системы, такие как Google Gemini 3 и Perplexity, переосмысливают опыт поиска с помощью диалогового взаимодействия, мультимодального понимания и выполнения задач. Доля рынка традиционных поисковых систем снижается, а AI-поиск становится базовой возможностью различных приложений. Однако заявление Илона Маска о том, что AI “уничтожит поиск”, отражает как влияние на традиционные модели, так и ожидание будущего рынка услуг на триллионы долларов, а также вызывает дискуссии о надежных источниках информации и изменении парадигм маркетинга. (Источник: source)

Уничтожит ли AI поиск?

“Битва ста зеркал” AI-очков : На китайском рынке за два месяца было выпущено 20 моделей AI-очков, а такие гиганты, как Google, Alibaba, Huawei и Meta, вышли на этот рынок, стремясь занять нишу следующего поколения интеллектуального взаимодействия. AI-очки, интегрируя возможности больших моделей, реализуют функции, такие как перевод в реальном времени, распознавание сцен и голосовые вопросы, пытаясь “уничтожить” традиционные очки. Однако однородность продуктов, время автономной работы, комфорт и конфиденциальность остаются проблемами, и рынок все еще ищет свои “убойные” приложения и бизнес-модели. (Источник: source, source)

AI-очки не заменят телефон, они хотят "уничтожить" традиционные очки

AI-телефон Doubao и битва супер-APP : AI-телефон Doubao, разработанный ByteDance в сотрудничестве с ZTE, благодаря высокопривилегированному Agent реализует системные AI-возможности, что вызвало дискуссию о “войне между супер-Agent и супер-APP”. Пользователи могут выполнять сложные операции, такие как сравнение цен на разных платформах или заказ еды, одной фразой. Однако такие платформы, как WeChat, быстро запретили сторонние автоматизированные операции, что подчеркивает, что внедрение системного AI — это не только техническая проблема, но и проблема распределения прибыли и координации экосистем. Производители телефонов, как нейтральные игроки, возможно, смогут легче способствовать созданию открытой экосистемы AI-телефонов. (Источник: source, source)

Doubao сделал первый выстрел, супер-Agent и супер-APP начали войну

Трудности внедрения AI в физическом мире : В отрасли существует общее мнение, что AI является “богом” в цифровом мире, но все еще “младенцем” в физическом мире. Глава нового производителя автомобилей отметил, что научить робота ходить сложнее, чем научить AI писать стихи, в физическом мире отсутствует “кнопка отмены”, а затраты на эксплуатацию и юридические издержки огромны. Будущие выгоды заключаются во внедрении AI в физические устройства, такие как автомобили и станки, для достижения прорыва в “содержании труда”. Кроме того, после исчерпания преимуществ текстовых данных, Scaling Law переходит к “обучению на видео” для понимания физических законов и причинно-следственных связей, но это также создает огромные проблемы с потреблением вычислительной мощности. (Источник: source)

Корректировка бесплатного API Google Gemini и рыночная конкуренция : Google внезапно ужесточил ограничения на бесплатный уровень Gemini API, вызвав недовольство разработчиков, которые считают, что компания переходит к монетизации после сбора данных. Этот шаг происходит в то время, когда OpenAI планирует выпустить GPT-5.2 в ответ на Gemini 3, и конкуренция больших AI-моделей становится все более ожесточенной. Генеральный директор Google DeepMind Демис Хассабис подчеркнул, что Google должен занять сильнейшую позицию в области AI, и выразил удовлетворение мультимодальными возможностями Gemini 3, созданием игр, фронтенд-разработкой и другими показателями, а также вновь подтвердил важность Scaling Law. (Источник: source)

Google внезапно отменил бесплатную версию Gemini, вызвав скандал, данные использовались для обучения модели, а затем преданы? GPT-5.2 атакует Gemini 3, Демис Хассабис: Google должен занять сильнейшую позицию

Архитектура Titans от Google DeepMind и перспективы AGI : Генеральный директор Google DeepMind Демис Хассабис прогнозирует достижение AGI в течение 5-10 лет, но для этого потребуется 1-2 прорыва “уровня Transformer”. На конференции NeurIPS 2025 Google представила архитектуру Titans, объединяющую скорость RNN с производительностью Transformer, направленную на решение проблемы длинного контекста, и предложила теоретическую основу MIRAS. Titans сжимает исторические данные с помощью модуля долгосрочной памяти, обеспечивая динамическое обновление параметров модели во время выполнения, особенно эффективно проявляя себя в задачах сверхдлинного контекстного вывода, и рассматривается как мощный преемник Transformer. (Источник: source, source)

Google представил убийцу Transformer, первый крупный прорыв за 8 лет, глава компании обозначил сроки AGI

🧰 Инструменты

Гибридная AI-архитектура LangChainAI и мультимодальные возможности : Сообщество LangChain выпустило приложение “Energy Buddy”, использующее гибридную AI-архитектуру LangGraph, которая обрабатывает изображения с помощью детерминированного OCR и использует ReAct-Agent для обработки запросов, подчеркивая, что не все задачи требуют Agent. Кроме того, LangChain предоставил учебные пособия, демонстрирующие, как использовать Gemini для создания мультимодальных AI-приложений, обрабатывающих изображения, аудио и видео, что упрощает сложные вызовы API. (Источник: source, source)

Гибридная AI-архитектура LangChainAI и мультимодальные возможности

Мульти-AI инструмент для подсказок Yupp AI : Yupp AI предоставляет платформу, позволяющую пользователям одновременно задавать вопросы нескольким AI-моделям (таким как ChatGPT, Gemini, Claude, Grok, DeepSeek) в одной вкладке и использовать функцию “Help Me Choose”, чтобы модели проверяли работу друг друга. Инструмент призван упростить и ускорить рабочий процесс совместной работы нескольких AI и предоставляется бесплатно, повышая эффективность пользователей в сложных задачах. (Источник: source)

Система памяти Agent Cass Tool : doodlestein разрабатывает систему памяти Agent на основе своего инструмента Cass, которая использует несколько AI-Agent, таких как Claude Code и Gemini3, для планирования и генерации кода. Инструмент Cass призван предоставить высокопроизводительный CLI-интерфейс, интегрированный с кодирующими Agent, который обновляет память Agent путем записи журналов сеансов, извлечения предпочтений и обратной связи, обеспечивая более эффективное контекстное проектирование. (Источник: source)

Система памяти Agent Cass Tool

Документ-Agent LlamaCloud : LlamaCloud представила решение “интеллектуальной обработки документов”, позволяющее пользователям за считанные секунды создавать и развертывать профессиональные документ-Agent и настраивать их рабочий процесс с помощью кода. Платформа предоставляет примеры Agent для обработки счетов и сопоставления контрактов, утверждая, что они более точны и настраиваемы, чем существующие решения IDP, и призваны упростить задачи обработки документов с помощью кодирующих Agent. (Источник: source)

Результаты тестирования кода SWE-Bench : MiniMax-M2 стал моделью с открытым исходным кодом с самым высоким баллом в тесте SWE-Bench verified, демонстрируя мощные возможности Agent и стабильность обработки длинных задач. Версия Deepseek v3.2 для инференса следует за ней, привлекая внимание чрезвычайно высокой производительностью и хорошими результатами. GLM 4.6 демонстрирует сбалансированную производительность, высокую скорость, низкую цену и отличные результаты, считаясь королем по соотношению цена/качество, что показывает, как модели с открытым исходным кодом быстро догоняют коммерческие большие модели в области генерации кода. (Источник: source)

Результаты тестирования кода SWE-Bench

Инструменты оркестровки нескольких Agent : В обсуждениях в социальных сетях отмечается, что оркестровка нескольких Agent — это будущее AI-кодирования, подчеркивая важность интеллектуального управления контекстом. Рекомендуются такие инструменты с открытым исходным кодом, как CodeMachine CLI, BMAD Method, Claude Flow, Swarms, для координации рабочих процессов нескольких Agent, структурированного планирования и автоматического развертывания. Эти инструменты призваны решить ограничения, связанные с тем, что одна AI-сессия не может справиться со сложной разработкой программного обеспечения, и повысить надежность AI в реальных проектах. (Источник: source)

Инструменты оркестровки нескольких Agent

Система управления галлюцинациями локальных LLM : Разработчик поделился своей созданной синтетической “нервной системой”, предназначенной для управления галлюцинациями локальных LLM путем отслеживания “соматических” состояний (таких как дофамин и векторы эмоций). Эта система при высоком риске/низком дофамине запускает защитную выборку (самосогласованность и отказ), успешно снижая частоту галлюцинаций, но в настоящее время слишком консервативна, отказываясь отвечать даже на вопросы, на которые можно ответить. Этот проект исследует потенциал повышения безопасности AI путем управления на уровне контроля, а не на уровне весов модели, во время инференса. (Источник: source)

📚 Обучение

Академические статьи “Goodreads” Paper Trails : Ануджа разработала Paper Trails, платформу для управления академическими статьями, похожую на Goodreads, призванную помочь исследователям более приятно и персонализированно заниматься академическим чтением и управлять такими ресурсами, как статьи, блоги, Substack. Платформа надеется сделать исследовательский опыт более интересным и личным. (Источник: source, source)

Академические статьи "Goodreads" Paper Trails

Исследование развертывания AI-Agent в производстве : DAIR.AI опубликовал крупномасштабное исследование работы AI-Agent в производственной среде, обнаружив, что Agent производственного уровня, как правило, просты и строго ограничены, в основном полагаются на готовые модели, а не на тонкую настройку, и в основном оцениваются вручную. Исследование оспаривает распространенные предположения об автономности Agent, подчеркивая, что надежность остается самой большой проблемой, и отмечая, что большинство команд, занимающихся производственным развертыванием, предпочитают создавать собственные реализации с нуля, а не полагаться на сторонние фреймворки. (Источник: source)

Исследование развертывания AI-Agent в производстве

Последний обзор Agentic LLM : Новый обзор Agentic LLM охватывает три взаимосвязанные категории: модели, ориентированные на рассуждения, извлечение, действия, и мульти-Agent системы. В отчете отмечается, что Agentic LLM имеют ключевые применения в таких областях, как медицинская диагностика, логистика, финансовый анализ и научные исследования, и решают проблему нехватки обучающих данных путем генерации новых обучающих состояний в процессе рассуждений. (Источник: source, source)

Последний обзор Agentic LLM

Ключевые методы мультимодального слияния : TheTuringPost обобщил ключевые методы мультимодального слияния, включая механизмы внимания (кросс-внимание, самовнимание), Mixture-of-Transformers (MoT), графическое слияние, слияние ядерных функций и Mixture of States (MoS). MoS считается одним из новейших и самых передовых методов, эффективно интегрирующим визуальные и текстовые признаки путем смешивания скрытых состояний каждого слоя и обучаемого маршрутизатора. (Источник: source, source)

Ключевые методы мультимодального слияния

Список выдающихся статей NeurIPS 2025 : TheTuringPost опубликовал список из 15 выдающихся исследовательских статей NeurIPS 2025, охватывающих такие передовые темы, как Faster R-CNN, Artificial Hivemind, Gated Attention for LLMs, Superposition Yields Robust Neural Scaling, Why Diffusion Models Don’t Memorize, и многие другие, предоставляя важные справочные ресурсы для исследователей AI. (Источник: source)

Список выдающихся статей NeurIPS 2025

Сбои и исправления длинного контекста : В статье dbreunig в блоге рассматриваются причины сбоев моделей с длинным контекстом и методы их исправления. В статье отмечается, что в многоразовых диалогах, если пользователь меняет свое мнение в середине, простая итерация может быть неэффективной, и рекомендуется агрегировать комплексные требования в единую длинную подсказку для достижения лучших результатов. Это имеет решающее значение для понимания и оптимизации производительности LLM в сложных, длительных диалогах. (Источник: source)

Сбои и исправления длинного контекста

Нобелевский лауреат Майкл Левитт о четырех видах интеллекта : Лауреат Нобелевской премии по химии 2013 года Майкл Левитт выступил с лекцией в CEIBS, глубоко интерпретируя логику эволюции интеллекта с четырех измерений: биологический интеллект, культурный интеллект, искусственный интеллект и личный интеллект. Он подчеркнул разнообразие в биологической эволюции, креативность молодежи и потенциал AI как мощного инструмента. Левитт ежедневно использует 4-5 AI-инструментов, задает сотни вопросов и советует сохранять любопытство и критическое мышление, быть смелым в риске. (Источник: source)

Нобелевский лауреат Майкл Левитт о четырех видах интеллекта

Академический хаос NeurIPS и “фабрики статей” : Профессор Ма И из Гонконгского университета раскритиковал NeurIPS и другие ведущие конференции за потерю академического характера после масштабирования, превратившись в часть “академической производственной цепочки”. Исследовательская консалтинговая организация Algoverse утверждает, что ее команда наставников достигает 68-70% принятия на ведущих конференциях, и даже старшеклассники публикуют статьи, что вызывает обеспокоенность в академическом сообществе по поводу “платных статей”, “академической инфляции” и кризиса доверия. Исследования показывают, что “фабрики статей” используют AI-инструменты для производства низкокачественных статей, и ICLR уже ввел новые правила, требующие четкого заявления об использовании AI и ответственности за вклад. (Источник: source)

Академический хаос NeurIPS и "фабрики статей"

Предвзятость AI-языковых моделей к немецким диалектам : Исследование, проведенное Университетом Иоганна Гутенберга в Майнце и другими учреждениями, показало, что крупные языковые модели, такие как GPT-5 и Llama, систематически предвзято относятся к носителям немецких диалектов, оценивая их как “деревенских”, “традиционных” или “необразованных”, в то время как носители стандартного немецкого языка описываются как “образованные” и “организованные”. Эта предвзятость была более выраженной, когда моделям явно сообщали о диалекте, и крупные модели проявляли более сильную предвзятость, что выявляет проблему воспроизведения AI-системами социальных стереотипов. (Источник: source)

Предвзятость AI-языковых моделей к немецким диалектам

💼 Бизнес

Ставка xAI на 20 миллиардов долларов : xAI, компания Илона Маска, ищет новое финансирование в размере около 20 миллиардов долларов, включая 12,5 миллиарда долларов структурированного долга, связанного с соглашением о закупке продуктов NVIDIA. Развитие xAI сильно зависит от экосистем X и Tesla, а ее стратегия “слабой согласованности” сталкивается с растущими рисками в условиях все более строгого глобального регулирования. Несмотря на стремительный рост оценки, коммерческие доходы xAI по-прежнему в основном поступают с платформы X, что ограничивает ее независимый рост, и она сталкивается с множеством проблем, таких как дисбаланс затрат, ограниченная модель и трения с регулирующими органами. (Источник: source)

Ставка xAI на 20 миллиардов долларов

“Час пробуждения” OpenAI и месть Google : OpenAI сталкивается с огромным дефицитом средств в размере 207 миллиардов долларов и кризисом доверия, генеральный директор Альтман даже объявил о введении “красного уровня тревоги”. Тем временем модель Google Gemini демонстрирует отличные результаты в бенчмарках и мощно мстит благодаря своим глубоким денежным потокам и полной производственной цепочке (TPU, облачные сервисы). Настроения рынка сместились от безумия по отношению к OpenAI к предпочтению Google, что отражает переход AI-индустрии от “теологической стадии” к “промышленной стадии”, с беспокойством о прибыльности и качестве продукции. (Источник: source)

«Час пробуждения» OpenAI

AI-кулон Limitless приобретен Meta : AI-носимое устройство Limitless Pendant, называемое самым маленьким в мире, было приобретено Meta. Генеральный директор Limitless Дэн Сирокер заявил, что обе стороны разделяют общее видение “личного суперинтеллекта”. Это приобретение означает, что Limitless прекратит продажу существующих продуктов, но предоставит существующим пользователям техническую поддержку как минимум на один год и бесплатное обновление услуг. Это событие отражает, что стартапы в области AI-оборудования, сталкиваясь с высокими затратами на исследования и разработки и давлением на рынке, в конечном итоге могут быть приобретены гигантами. (Источник: source)

AI-кулон Limitless приобретен Meta

🌟 Сообщество

Взгляд Карпати на LLM как симуляторы : Андрей Карпати предлагает рассматривать LLM как симуляторы, а не как сущности. Он считает, что при изучении темы не следует спрашивать “что вы думаете о XYZ?”, а следует спрашивать “как группа людей будет исследовать XYZ? Что они скажут?”. LLM могут симулировать множество точек зрения, но не формируют собственного мнения. Эта точка зрения вызвала дискуссии в сообществе о роли LLM, задачах RL и сути “мышления”, а также о том, как эффективно использовать LLM для исследований. (Источник: source, source, source, source)

Взгляд Карпати на LLM как симуляторы

Влияние AI на рынок труда и переход к “синим воротничкам” : AI ускоряет проникновение в офисную работу, вызывая волну увольнений и заставляя молодых людей пересматривать свои карьерные планы. 18-летняя девушка бросила университет, чтобы стать водопроводчиком, а 31-летний ветеран Microsoft был уволен из-за реорганизации отдела, вызванной AI, что подчеркивает замену “опытных специалистов среднего звена” AI. Хинтон когда-то советовал стать водопроводчиком, чтобы противостоять влиянию AI. Это отражает, что рабочие места “синих воротничков” из-за сложности физических операций на короткий срок становятся “убежищем” от автоматизации AI, в то время как “белые воротнички” должны адаптироваться к новому “форматированному” порядку на рабочем месте. (Источник: source, source)

Влияние AI на рынок труда и переход к "синим воротничкам"

AI-генерируемые поддельные изображения вызывают волну возвратов : Продавцы на платформах электронной коммерции сталкиваются с проблемой “AI-возвратов только по изображению”, когда мошенники используют AI для создания изображений дефектов товаров, чтобы получить возврат, особенно это касается свежих продуктов и товаров по низким ценам. В то же время AI-модели и AI-отзывы покупателей захватывают категории женской одежды, что затрудняет потребителям различение подлинности. Хотя платформы уже выпустили правила по борьбе с поддельными изображениями AI и функцию активного заявления, они по-прежнему сильно зависят от активности пользователей, а стандарты проверки нечеткие, что вызывает опасения по поводу злоупотребления AI, кризиса доверия и умственного истощения. (Источник: source)

AI-генерируемые поддельные изображения вызывают волну возвратов

Проблема галлюцинаций в статьях ICLR : В статьях, представленных на ICLR 2026, обнаружено большое количество “галлюцинаций”; один исследователь, просканировав 300 статей, обнаружил явные галлюцинации в 50 из них. ICLR уже начал напрямую отклонять такие статьи, сгенерированные LLM и не сообщающие об их использовании. Эта проблема вызывает опасения по поводу академической честности, этики AI-помощи в написании и эффективности механизмов рецензирования конференций. (Источник: source, source, source)

Проблема галлюцинаций в статьях ICLR

Влияние AI на цены на электронику : В обсуждениях в социальных сетях высказывается мнение, что ажиотаж вокруг AI сильно бьет по мировому рынку электроники, подобно влиянию майнинга криптовалют на рынок GPU. Огромный спрос центров обработки данных AI на HBM и высокопроизводительную видеопамять приводит к резкому росту цен на DRAM и другую память, что влияет на потребительскую электронику, такую как ПК и смартфоны. Комментаторы опасаются, что до того, как лопнет пузырь AI, обычные потребители будут нести более высокие расходы на электронику, и ставят под сомнение, не отклоняется ли текущее направление развития AI от действительно полезных для человека приложений. (Источник: source)

Практическое применение и ограничения AI-Agent : В обсуждениях в социальных сетях глубоко рассматриваются практические задачи и ограничения “Agentic AI”. Пользователи в целом считают, что многие текущие “Agent”-продукты по-прежнему являются “маркетинговым шумом” и ближе к “автоматизации”, чем к “полной автономии”. Настоящие автономные AI-задачи включают обработку данных, многошаговый поиск, повторяющиеся операции с программным обеспечением, рефакторинг кода и постоянный мониторинг. Однако задачи, связанные с суждениями, принятием рискованных решений, творческим выбором или необратимыми операциями, по-прежнему требуют вмешательства человека. (Источник: source)

AI-чатботы и личная конфиденциальность : Пользователь Reddit поделился своим опытом, когда его хозяин Airbnb использовал ChatGPT для ответа на сообщения, что вызвало дискуссию о конфиденциальности, доверии и потенциальных юридических рисках в автоматизированных AI-сервисах. Пользователь также заявил, что ему удалось “обмануть” ChatGPT, чтобы получить метаданные, которые он получал, что еще больше усилило опасения по поводу прозрачности обработки данных AI-системами. (Источник: source, source)

AI-чатботы и личная конфиденциальность

Зеленая этика AI и личный выбор : Пользователи Reddit обсуждают, следует ли продолжать избегать использования развлекательного AI (например, ChatGPT) для уменьшения негативного воздействия на окружающую среду, учитывая растущую интеграцию AI во все отрасли (особенно в медицину). Дискуссия сосредоточена на воздействии AI-центров обработки данных на окружающую среду и на том, как люди в эпоху AI могут продвигать более экологичное и ответственное использование и внедрение AI, балансируя личные ценности и технологическое развитие. (Источник: source)

💡 Другое

AI симулирует человеческие клетки : Ученые обучают AI создавать виртуальные человеческие клетки, которые могут симулировать поведение реальных клеток, предсказывая их реакцию на лекарства, генетические мутации или физические повреждения. AI-управляемая симуляция клеток обещает ускорить открытие лекарств, обеспечить персонализированное лечение и сократить затраты на проб и ошибок на ранних этапах испытаний, но лабораторные испытания in vivo по-прежнему необходимы. (Источник: source)

AI симулирует человеческие клетки

AI-генератор резюме : Пользователь разработал AI-инструмент (расширение Chrome), который автоматически считывает несколько страниц вакансий и генерирует индивидуальные резюме для каждой должности на основе опыта пользователя. Инструмент использует Gemini и предназначен для решения утомительной и трудоемкой проблемы ручного изменения резюме в процессе поиска работы, повышения эффективности поиска работы, а также обнаружил, что Gemini более выгоден по стоимости генерации, чем ChatGPT. (Источник: source, source)

6 ГБ оффлайн медицинский SLM : Разработан 6 ГБ, полностью автономный оффлайн медицинский SLM (малая языковая модель), который может работать на ноутбуках и телефонах без облака, с нулевой утечкой данных. Модель сочетает BioGPT-Large и нативный биомедицинский граф знаний, а также с помощью графо-ориентированных встраиваний и RAG в реальном времени достигает почти нулевых галлюцинаций, ответов на уровне руководств и поддерживает структурированные рассуждения в 7 клинических областях. Инструмент предназначен для предоставления безопасной и точной медицинской информации клиницистам, исследователям и пациентам. (Источник: source, source)

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *