Ключевые слова:Искусственный интеллект в программировании, Автономное вождение, AI агент, Открытые модели ИИ, Мультимодальный ИИ, Оптимизация ИИ, Коммерческое применение ИИ, Расширение VS Code для ИИ, Автономная система Waymo, Mistral Devstral 2, GLM-4.6V мультимодальный, Оптимизация производительности LLM

🔥 В центре внимания

AI переворачивает рабочий процесс программирования: Разработчик поделился «революционным» опытом использования расширения VS Code на базе AI. Этот инструмент способен автономно генерировать многоэтапное архитектурное планирование, выполнять код, запускать тесты и даже автоматически откатывать и исправлять ошибки, в конечном итоге производя более чистый код, чем человек. Это вызвало дискуссию о том, что «ручное кодирование умерло», подчеркивая, что AI эволюционировал от вспомогательного инструмента до системы, способной к сложной «оркестровке», но системное мышление по-прежнему остается ключевой компетенцией разработчика. (Источник: Reddit r/ClaudeAI)

Автономное вождение Waymo становится образцом воплощенного AI: Система автономного вождения Waymo была названа Джеффом Дином самым передовым и крупномасштабным приложением воплощенного AI на сегодняшний день. Ее успех обязан тщательному сбору большого объема данных об автономном вождении и инженерной строгости, что обеспечивает фундаментальные идеи для проектирования и масштабирования сложных систем AI. Это знаменует собой значительный прорыв в реальном применении воплощенного AI и обещает способствовать внедрению большего числа интеллектуальных систем в повседневную жизнь. (Источник: dilipkay)

Глубокие дебаты о будущем влиянии AI: Эксперты MIT Technology Review и FT обсудили влияние AI в ближайшие десять лет. Одна сторона считает, что его влияние превзойдет промышленную революцию, принеся огромные экономические и социальные преобразования; другая сторона утверждает, что скорость распространения технологий и их принятия обществом — это «человеческая скорость», и AI не станет исключением. Столкновение мнений выявляет глубокие разногласия относительно будущего направления AI, которое может оказать глубокое влияние на все — от макроэкономики до социальной структуры. (Источник: MIT Technology Review)

Раскрытие текущего состояния внедрения корпоративных Agent’ов: Масштабное эмпирическое исследование Калифорнийского университета в Беркли (306 практиков, 20 корпоративных кейсов) показало, что внедрение AI Agent’ов в основном направлено на повышение производительности, при этом закрытые модели, ручные Prompt’ы и контролируемые процессы являются основным направлением. Надежность — главная проблема, и ручная проверка незаменима. Исследование указывает, что Agent’ы больше похожи на «супер-стажеров», обслуживают в основном внутренних сотрудников, и время отклика в несколько минут считается приемлемым. (Источник: 36氪)

🎯 Тенденции

Mistral выпускает модель кодирования Devstral 2 и инструмент Vibe CLI: Европейский AI-единорог Mistral выпустил семейство моделей кодирования Devstral 2 (123B и 24B, обе с открытым исходным кодом) и локальный помощник по программированию Mistral Vibe CLI. Devstral 2 показал отличные результаты на SWE-bench Verified, не уступая Deepseek v3.2. Mistral Vibe CLI поддерживает исследование, изменение и выполнение кода на естественном языке, обладает автоматическим распознаванием контекста и возможностью выполнения команд Shell, что усилило позиции Mistral в области кодирования с открытым исходным кодом. (Источник: swyx, QuixiAI, op7418, stablequan, b_roziere, Reddit r/LocalLLaMA)

Devstral 2 beats or ties Deepseek v3.2 71% of the time by third party preference and is smaller/faster/cheaper (esp Small 2) !!!

Nous Research выпускает в открытый доступ математическую модель Nomos 1: Nous Research выпустила в открытый доступ Nomos 1, 30B-параметрическую модель для решения математических задач и доказательств, которая набрала 87/120 баллов на математическом конкурсе Putnam в этом году (предположительно заняв второе место), демонстрируя потенциал относительно небольшой модели достигать математических результатов, близких к лучшим человеческим, благодаря хорошей пост-тренировке и настройкам вывода. Модель основана на Qwen/Qwen3-30B-A3B-Thinking-2507. (Источник: Teknium, Dorialexander, huggingface, Reddit r/LocalLLaMA)

Today we open source Nomos 1. At just 30B parameters, it scores 87/120 on this year’s Putnam, one of the world’s most prestigious math competitions.

Ежемесячная аудитория Tongyi Qianwen от Alibaba превысила 30 миллионов, основные функции доступны бесплатно: Ежемесячная аудитория Tongyi Qianwen от Alibaba превысила 30 миллионов в течение 23 дней открытого бета-тестирования, и четыре основные функции — AI PPT, AI Writing, AI Library и AI Tutoring — были открыты бесплатно. Этот шаг направлен на превращение Qianwen в супер-портал эпохи AI, чтобы захватить ключевой период возможностей для приложений AI, переходящих от «способности общаться» к «способности выполнять задачи», и удовлетворить реальные потребности пользователей в инструментах повышения производительности. (Источник: op7418)

阿里千问公测才23天,月活用户就突破3000万。

Zhipu AI выпускает мультимодальную модель GLM-4.6V и AI для мобильных устройств: Zhipu AI выпустила мультимодальную модель GLM-4.6V на Hugging Face, обладающую передовым (SOTA) визуальным пониманием, нативным вызовом функций Agent’ов и возможностью контекста 128k. Одновременно были представлены AutoGLM-Phone-9B (9B-параметрическая «базовая модель для смартфонов», которая может читать экран и выполнять действия от имени пользователя) и GLM-ASR-Nano-2512 (2B-модель распознавания речи, превосходящая Whisper v3 в многоязычном распознавании и распознавании при низкой громкости). (Источник: huggingface, huggingface, Reddit r/LocalLLaMA)

Zhipu AI just released GLM-4.6V on Hugging Face This new multimodal model achieves SOTA visual understanding, features native function calling for agents, and handles 128k context for documents. Perception to action!

OpenBMB выпускает модель генерации речи VoxCPM 1.5 и набор данных Ultra-FineWeb: OpenBMB представила VoxCPM 1.5, обновленную реалистичную модель генерации речи, поддерживающую Hi-Fi аудио 44.1 кГц, с более высокой эффективностью, а также предоставляющую LoRA и скрипты для полной тонкой настройки, с повышенной стабильностью. Одновременно OpenBMB также выпустила в открытый доступ набор данных Ultra-FineWeb-en-v1.4 объемом 2.2T токенов, который является основными тренировочными данными для MiniCPM4/4.1 и содержит новейший снимок CommonCrawl. (Источник: ImazAngel, eliebakouch, huggingface)

Обновления Claude Agent SDK от Anthropic и концепция “Skills > Agents”: Claude Agent SDK выпустил три обновления: поддержку контекстных окон 1M, функцию песочницы и V2 интерфейса TypeScript. Anthropic также представила концепцию «Skills > Agents», подчеркивая повышение практичности Claude Code за счет создания большего количества навыков, что позволит ему получать новые возможности от экспертов в предметной области и развиваться по мере необходимости, формируя совместную, масштабируемую экосистему. (Источник: _catwu, omarsar0, Reddit r/ClaudeAI)

We’ve shipped three new updates for Claude Agent SDK to make it easier to build custom agents: - Support for 1M context windows - Sandboxing - V2 of our TypeScript interface

Применение AI в военной сфере: Pentagon создает руководящий комитет по AGI и платформу GenAi.mil: Пентагон США отдал приказ о создании руководящего комитета по общему искусственному интеллекту (AGI) и запустил платформу GenAi.mil, направленную на предоставление передовых моделей AI непосредственно военнослужащим США для повышения их боеспособности. Это означает растущую важность роли AI в национальной безопасности и военной стратегии. (Источник: jpt401, giffmana)

Оптимизация производительности LLM: повышение эффективности обучения и вывода: Unsloth выпустил новые ядра Triton и интеллектуальную поддержку автоматической упаковки, что увеличивает скорость обучения LLM в 3-5 раз, при этом снижая использование VRAM на 30-90% (например, Qwen3-4B может обучаться на 3.9 ГБ VRAM) без потери точности. Одновременно, фреймворк ThreadWeaver значительно снижает задержку вывода LLM (ускорение до 1.53 раза) за счет адаптивного параллельного вывода и в сочетании с PaCoRe преодолевает ограничения контекста, позволяя выполнять вычисления с миллионами токенов во время тестирования без необходимости в большем контекстном окне. (Источник: HuggingFace Daily Papers, huggingface, Reddit r/LocalLLaMA)

You can now train LLMs 3x faster with 30% less memory! (<3.9GB VRAM)

LLM’ы понимают инструкции, закодированные в Base64: Исследование показало, что LLM, такие как Gemini, ChatGPT и Grok, способны понимать инструкции, закодированные в Base64, и обрабатывать их как обычные Prompt’ы, что свидетельствует о способности LLM обрабатывать нечитаемый для человека текст. Это открытие может открыть новые возможности для взаимодействия моделей AI с системами, передачи данных и скрытых инструкций. (Источник: Reddit r/artificial)

LLMs can understand Base64 encoded instructions

Meta, по слухам, отказывается от стратегии открытого исходного кода в AI: По слухам, Марк Цукерберг поручил Meta отказаться от своей стратегии открытого исходного кода в AI. Если это правда, это ознаменует собой значительный стратегический сдвиг в сфере AI для Meta, который может оказать глубокое влияние на все сообщество открытого исходного кода AI и вызвать дискуссии о тенденции к закрытию технологий AI. (Источник: natolambert)

Унифицированные возможности модели генерации видео Kling O1: Kling O1 была представлена как первая унифицированная видеомодель, способная генерировать, редактировать, реконструировать и расширять любой кадр в одном движке. Пользователи могут создавать контент с помощью моделирования в ZBrush, реконструкции AI, раскадровки Lovart AI и пользовательских звуковых эффектов. Kling 2.6 отлично показал себя в замедленной съемке и генерации видео из изображений, принося революционные изменения в создание видео. (Источник: Kling_ai, Kling_ai, Kling_ai, Kling_ai, Kling_ai, Kling_ai, Kling_ai, Kling_ai)

Динамика новых LLM-моделей и слухи о сотрудничестве: По слухам, модель DeepSeek V4 может быть выпущена во время китайского Нового года в феврале 2026 года, вызывая ожидания рынка. Одновременно появились сообщения о том, что Meta использует модель Qwen от Alibaba для доработки своих новых моделей AI, что указывает на потенциальное сотрудничество или заимствование технологий между технологическими гигантами в разработке моделей AI, предвещая сложную ситуацию, где сосуществуют конкуренция и сотрудничество в сфере AI. (Источник: scaling01, teortaxesTex, Dorialexander)

META REFINED NEW AI MODEL USING ALIBABA'S QWEN, PEOPLE SAY

🧰 Инструменты

AGENTS.md: формат руководства для кодирующих Agent’ов с открытым исходным кодом: На GitHub Trending появился AGENTS.md, простой и открытый формат, предназначенный для предоставления AI-кодирующим Agent’ам контекста проекта и инструкций, аналогично файлу README для Agent’а. Он, с помощью структурированных подсказок, помогает AI лучше понимать среду разработки, тестирование и процессы PR, способствуя применению и стандартизации Agent’ов в разработке программного обеспечения. (Источник: GitHub Trending)

AGENTS.md — a simple, open format for guiding coding agents

Google AlphaEvolve: Agent для проектирования алгоритмов на базе Gemini: Google DeepMind представила частную предварительную версию AlphaEvolve, кодирующего Agent’а на базе Gemini, направленного на предложение интеллектуальных изменений кода с помощью LLM и постоянное развитие алгоритмов для повышения эффективности. Этот инструмент, автоматизируя процесс оптимизации алгоритмов, обещает ускорить разработку программного обеспечения и повысить производительность. (Источник: GoogleDeepMind)

Introducing AlphaEvolve, our Gemini-powered coding agent for designing advanced algorithms—in private preview.

Генерация изображений AI: панорамные изображения истории продукта и советы по поддержанию согласованности лиц: Инструменты генерации изображений AI, такие как Gemini и Nano Banana Pro, используются для создания панорамных изображений истории продукта, таких как Ferrari, iPhone и т. д., подходящих для презентаций в PPT и плакатов. Одновременно были представлены советы по сохранению согласованности лиц при рисовании AI, включая генерацию чистых HD-портретов, многоугольные ссылки и попытку использовать мультяшный/3D-стиль, чтобы преодолеть проблемы AI с согласованностью деталей. (Источник: dotey, dotey, yupp_ai, yupp_ai, yupp_ai, dotey, dotey)

🔥兄弟们!这个产品展示历史全景图还是很顶的!!测试 了好多遍,差不多可以稳定输出了! 🧠创意来源:Elon 的这个火箭发展轨迹图,于是就... 内容: RT Berryxia.AI 🔥兄弟们!这个产品展示历史全景图还是很顶的!!测试 了好多遍,差不多可以稳定输出了! 🧠创意来源:Elon 的这个火箭发展轨迹图,于是就想自己 设计一个有趣的玩法! ☎️应用场景:可以将产品更换为你需要展示的产品,比如 是以可口可乐、iPhone、泡泡玛特品牌或物品等都可以展 示~适合做PPT或者海报展示都可以 🖼使用方法:①将我的系统提示词直接可以发送给 Gemini,然后发动你想生成的商品的内容,直接复制提示 词去生图即可。 ② 直接将系统提示词发送到YOUMIND /Flowith ,在系 统提示词末尾+"以法拉利的发展历史为例,尽可能的包含 完整信息”, 即可。 👉🏻我想在评论区看到不一样的玩法,记得交作业! Prompt太长直接丢评论区了~记得一键三连!

Инструмент отладки PlayerZero AI: Инструмент AI от PlayerZero извлекает и анализирует код и логи для отладки больших кодовых баз, сокращая время отладки с 3 минут до менее 10 секунд и значительно повышая точность отзыва, а также сокращая циклы Agent’ов. Это предоставляет разработчикам эффективное решение для устранения неполадок, ускоряя процесс разработки программного обеспечения. (Источник: turbopuffer)

PlayerZero's AI retrieves and reasons over code and logs to debug large codebases.

Supertonic: молниеносно быстрая модель TTS для устройств: Supertonic — это легковесная (66M параметров) модель TTS (текст в речь) для устройств, обеспечивающая чрезвычайно высокую скорость и широкие возможности развертывания (мобильные устройства, браузеры, настольные компьютеры и т. д.). Эта модель с открытым исходным кодом включает 10 предустановленных голосов и предоставляет примеры на более чем 8 языках программирования, предлагая эффективное решение для синтеза речи для различных сценариев применения. (Источник: Reddit r/MachineLearning)

Supertonic — Lightning Fast, On-Device TTS (66M Params.)

Калькулятор требований к локальному выводу LLM: Новый полезный инструмент оценивает объем памяти и скорость вывода токенов в секунду, необходимые для локального запуска моделей GGUF, в настоящее время поддерживая устройства Apple Silicon. Инструмент предоставляет точные оценки, анализируя метаданные модели (размер, количество слоев, скрытые измерения, KV-кэш и т. д.), помогая разработчикам оптимизировать локальное развертывание LLM. (Источник: Reddit r/LocalLLaMA)

Built a GGUF memory & tok/sec calculator for inference requirements – Drop in any HF GGUF URL

llama.cpp интегрировал новый опыт CLI: llama.cpp объединил новый опыт командной строки (CLI), предлагая более лаконичный интерфейс, мультимодальную поддержку, управление диалогом с помощью команд, поддержку спекулятивного декодирования и поддержку шаблонов Jinja. Пользователи приветствовали это и спрашивают, будет ли в будущем интегрирована функция кодирования Agent’ов, предвещая улучшение опыта взаимодействия с локальными LLM. (Источник: _akhaliq, Reddit r/LocalLLaMA)

new CLI experience has been merged into llama.cpp

VS Code интегрирует модели Hugging Face: Прямая трансляция запуска Visual Studio Code покажет, как использовать модели, поддерживаемые Hugging Face Inference Providers, непосредственно в VS Code, что значительно облегчит разработчикам использование моделей AI в IDE для более тесной интеграции AI-помощи в программирование и рабочие процессы разработки. (Источник: huggingface)

📚 Обучение

Обзор исследований адаптивности AI Agent’ов: Обзорное исследование «Адаптивность Agentic AI», представленное на NeurIPS 2025, объединило быстро развивающиеся области адаптации Agent’ов (сигналы выполнения инструментов и выходные сигналы Agent’а) и адаптации инструментов (независимость от Agent’а и надзор Agent’а), классифицируя существующие работы по Agent’ам в четыре парадигмы адаптации, что предоставляет всеобъемлющую теоретическую основу для понимания и разработки AI Agent’ов. (Источник: menhguin)

When I walked around the NeurIPS 2025 poster and oral sessions, it was clear that LLMs, RL, and Agents are still the dominant keyword...

Глубокое обучение и дорожная карта навыков AI: Было опубликовано несколько инфографик, охватывающих многоуровневую архитектуру AI Agent’ов, стек AI Agent’ов 2025 года, набор навыков анализа данных, 7 востребованных навыков анализа данных, дорожную карту глубокого обучения и 15 шагов обучения AI, предоставляя учащимся и разработчикам в сфере AI всеобъемлющие руководства по навыкам и архитектуре, способствуя карьерному росту. (Источник: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)

#AgenticAI In a Nutshell by @Python_Dv

Бесплатные курсы и книги по глубокому обучению: Франсуа Флере предоставил свой полный курс глубокого обучения, включающий 1000 слайдов и скриншотов, а также «Маленькую книгу по глубокому обучению», обе опубликованы по лицензии Creative Commons, предоставляя учащимся ценные бесплатные ресурсы, охватывающие базовые знания, такие как история, топологические структуры, линейная алгебра и исчисление глубокого обучения. (Источник: francoisfleuret)

Технологии оптимизации и обучения LLM: Varunneal установил новый мировой рекорд для NanoGPT Speedrun (132 секунды, 30 шагов/сек) с помощью таких технологий, как планирование размера пакета, Cautious Weight Decay и Normuon tuning. Одновременно в блоге рассматривается метод получения детализированного использования токенов из вложенных модулей DSPy, что предоставляет практический опыт и технические детали для обучения и оптимизации производительности LLM. (Источник: lateinteraction, kellerjordan0)

Blogged: Getting granular token usage from nested DSPy modules

Еженедельный обзор исследований AI и анализ модели DeepSeek R1: Turing Post опубликовал еженедельную подборку исследований AI, охватывающую совместное улучшение AI и человека, DeepSeek-V3.2, управляемые саморазвивающиеся LLM и другие темы. Кроме того, статья в Science News подробно рассмотрела модель DeepSeek R1, разъяснив распространенные заблуждения относительно ее «токенов мышления» и операций RL-in-Name-Only, помогая читателям лучше понять передовые исследования AI. (Источник: TheTuringPost, rao2z)

Must-read AI research of the week: ▪️ AI & Human Co-Improvement for Safer Co-Superintelligence ▪️ DeepSeek-V3.2 ▪️ Guided ...

Качество данных AI и MLOps: В глубоком обучении даже незначительные ошибки в разметке обучающих данных могут серьезно повлиять на производительность модели. Обсуждение подчеркивает важность процессов контроля качества, таких как многоэтапная проверка, автоматизированные проверки, встроенное обнаружение аномалий, соглашения между разметчиками и специализированные инструменты, для обеспечения надежности обучающих данных при масштабировании, тем самым улучшая общую производительность модели. (Источник: Reddit r/deeplearning)

Создание базовой LLM игрушечного уровня с нуля: Разработчик поделился опытом создания базовой LLM игрушечного уровня с нуля, используя ChatGPT для помощи в генерации слоев внимания, блоков Transformer и MLP, и обучая на наборе данных TinyStories. Проект предоставляет полный блокнот Colab, направленный на помощь учащимся в понимании процесса построения LLM и основных принципов. (Источник: Reddit r/deeplearning)

I created a toy foundational LLM from scratch

💼 Бизнес

«Zhishi Robot» привлекает десятки миллионов юаней в раунде финансирования A+: Компания по производству складских роботов «Zhishi Robot», специализирующаяся на исследованиях, разработке и производстве четырехсторонних шаттлов, недавно завершила раунд финансирования A+ на десятки миллионов юаней, эксклюзивно инвестированный Hidden Peak Capital. Продукция компании известна своей безопасностью, простотой использования и высокой степенью модульности, достигла ежегодного роста выручки на 200%-300% и расширила свое присутствие на зарубежных рынках, оказав мощную поддержку модернизации интеллектуальных складов. (Источник: 36氪)

「智世机器人」完成数千万元A+轮融资,研发安全易用四向穿梭机器人丨 36氪首发

Baseten приобретает RL-стартап Parsed: Поставщик услуг вывода Baseten приобрел стартап в области обучения с подкреплением (RL) Parsed, что отражает растущую важность RL в сфере AI и внимание рынка к оптимизации возможностей вывода моделей AI. Это приобретение, как ожидается, усилит конкурентоспособность Baseten в области услуг вывода AI. (Источник: steph_palazzolo)

Легенда математики присоединяется к AI-стартапу: Легендарный математик Кен Оно покинул академическую среду и присоединился к AI-стартапу, основанному 24-летним молодым человеком. Это знаменует тенденцию перехода ведущих талантов в сферу AI и предвещает жизнеспособность экосистемы AI-стартапов и новое направление интеграции междисциплинарных талантов. (Источник: CarinaLHong)

Ken Ono, a 2026 SIAM Annual Meeting invited speaker, was featured in @WSJ: "The Math Legend Who Just Left Academia—for an AI Startup Run by ...

🌟 Сообщество

Дебаты о влиянии AI на рынок труда, социально-экономическую сферу и автоматизацию заводов: Обсуждение влияния AI на рынок труда и социально-экономическую сферу вызвало жаркие дискуссии. Одна сторона считает, что AI приведет к обнулению стоимости труда, и призывает переосмыслить капитализм через «универсальную базовую инфраструктуру» и «роботизированные дивиденды», чтобы обеспечить базовое выживание и поощрять человечество к занятиям искусством и исследованиям. Другая сторона придерживается точки зрения «ошибки общего объема труда», утверждая, что AI создаст больше новых отраслей и рабочих мест, люди перейдут к ролям управления AI, и указывает, что физический AI автоматизирует большую часть заводских работ в течение десяти лет. (Источник: Plinz, Reddit r/ArtificialInteligence, hardmaru, SakanaAILabs, nptacek, Reddit r/artificial)

AI Is About To Kill Capitalism - Weekend at Bernie's

Роль AI в поддержке психического здоровья, научных исследованиях и этические споры: Пользователь поделился опытом оказания поддержки Claude AI во время серьезного кризиса психического здоровья, заявив, что он помог ему пройти через трудности, как терапевт. Это подчеркивает потенциал AI в поддержке психического здоровья, но также вызвало дискуссии об этике и ограничениях эмоциональной поддержки AI. Одновременно жаркие дебаты вызвало обсуждение того, должен ли AI полностью автоматизировать научные исследования. Одна сторона считает, что задержка автоматизации (например, лечения рака) ради сохранения удовольствия от человеческих открытий неэтична; другая сторона беспокоится, что полная автоматизация может привести к потере цели для человечества, и даже ставит под сомнение, смогут ли прорывы, управляемые AI, справедливо принести пользу всем. (Источник: Reddit r/ClaudeAI, BlackHC, TomLikesRobots, aiamblichus, aiamblichus, togelius)

Цензура LLM, коммерческая реклама и споры о конфиденциальности пользовательских данных: Пользователи ChatGPT выражают недовольство его строгой цензурой контента и «скучными» ответами, многие переходят к конкурентам, таким как Gemini и Claude, считая, что они лучше справляются с контентом для взрослых и свободным диалогом. Это привело к снижению числа подписок на ChatGPT и вызвало дискуссии о стандартах цензуры AI и различиях в потребностях пользователей. Одновременно тестирование рекламных функций ChatGPT вызвало сильное отвращение у пользователей, которые считают, что реклама может подорвать объективность AI и доверие пользователей, что подчеркивает вызовы в области коммерческой этики AI. Кроме того, некоторые пользователи сообщают, что OpenAI удалил старые записи диалогов GPT-4o, что вызвало опасения относительно владения данными AI-сервисов и цензуры контента, и рекомендуется пользователям обязательно создавать резервные копии локальных данных. (Источник: Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, 36氪, Yuchenj_UW, aiamblichus)

It's almost 2026...

Дилеммы разработчиков AI Agent’ов и практические соображения для использования LLM в качестве рекомендаций при приеме на работу: Несмотря на то, что AI Agent’ы рекламируются как очень мощные, разработчики все еще работают сверхурочно, что вызвало юмористический вопрос о разрыве между рекламой AI и реальной эффективностью работы. Одновременно Джон Кармак предложил, чтобы история чатов пользователя с LLM могла служить «расширенным собеседованием» при приеме на работу, позволяя LLM формировать оценку кандидата без раскрытия конфиденциальных данных, тем самым повышая точность найма. (Источник: amasad, giffmana, VictorTaelin, fabianstelzer, mbusigin, _lewtun, VictorTaelin, max__drake, dejavucoder, ID_AA_Carmack)

Claude Code wiped my whole mac" is the new "my dog ate my homework"

Обсуждение роста экосистемы открытого исходного кода AI, тенденций моделей и изменения стратегии Meta: Количество моделей на платформе Hugging Face превысило 2,2 миллиона, что показывает, что модели AI с открытым исходным кодом растут с поразительной скоростью и, как считается, в конечном итоге превзойдут крупные передовые лаборатории. Однако некоторые мнения указывают, что модели с открытым исходным кодом все еще отстают от закрытых моделей по уровню продукта (например, среда выполнения, мультимодальные возможности), и многие проекты с открытым исходным кодом сталкиваются с застоем или заброшенностью. Одновременно ходят слухи, что Meta отказывается от своей стратегии открытого исходного кода AI. (Источник: huggingface, huggingface, huggingface, ZhihuFrontier, natolambert, _akhaliq)

Open-Source AI models are going to end up crushing the large frontier labs @huggingface now hosts over 2.2m models, contributed by big...

AI в повседневной жизни: Сэм Альтман о воспитании детей и AI: Сэм Альтман заявил, что ему трудно представить, как воспитывать новорожденного без ChatGPT, что вызвало дискуссии о растущей роли AI в личной жизни и повседневных решениях. Это отражает, что AI начал проникать в самые интимные семейные сценарии, становясь незаменимым вспомогательным инструментом в современной жизни. (Источник: scaling01)

Теория «пузыря» в сфере AI и усиление конкуренции на рынке моделей изображений: Некоторые мнения указывают, что на текущем рынке LLM существует «пузырь» не потому, что сами LLM не мощны, а потому, что люди возлагают на них нереалистичные ожидания. Другое мнение отмечает, что по мере снижения стоимости выполнения AI, ценность оригинальных идей будет расти. Одновременно конкуренция на рынке моделей изображений AI усиливается, и, по слухам, OpenAI выпустит обновленную модель, чтобы противостоять конкурентам, таким как Nano Banana Pro. (Источник: aiamblichus, cloneofsimo, op7418, dejavucoder)

amen. we're in the middle of an LLM bubble not because LLMs are not amazing, but because people desperately want them to be something they aren't

Качество контента AI, академическая честность и споры о коммерческой этике: Реклама AI от McDonald’s была снята из-за «катастрофического» маркетинга, что подчеркивает двойственную природу инструментов AI, которые могут как усиливать человеческую креативность, так и глупость. Одновременно было обнаружено, что 21% рецензий на статьи международной конференции по AI были сгенерированы AI, что вызвало серьезные опасения по поводу академической честности. Кроме того, Instacart обвиняется в завышении цен на товары с помощью экспериментов с ценообразованием на основе AI, что вызвало опасения по поводу коммерческой этики AI. (Источник: Reddit r/artificial, Reddit r/ArtificialInteligence, Reddit r/artificial)

McDonald's AI disaster: Marketing 101

Влияние AI на будущие рабочие места и требования к навыкам: Влияние AI на занятость младших разработчиков вызвало дискуссии. Некоторые мнения считают, что AI заменит базовые работы, но также может помочь разработчикам учиться и формировать инструменты через открытый исходный код и сети наставников. Одновременно AI делает более важными такие продвинутые навыки, как системное мышление, функциональная декомпозиция и абстрагирование от сложности, что отражает потребность будущего рынка труда в многопрофильных талантах. (Источник: LearnOpenCV, code_star, nptacek)

Биография основателя DeepSeek и стратегия компании: Основатель DeepSeek Вэньфэн описывается как «главный герой из другого мира» с высоким рейтингом на вступительных экзаменах в колледж и глубоким опытом в электротехнике. Его уникальная самомотивация, креативность и бесстрашие могут повлиять на технологический путь DeepSeek и даже изменить ландшафт конкуренции AI между Китаем и США. Это подчеркивает важность личных качеств лидеров в сфере AI для развития компании. (Источник: teortaxesTex, teortaxesTex)

top response casually claims that Wenfeng scored around #100 on Gaokao in Guangdong Province (pop. 127M). That's… pretty high. @DoggyDog1208 estimate?

Заявления о системе AGI и сомнения: Токийская фирма заявляет о разработке «первой в мире» системы AGI, обладающей автономным обучением, безопасностью, надежностью и энергоэффективностью. Однако, поскольку ее определение AGI нестандартно и отсутствуют конкретные доказательства, это заявление вызвало всеобщее сомнение в сообществе AI, подчеркивая сложность определения и проверки AGI. (Источник: Reddit r/ArtificialInteligence)

‘World’s first’ AGI system: Tokyo firm claims it built model with human-level reasoning

Обсуждение физических ограничений общего искусственного интеллекта: Тим Деттмерс опубликовал сообщение в блоге, утверждая, что из-за физических реалий вычислений и узких мест в улучшении GPU общий искусственный интеллект (AGI) и значительный сверхинтеллект не будут достижимы. Этот взгляд бросает вызов общему оптимизму в текущей сфере AI и вызывает глубокие размышления о будущих путях развития AI. (Источник: Tim_Dettmers, Tim_Dettmers)

💡 Другое

Оценка производительности моделей AI: разрыв между синтетическими данными и реальным опытом: Обсуждение указывает на то, что существует значительный разрыв между результатами бенчмарков моделей AI и реальным опытом использования продукта. Многие модели с открытым исходным кодом хорошо показывают себя в бенчмарках, но все еще отстают от закрытых моделей в отношении среды выполнения, мультимодальных возможностей и обработки сложных задач, подчеркивая, что «бенчмарки не равны реальному опыту», и что AI для изображений и видео более наглядно демонстрирует прогресс AI, чем текстовые LLM. (Источник: op7418, ZhihuFrontier, op7418, Dorialexander)

ZhihuFrontier

Социальная реакция, вызванная потреблением электроэнергии центрами обработки данных: Жители по всей Америке выражают сильное сопротивление из-за резкого роста счетов за электроэнергию, вызванного взрывным ростом числа центров обработки данных. Более 200 экологических организаций призывают к общенациональному мораторию на строительство новых центров обработки данных, подчеркивая огромное влияние инфраструктуры AI на окружающую среду и энергетику, а также напряженность между технологическим развитием и распределением социальных ресурсов. (Источник: MIT Technology Review)

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *