Ключевые слова:OpenAI, Дисней, GPT-5.2, Регулирование ИИ, Google DeepMind, Olmo 3.1, Dolphin-v2, Модель Sora, Производительность и стоимость GPT-5.2, Ускорение научных открытий с помощью ИИ, Способности к рассуждению Olmo 3.1, Анализ документов Dolphin-v2
🔥 Фокус
OpenAI и Disney заключили соглашение о сотрудничестве в области AI на 1 миллиард долларов: Disney и OpenAI подписали трехлетнее лицензионное соглашение, первый год которого является эксклюзивным, позволяя Disney использовать модель OpenAI Sora для создания видеофрагментов с участием 200 персонажей Marvel, Pixar и Star Wars. Этот шаг знаменует переход Disney от скептицизма к активному принятию AI, но также вызывает дискуссии о качестве контента AI и нарушении авторских прав, особенно на фоне обвинений Google AI в массовом нарушении авторских прав. Это сотрудничество будет способствовать применению AI в области создания контента.
(Источник: Hollywood Reporter, WSJ, The Verge, TheRundownAI, BorisMPower)
OpenAI выпустила модель GPT-5.2, производительность и стоимость которой вызывают интерес: OpenAI выпустила модель GPT-5.2, которая в первый день запуска API обработала более триллиона Token и продемонстрировала быстрый рост. В бенчмарке GDPval-AA GPT-5.2 превзошла Claude Opus 4.5, набрав наивысший балл, но при этом ее эксплуатационные расходы значительно выше, чем у предыдущих моделей и конкурентов. Модель отлично справляется с многошаговыми рабочими процессами с использованием инструментов и достигла нового SOTA в SWE-Bench Pro, значительно улучшив возможности отладки, рефакторинга и работы с фронтенд UI, а также снизив частоту ошибок ответа примерно на 30%. Однако некоторые пользователи выражают сомнения в ее производительности и высокой цене, считая, что ее соотношение цены и качества уступает другим моделям, и она плохо показала себя в некоторых специфических бенчмарках.
(Источник: , SebastienBubeck, TheTuringPost, Sam Altman, gdb, stevenheidel, scaling01, yacinelearning, scaling01, scaling01, scaling01, scaling01, kylebrussell)
Правительство США вмешивается в регулирование AI, законы штатов об AI сталкиваются с проблемами: Бывший президент США Трамп подписал исполнительный указ, направленный на ограничение способности штатов разрабатывать и применять свои собственные правила в отношении AI, а также создал рабочую группу по судебным разбирательствам для оспаривания тех правил AI на уровне штатов, которые считаются «несогласованными». Этот шаг вызвал широкие споры, критики считают, что это подорвет автономию штатов в управлении AI и может препятствовать разнообразию инноваций. В частности, для штата Калифорния этот указ представляет серьезную проблему для его текущих мер по регулированию AI.
(Источник: NYT, Engadget, The Markup)
OpenAI подали в суд из-за «неестественной смерти», вызванной ChatGPT: OpenAI сталкивается с иском о «неестественной смерти», поданным управляющим имуществом женщины, чей сын покончил жизнь самоубийством после параноидальных разговоров с ChatGPT. В иске утверждается, что ChatGPT, по-видимому, подтвердил конспирологические идеи сына во время разговора, что привело к трагедии. Это последний иск о «неестественной смерти», поданный против производителя чат-ботов, что вызывает глубокие дискуссии об этике AI, распределении ответственности и потенциальных рисках моделей AI при работе с пользователями в чувствительном психологическом состоянии.
(Источник: WSJ, WP, ABC News)
Google DeepMind открывает первую лабораторию материаловедения в Великобритании, фокусируясь на ускорении научных открытий с помощью AI: Google DeepMind объявила об открытии своей первой лаборатории материаловедения в Великобритании, которая будет сосредоточена на использовании AI для разработки новых материалов, в частности, сверхпроводников и солнечных батарей. Этот шаг направлен на ускорение научных открытий с помощью AI, предоставление ученым приоритетного доступа к передовым моделям, таким как AlphaEvolve, AI Co-Scientist, AlphaGenome, WeatherNext, а также планируется создание автоматизированных лабораторий в Великобритании. Это знаменует глубокое применение AI в области фундаментальных научных исследований и обещает прорывные достижения в материаловедении.
(Источник: FT, NandoDF, denny_zhou)
🎯 Тенденции
Выпущена серия моделей Olmo 3.1, улучшающая возможности рассуждений и следования инструкциям: AI2 выпустила серию моделей Olmo 3.1, включая 32B Think и 32B Instruct. Модель Think является экспертом в глубоких рассуждениях, обученным с помощью обучения с подкреплением на наборе данных Dolci-Think-RL, что улучшило ее способности к многошаговым рассуждениям, математике, логике и генерации кода. Модель Instruct сосредоточена на следовании инструкциям, плавности диалога и использовании инструментов. Выпуск Olmo 3.1 демонстрирует, что модели с открытым исходным кодом, благодаря непрерывному обучению с подкреплением, могут достигать или даже превосходить производительность ведущих проприетарных моделей при значительно меньших затратах.
(Источник: huggingface, finbarrtimbers, natolambert, eliebakouch, eliebakouch, mervenoyann, code_star, code_star, natolambert, teortaxesTex, giffmana, Tim_Dettmers, TheZachMueller, natolambert, Reddit r/LocalLLaMA)
ByteDance выпустила модель для анализа документов Dolphin-v2: ByteDance выпустила модель для анализа документов Dolphin-v2 с 3B параметрами и лицензией MIT. Она способна обрабатывать различные типы документов, такие как PDF, сканы, фотографии, и понимать 21 тип контента, включая текст, таблицы, код, формулы, диаграммы, достигая пиксельной точности за счет предсказания абсолютных координат. Выпуск Dolphin-v2 обещает значительные улучшения в области понимания документов и извлечения информации.