Quotidien IA – 2025-12-18(Soir)

Mots-clés:Gemini 3 Flash, GPT-5.2, Modèle d’IA, SAM Audio, Robot humanoïde, MiMo-V2-Flash, Grand modèle de Tencent, Raisonnement multimodal, IA d’édition audio, Capacité de production de robots incarnés, Grand modèle open source, Grand modèle d’IA pour la santé

🔥 Focus

Google lance Gemini 3 Flash : Google a lancé Gemini 3 Flash, offrant une intelligence de pointe à un coût extrêmement bas, son prix n’étant que de 25% de celui de la version Pro, mais surpassant Gemini 3 Pro dans des benchmarks clés tels que MMMU-Pro et SWE-bench Verified, et étant 3 fois plus rapide. Ce modèle est conçu pour le développement itératif, offrant des performances de programmation et une faible latence proches de Gemini 3 Pro. Il prend en charge l’inférence multimodale et peut être utilisé pour l’analyse vidéo, l’extraction de données et les questions-réponses visuelles. Gemini 3 Flash est désormais entièrement disponible ; les utilisateurs grand public peuvent l’utiliser dans l’application Gemini et le mode AI de Google Search, tandis que les développeurs peuvent l’intégrer via une API, ce qui devrait permettre d’intégrer plus largement l’AI dans les applications quotidiennes et les systèmes commerciaux.(Source:36氪, 36氪

谷歌甩出“价格屠夫”,Gemini 3 Flash超Pro,成本仅1/4,速度如“闪电”

OpenAI lance la série de modèles GPT-5.2 : OpenAI a lancé la série de modèles GPT-5.2, comprenant Pro, Thinking et Instant, pour faire face à la concurrence de Google Gemini 3. GPT-5.2 a établi de nouveaux records dans les benchmarks de puzzles visuels abstraits tels que ARC-AGI-1 et ARC-AGI-2, avec une amélioration significative de l’efficacité computationnelle et un coût réduit à 1/390 de celui de GPT-5.1. Le modèle offre des niveaux d’inférence ajustables (y compris x-high) et prend en charge la synthèse contextuelle pour étendre les limites d’entrée. Ce lancement vise à améliorer l’efficacité des tâches professionnelles, telles que la génération de code, la création de feuilles de calcul et de présentations, et souligne une viabilité économique considérablement améliorée pour les tâches de raisonnement complexes.(Source:DeepLearning.AI Blog

OpenAI’s Answer to Gemini 3, Runway’s Interactive Worlds, Disney’s Alliance With OpenAI, Adapting LLMs for Low-Data Domains

Un modèle AI résout de manière autonome un problème mathématique ouvert : GPT-5 a résolu pour la première fois de manière autonome un problème mathématique ouvert soumis au benchmark IMProofBench, en fournissant une preuve complète et correcte, sans aucune intervention ni incitation humaine. Cette percée représente une contribution, certes modeste mais nouvelle, à la géométrie énumérative, et marque un progrès significatif dans les capacités de raisonnement mathématique complexe et de résolution de problèmes des modèles AI. Cet événement a suscité une large discussion au sein de la communauté sur le potentiel de l’AI dans la recherche mathématique, annonçant un rôle de découverte plus actif pour l’AI dans de nombreux autres domaines scientifiques à l’avenir.(Source:SebastienBubeck, kevinweil, gdb, OfirPress, SebastienBubeck

AI模型自主解决开放数学问题

Meta lance SAM Audio : Meta a lancé SAM Audio, le premier modèle AI unifié permettant aux utilisateurs d’isoler et d’éditer des sons à partir de mixages audio complexes. Ce modèle peut “détourer” des sons comme Photoshop détourne des images, grâce à des invites textuelles, visuelles et temporelles, permettant d’isoler une guitare dans une chanson, de filtrer le bruit de la circulation ou de supprimer les aboiements de chien dans un podcast. Cette innovation devrait révolutionner le processus d’édition audio, le rendant aussi simple que le traitement de texte et d’images, réduisant la barrière des connaissances professionnelles en mixage et favorisant la démocratisation et l’amélioration de l’efficacité de la création de contenu audio.(Source:ylecun, ylecun, dotey

🎯 Tendances

Yunpeng Technology lance de nouveaux produits AI+Santé : Yunpeng Technology, en collaboration avec Shuaikang et Skyworth, a lancé de nouveaux produits AI+Santé, notamment le “Laboratoire de cuisine future numérisée et intelligente” et un réfrigérateur intelligent équipé d’un grand modèle AI de santé. Le grand modèle AI de santé peut optimiser la conception et le fonctionnement de la cuisine, tandis que le réfrigérateur intelligent offre une gestion personnalisée de la santé via l’« Assistant Santé Xiaoyun ». Cela marque une application approfondie de l’AI dans la gestion quotidienne de la santé et les domaines de la maison intelligente, promettant de fournir des services de santé personnalisés via des appareils intelligents et d’améliorer la qualité de vie.(Source:36氪

云澎科技发布AI+健康新品

L’industrie des robots humanoïdes face à un dilemme de capacité de production : En 2025, l’industrie des robots incarnés est passée d’un engouement intense à un ralentissement, avec des commandes dépassant les 3,5 milliards de yuans, mais moins de mille unités livrées, soulignant un dilemme de capacité de production. Les entreprises leaders comme ZHIYUAN et UBTECH ont vu leurs commandes augmenter considérablement, mais leur capacité de production de masse est toujours en phase de transition de centaines à milliers d’unités. Le marché C-end (grand public) peine à se concrétiser, avec des scénarios d’utilisation limités, des prix élevés et des ventes plafonnant à moins de mille unités. L’industrie est confrontée à l’embarras de la démonstration technologique excessive et du manque de praticité, comme les lacunes de stabilité des robots lors des marathons. Malgré de nombreux défis, le soutien politique et la confiance des capitaux, l’industrie est en période de transition, passant de la “faisabilité technique” à la “marchandise fiable”.(Source:36氪, 36氪

人形机器人的尴尬生意:订单超35亿,交付不足千台

La transformation et les défis de Meitu en matière d’AI : Meitu, sous la vague de l’AI, revient à sa ligne principale d’outils, réalisant sa transformation grâce à des produits C-end comme Meitu Xiuxiu et Meiyan Xiangji, et des outils de productivité B-end comme Meitu Design Studio et Kaipai. RoboNeo, en tant que plateforme AI Agent, intègre des modèles tiers et le Miracle Vision auto-développé, visant à résoudre les points douloureux de l’implémentation de l’AI via l’approche “génération AI + correction manuelle”. Cependant, la rétention des utilisateurs de RoboNeo est médiocre, en particulier face à la concurrence de produits comme Google Nano Banana, l’incertitude de croissance sur le marché B-end à l’étranger s’intensifie. Malgré cela, Meitu, grâce à sa base de trafic de 200 millions de MAU et à la vitalité innovante de son équipe, conserve une marge de manœuvre dans le domaine des SaaS verticaux, et approfondira à l’avenir l’intégration de la technologie et des produits pour faire face à la concurrence des grands modèles.(Source:36氪

美图:AI席卷,“垂类SaaS”有活路吗?”

Xiaomi lance le grand modèle MiMo-V2-Flash : Xiaomi a officiellement open-sourcé le grand modèle MiMo-V2-Flash, se classant dans le premier échelon de l’open source avec 309 milliards de paramètres, atteignant une accélération d’inférence de 2,6 fois tout en équilibrant les performances des modèles de pointe et les coûts de déploiement. Ce modèle a obtenu un score élevé de 73,4% dans l’évaluation de code SWE-Bench Verified, dépassant DeepSeek-V3.2 et Kimi-K2 Thinking, et démontrant des performances exceptionnelles en matière de capacités Agent. Il utilise des technologies telles que le mécanisme d’attention hybride 5:1, le biais d’agrégation d’attention apprenable, la prédiction de Token multi-couches MTP et la distillation de stratégie multi-enseignants en ligne MOPD, améliorant considérablement l’efficacité et la compréhension des textes longs. MiMo-V2-Flash a démontré un très haut degré d’achèvement dans des scénarios de programmation réels et possède des capacités d’interaction humaine avec une grande intelligence émotionnelle, marquant l’ambition de Xiaomi de se transformer en une “AGI du monde physique”.(Source:36氪

小米大模型“杀”进第一梯队:代码能力开源第一,智商情商全在线

Tencent ajuste son architecture de R&D pour les grands modèles : Tencent a ajusté son architecture de R&D pour les grands modèles, nommant Yao Shunyu, ancien chercheur chez OpenAI, au poste de Chief AI Scientist du “Bureau du CEO/Président”, relevant directement du président Martin Lau, et occupant également les postes de responsable du département AI Infra et du département des grands modèles de langage. Cette initiative vise à renforcer la compétitivité globale de Tencent en matière de puissance de calcul, de données et de capacités d’ingénierie, et à modifier sa position relativement en retard dans le développement des grands modèles. L’arrivée de Yao Shunyu et la création de nouveaux départements marquent l’élévation de l’AI au rang de stratégie d’entreprise centrale pour Tencent, qui s’engage à construire un système de R&D centré sur les modèles fondamentaux afin de relever les défis posés par des concurrents comme ByteDance et Alibaba en matière d’applications AI et de capacités de modèles.(Source:36氪, 36氪, 36氪