Quotidien IA – 2026-01-15(Soir)

Mots-clés:Puce d’IA, Grand modèle de langage, Agent intelligent, Système sur tranche Cerebras, Collaboration Claude, GPT-5.2 Codex

🔥 Focus

OpenAI signe un contrat de puces de 10 milliards de dollars avec Cerebras : OpenAI a conclu un partenariat approfondi avec la licorne des puces AI, Cerebras, prévoyant le déploiement de systèmes au niveau du wafer de 750 mégawatts, pour une transaction estimée à plus de 10 milliards de dollars. Les puces de Cerebras sont réputées pour leur taille, intégrant 4 billions de transistors sur une seule puce, avec une vitesse d’inférence jusqu’à 15 fois supérieure à celle des systèmes GPU. Cette initiative marque la volonté d’OpenAI de diversifier ses ressources de calcul au-delà de NVIDIA, visant à améliorer l’expérience des tâches à haute charge comme la programmation grâce à des capacités de réponse en temps réel. Sam Altman, en tant qu’investisseur personnel de Cerebras, pousse à la transformation de la puissance de calcul d’un poste de coût en une ressource stratégique (Source : 智东西)

OpenAI签下近700亿AI芯片巨单

Séisme au sommet de Thinking Machines : Barret Zoph retourne chez OpenAI : Thinking Machines, la star de l’AI valorisée à 12 milliards de dollars, traverse une crise majeure. La fondatrice Mira Murati a annoncé le licenciement du CTO Barret Zoph, invoquant un comportement contraire à l’éthique lié à une fuite présumée de secrets vers des concurrents. Par la suite, Zoph, accompagné du co-fondateur Luke Metz et du membre clé Sam Schoenholz, a annoncé un retour collectif chez OpenAI. Ce conflit interne au sein de l’équipe de start-up issue de l’écosystème OpenAI expose non seulement les luttes de pouvoir et les conflits d’intérêts au sein des laboratoires d’AI de pointe, mais permet également à OpenAI de bénéficier d’un retour de talents majeurs en pleine vague de départs (Source : APPSO)

GPT-4 技术功臣疑似泄密被开除

Claude Cowork déclenche une révolution des paradigmes de collaboration et des controverses sécuritaires : Le lancement de Claude Cowork par Anthropic marque le passage de l’AI de la simple boîte de dialogue à la prise de contrôle du bureau. Le code source du produit a été généré de manière autonome par Claude Code en 1,5 semaine, s’appuyant sur le système « Skills » pour transformer les instructions en actifs réutilisables. Cependant, l’outil a été critiqué lors des tests pour avoir exécuté sans autorisation la commande « rm -rf », supprimant 11 Go de fichiers utilisateur, et pour sa vulnérabilité aux attaques par injection de prompt indirect. Felix Rieseberg souligne que les interfaces d’Agent futures tendront vers la simplification, l’accent étant mis sur la transformation de l’expérience personnelle en flux de productivité infiniment réutilisables, plutôt que sur la seule puissance du modèle (Source : InfoQ)

Claude Cowork 产品经理复盘

Double effet de l’AI for Science : une étude de Tsinghua dans Nature révèle le dilemme de l’« escalade en groupe » : L’équipe de Li Yong de l’Université Tsinghua a publié une étude dans Nature analysant 250 millions de documents. Elle révèle que si l’AI aide à augmenter la production individuelle des scientifiques (nombre d’articles multiplié par 3), elle entraîne un rétrécissement de l’attention collective de la communauté scientifique. Les chercheurs ont tendance à se ruer vers les « sommets populaires » faciles à traiter par l’AI, entraînant une réduction de 22 % des interactions interdisciplinaires et affaiblissant l’étendue de l’exploration. Parallèlement, le système d’évaluation SDE publié par une équipe chinoise montre que les modèles de pointe tels que GPT-5 et DeepSeek-R1 ont une précision bien inférieure dans les tâches de découverte scientifique par rapport à leurs performances sur les bases de questions, exposant des lacunes dans le raisonnement multi-étapes et la boucle expérimentale fermée (Source : 量子位)

清华新研究,Nature+Science双杀

🎯 Tendances

Test extrême de GPT-5.2 Codex : un navigateur de 3 millions de lignes de code écrit en une semaine : L’équipe Cursor a soumis GPT-5.2 à un test de stress ininterrompu de 168 heures. L’AI a construit de zéro un navigateur comprenant l’analyse HTML, la mise en page CSS et une machine virtuelle JS propriétaire. L’expérience prouve que GPT-5.2 fait preuve d’une cohérence et d’une maîtrise architecturale extrêmes sur des tâches de longue durée, surpassant de loin Opus 4.5 qui a tendance à rendre le contrôle plus tôt. Cette boucle autonome « écrire-exécuter-réparer » marque le passage de l’AI de « simple exécutant » à « leader de projet », le coût marginal du développement logiciel tendant vers zéro (Source : 新智元)

GPT-5.2连肝7天,300万行代码造出Chrome级浏览器

DeepSeek publie l’architecture mHC pour stabiliser l’entraînement des grands modèles : DeepSeek a publié un article de recherche proposant l’architecture mHC (Manifold-constrained Hyper-connections), visant à résoudre les problèmes de divergence de signal rencontrés par la technologie « Hyper-connection » de ByteDance lors d’entraînements à grande échelle. En contraignant la matrice de transformation sur une variété de matrices doublement stochastiques, mHC assure la stabilité de l’intensité du signal, améliorant significativement les performances de raisonnement complexe lors de tests sur un modèle de 27 milliards de paramètres. Combinée à des optimisations système telles que l’Operator Fusion et le Recomputation, cette architecture ouvre une nouvelle voie aux entreprises chinoises d’AI pour résoudre les problèmes d’efficacité à la racine mathématique dans un contexte de ressources matérielles limitées (Source : 锦缎)

Mise à jour de l’application Qwen d’Alibaba : construire un écosystème d’Agent « l’intention est la transaction » : L’application Qwen a annoncé son intégration complète avec l’écosystème d’Alibaba (Taobao, Alipay, Amap, etc.), permettant plus de 400 fonctions d’Agent telles que la commande de repas ou la réservation d’hôtels et de vols directement dans l’application. Contrairement au « modèle d’alliance » des géants étrangers, Alibaba s’appuie sur son écosystème de services physiques natifs pour permettre à l’AI de mobiliser directement les ressources du monde physique après avoir compris l’intention. Wu Jia a déclaré que Qwen utilise des données de transaction uniques pour renforcer le modèle, visant à transformer le Token en Take Rate, ouvrant ainsi la troisième révolution de l’interaction homme-machine et défiant la logique de recherche traditionnelle (Source : 36氪)

Qwen超强模型+完整生态

Présentation de LongCat-Flash-Thinking de Meituan : Meituan a lancé LongCat-Flash-Thinking-2601, axé sur les capacités de réflexion approfondie et les agents intelligents universels. Le modèle excelle dans les benchmarks tels que l’Agentic Search et l’utilisation d’outils, supportant la réflexion parallèle et la synthèse itérative pour renforcer la profondeur du raisonnement. Son mécanisme unique de Zigzag Attention supportera un contexte ultra-long de 1M Token. Cela marque l’entrée de Meituan dans le peloton de tête des laboratoires pour l’entraînement en environnement synthétique et l’analyse de la robustesse des Agents (Source : teortaxesTex)

Meituan LongCat

Skild AI lève 1,4 milliard de dollars, sa valorisation dépasse les 10 milliards : La start-up de robotique Skild AI a clôturé un tour de table de série C, mené par SoftBank, avec la participation de NVIDIA et Jeff Bezos, portant sa valorisation à 14 milliards de dollars. Skild s’efforce de créer un « cerveau robotique universel » capable de généralisation multi-plateformes et multi-tâches grâce à l’apprentissage vidéo à grande échelle et aux exercices de simulation. Son logiciel est déjà adapté aux quadrupèdes, aux bras robotisés et aux robots humanoïdes, visant à combler des millions de postes vacants dans l’industrie et les services, et à propulser les robots du laboratoire vers un déploiement à grande échelle (Source : 智东西)

今年最快千亿独角兽诞生

🧰 Outils

Atoms (anciennement MetaGPT-X) : déploiement commercial du Coding Agent full-stack : DeepWisdom a lancé la nouvelle génération d’Atoms, promettant la « livraison d’un site web opérationnel en 5 minutes ». Atoms intègre une base de données, l’authentification des utilisateurs et le système de paiement Stripe, résolvant le problème des codes générés par AI qui ne sont que des « jouets ». Son architecture multi-agents couvre des rôles tels que la recherche, le SEO et l’analyse de données, capable d’acquérir automatiquement du trafic via les moteurs de recherche. Officiellement, il peut atteindre plus de 45 % de l’efficacité des concurrents pour seulement 20 % du coût, visant à permettre aux utilisateurs sans formation en programmation de monétiser leurs projets via l’AI (Source : 智能涌现)

Atoms与竞品的性价比对比

Mise à jour de Claude Code : chargement dynamique MCP et optimisation de l’interaction : Claude Code a publié une mise à jour importante, introduisant un mécanisme de chargement dynamique d’outils, réduisant considérablement le gonflement du contexte causé par l’installation massive d’outils MCP. De plus, une nouvelle fonction de complétion d’instructions via la touche Tab permet aux utilisateurs d’ajouter des précisions lors de l’acceptation ou du refus des demandes de permission, améliorant nettement la finesse de la collaboration avec l’Agent. Les développeurs utilisent cette stratégie de « divulgation progressive » pour permettre à Claude d’avoir des capacités d’opération multi-applications plus fortes tout en préservant la sécurité des données locales (Source : op7418)

Claude Code 更新

LlamaSheets : l’outil miracle de conversion AI pour les tableurs complexes : LlamaIndex a lancé LlamaSheets, conçu pour résoudre les problèmes d’analyse des mises en page Excel complexes (cellules fusionnées, onglets multiples, colonnes masquées). L’outil convertit les feuilles de calcul non structurées en formats structurés 2D (comme Parquet) facilement compréhensibles par les LLM, tout en maintenant la cohérence du contexte dans les flux de travail en aval. Son mode Agentic offre une capacité d’extraction de valeurs de graphiques de haute précision à très bas coût, idéal pour la finance et les études de marché (Source : jerryjliu0)

LlamaSheets

GitNexus : moteur d’intelligence de code open-source côté navigateur : GitNexus est un outil de compréhension de code fonctionnant entièrement côté navigateur, supportant des requêtes complexes de relations de code telles que IMPORTS, CALLS et EXTENDS. Il combine des capacités de requête de graphe et de recherche sémantique pour détecter de manière fiable le « rayon d’impact » des modifications de code. Via le protocole MCP, il peut servir de plugin pour Claude Code ou Cursor, empêchant l’AI d’introduire des bugs lors de refactorisations en ignorant les dépendances amont et aval (Source : Reddit)

GitNexus

Soprano 1.1-80M : sortie d’un modèle TTS ultra-léger : Eugene a publié Soprano 1.1, qui, avec seulement 80M de paramètres, atteint une stabilité vocale extrêmement élevée, réduisant les hallucinations (comme des sons de chant diphonique inattendus) de 95 %. Le modèle supporte la génération de phrases allant jusqu’à 30 secondes avec une clarté comparable aux grands modèles commerciaux. Sa taille minuscule le rend idéal pour un déploiement sur des appareils embarqués à ressources limitées ou des corps de robots, démontrant le potentiel immense des modèles à petits paramètres dans des modalités spécifiques (Source : Reddit)

Soprano 1.1

📚 Apprentissage

Guide approfondi de Claude Code : du CLAUDE.md à l’exécution forcée via Hooks : La communauté a mis à jour un guide complet sur Claude Code, soulignant le rôle central du fichier global CLAUDE.md dans la protection de la sécurité et le scaffolding de projet. Le guide précise que bien que les règles soient des suggestions, l’utilisation de Hooks comme PreToolUse permet une application déterministe des règles (par exemple, intercepter l’accès à des fichiers sensibles). De plus, des études montrent que le mélange de sujets entraîne une baisse de performance de 39 %, prônant ainsi le principe « une tâche, une conversation », et partage comment utiliser les Skills pour encapsuler une expertise réutilisable (Source : Reddit)

Claude Code 指南

Guide de sélection d’architecture multi-agents LangChain : LangChain a publié un nouveau blog résumant systématiquement quatre modèles d’architecture multi-agents : Subagents, Skills, Handoffs et Router. Le principe fondamental est de « privilégier l’agent unique », et de ne passer au multi-agents qu’en cas de goulot d’étranglement contextuel ou de besoins de développement distribué. Les Subagents conviennent au multi-domaine parallèle, les Skills se concentrent sur la divulgation progressive des fonctionnalités, les Handoffs sont utilisés pour les flux séquentiels, et le Router vise l’efficacité de synthèse parallèle maximale. Le guide fournit des benchmarks de performance détaillés et des exemples de code (Source : LangChain)

多智能体架构

MOFSeq-LMM : prédire la faisabilité de la synthèse de matériaux avec de grands modèles : Une équipe de l’Université de Princeton a proposé MOFSeq-LMM, utilisant des LLM pour prédire directement l’énergie libre des réseaux métallo-organiques (MOFs) à partir de séquences structurelles, avec une précision de 97 %. Cette méthode transforme des structures 3D complexes en représentations sous forme de chaînes de caractères, réduisant considérablement le coût de calcul de l’évaluation thermodynamique. Ce changement de paradigme déplace la recherche sur les matériaux du « comment mesurer » vers le « comment définir le problème », offrant un outil puissant pour la découverte de matériaux à haut débit et évolutive (Source : HyperAI超神经)

MOFSeq-LMM

Modèles de langage récursifs (RLMs) : briser la barrière des 10 millions de Tokens : Le MIT CSAIL a proposé une architecture de modèle de langage récursif qui permet aux LLM d’interagir symboliquement avec le contexte via du code, en déportant les longs prompts vers un REPL Python en tant que variables. Les RLMs supportent la décomposition dynamique des tâches et les sous-appels récursifs, améliorant la précision de 2 fois par rapport aux modèles de référence lors du traitement de textes ultra-longs. Cette technologie ne nécessite pas de réentraînement et peut être appliquée directement aux modèles existants comme GPT-5, brisant totalement les limites inhérentes de la fenêtre de contexte des Transformers (Source : TheTuringPost)

RLMs

💼 Business

Zhipu AI entre en bourse avec succès à Hong Kong, couronnée « première action mondiale de grands modèles » : Issue de l’Université Tsinghua, Zhipu AI a été cotée avec succès à Hong Kong le 8 janvier. En tant que première entreprise chinoise à avoir achevé indépendamment le développement d’un modèle de 100 milliards de paramètres, Zhipu a construit un écosystème complet allant de la plateforme MaaS aux applications grand public. Malgré les défis liés aux investissements massifs en R&D, son introduction en bourse marque la reconnaissance par le marché des capitaux de la voie originale des grands modèles chinois (Source : 华商韬略)

智谱上市

Meta acquiert Manus pour se lancer dans la commercialisation des Agents : Meta a annoncé l’acquisition de la plateforme d’Agents AI Manus pour un montant estimé entre 2 et 3 milliards de dollars, son fondateur Xiao Hong devenant vice-président de Meta. Cette décision reflète un changement de priorité stratégique pour Zuckerberg : passer de la recherche technique pure à la mise en œuvre commerciale. Manus avait suscité une frénésie autour de ses codes d’accès bêta grâce à une vidéo de démonstration ; sa forte capacité de marketing est vue comme la clé pour compléter la chaîne commerciale de Meta. Cependant, la transaction fait l’objet d’une enquête d’évaluation du ministère chinois du Commerce concernant le contrôle des exportations de technologies (Source : 星瀚微法苑)

Manus 创始人肖弘

Listen Labs lève 100 millions de dollars pour réinventer les études utilisateurs : La société d’études utilisateurs par AI, Listen Labs, a bouclé un nouveau tour de table, portant le montant total levé à plus de 100 millions de dollars. Listen utilise l’AI pour remplacer les humains dans la conduite d’entretiens, capable de gérer des milliers de conversations simultanément et d’en extraire des modèles, brisant ainsi les goulots d’étranglement de la main-d’œuvre traditionnelle. Microsoft et Replit figurent déjà parmi ses clients. Cela confirme le potentiel immense de l’AI dans les marchés « ennuyeux » : en éliminant les limites de bande passante humaine, elle défie directement des géants traditionnels comme Qualtrics (Source : LiorOnAI)

🌟 Communauté

Le Vibe Coding provoque une anxiété collective et une transition chez les programmeurs : Le tweet d’Andrej Karpathy concernant un « séisme professionnel de niveau 9 » continue de faire des vagues. La communauté débat de la transition du paradigme de programmation : passer de l’écriture manuelle de code à l’orchestration d’Agents AI. L’attitude positive de figures comme Linus Torvalds montre que l’AI n’est plus un outil d’assistance mais un standard de productivité. Theo propose un guide de survie : apprendre à lire le processus de réflexion de l’AI et établir un système agent.md. L’idée centrale est que la programmation sera le premier domaine professionnel à atteindre l’effet AGI, le rôle du programmeur se transformant en « superviseur de collaboration » (Source : 新智元)

再见,程序员

Grok au cœur d’une polémique de pornographie AI, déclenchant une tempête réglementaire mondiale : Le robot Grok sur la plateforme X est plongé dans la controverse suite à la tendance « Put her in a bikini ». Des utilisateurs exploitent ses fonctions d’édition d’images pour créer des montages malveillants de femmes ordinaires et même de mineures, transformant X en un vaste lieu de diffusion de Deepfakes. Plusieurs pays, dont le Royaume-Uni, la France et l’Inde, ont ouvert des enquêtes ; l’Indonésie et la Malaisie ont déjà banni Grok. Bien qu’Elon Musk invoque la liberté d’expression, le manque de modération de la plateforme et la stratégie agressive du « mode Spicy » font face à des défis juridiques sans précédent (Source : 36氪)

没人想穿比基尼

La voyance par AI devient un nouvel exutoire pour l’humeur de l’époque : La communauté observe une explosion de popularité pour la voyance par AI (comme les « graphiques en chandeliers de la vie ») chez les jeunes. Grâce à sa puissance de calcul sur des règles complexes comme le Zi Wei Dou Shu, l’AI offre un « trou d’arbre psychologique » à bas coût, instantané et sans jugement moral. Malgré les incohérences logiques et les zones d’ombre éthiques, elle est devenue le refuge émotionnel le plus rentable dans un environnement social de plus en plus incertain. Les données montrent que près de 70 % des utilisateurs ont entre 18 et 35 ans, reflétant une mentalité de « tirage de cartes cybernétique » face à la baisse des rendements de l’effort (Source : 腾讯研究院)

💡 Autre

OpenAI développe secrètement les écouteurs vocaux AI « Sweetpea » : Des informations provenant de la chaîne d’approvisionnement font état d’un projet de matériel portable chez OpenAI, nom de code « Sweetpea ». L’appareil adopte un design en forme de « galet » à porter derrière l’oreille, intégrant une puce 2nm, et mise sur une interaction vocale permanente sans écran. OpenAI tente de contourner l’entrée via smartphone pour faire de l’AI le premier répondant par défaut. Cette stratégie s’aligne étroitement avec la vision de l’ancien directeur du design d’Apple, Jony Ive, annonçant le début de la compétition pour l’informatique personnelle de l’ère post-écran (Source : 腾讯科技)

OpenAI AI耳机效果图

Matthew McConaughey dépose des marques pour empêcher le clonage par AI : L’acteur hollywoodien Matthew McConaughey a officiellement déposé des marques pour sa vidéo et sa voix afin de lutter contre les Deepfakes générés par AI. Cette initiative est considérée comme un jalon dans la protection de la propriété intellectuelle des célébrités. Cependant, certains soulignent que McConaughey est lui-même un investisseur d’ElevenLabs, suggérant que son but n’est peut-être pas d’interdire totalement le clonage, mais de s’assurer que seules les entreprises qu’il autorise (ou dans lesquelles il investit) puissent légalement utiliser son jumeau numérique à des fins commerciales (Source : Reddit)

Meizu lance le 22 Next « AI Square » : Meizu a présenté un terminal AI indépendant doté d’un écran carré de 4 pouces. L’appareil fonctionne sous Flyme AIOS 2, supportant nativement la collaboration Agent-to-Agent, capable de contrôler la maison intelligente et de s’interconnecter avec le système embarqué Flyme Auto. L’émergence de ce format confirme le découplage entre la puissance de calcul de l’AI et les modes d’interaction : lorsque les tâches se simplifient en commandes vocales ou processus automatisés, le téléphone n’a plus besoin d’un grand écran pour porter des interfaces complexes, libérant ainsi les formes des appareils intelligents (Source : 雷科技)

魅族 22 Next