Mots-clés:Modèle d’IA, Agent intelligent, Grand modèle de langage, GPT-5.3-Codex, Claude Opus 4.6, Modélisation du monde
🔥 Focus
Duel entre les modèles OpenAI et Anthropic : GPT-5.3-Codex contre Opus 4.6 : Le 6 février 2026, la Silicon Valley a été le théâtre de l’affrontement le plus intense de l’histoire de l’IA. OpenAI a lancé GPT-5.3-Codex, misant sur le concept « AI building AI », atteignant un niveau proche de l’humain dans des tests d’utilisation informatique comme OSWorld, tout en soulignant son optimisation matérielle et logicielle sur les systèmes NVIDIA GB200. Immédiatement après, Anthropic a introduit Claude Opus 4.6, qui, grâce à un contexte ultra-long de 1M et un mécanisme de « Adaptive Thinking », mène largement dans les travaux intellectuels à haute valeur ajoutée (GDPval-AA) en finance et en droit. Ce duel marque l’évolution officielle de l’IA du simple « chatbot » vers des « Autonomous Execution Systems », où les modèles ne se contentent plus de répondre, mais prennent en charge des workflows complexes de bout en bout (Source : sama, Anthropic)

L’arrivée de la « SaaSpocalypse » : Les plugins Agent provoquent un séisme de mille milliards de dollars dans l’industrie logicielle : Le lancement par Anthropic de 11 plugins Claude Cowork (couvrant la finance, le juridique, la vente, etc.) a déclenché une panique immédiate à Wall Street concernant le secteur SaaS traditionnel. Le marché a réalisé que lorsque l’IA peut directement livrer des résultats tels que des « examens de contrats » ou des « analyses financières », le modèle traditionnel de logiciel basé sur la facturation par siège et la vente d’interfaces UI perd sa valeur. En conséquence, les actions de géants comme Salesforce et Thomson Reuters ont chuté, effaçant près de mille milliards de dollars de capitalisation boursière mondiale en une semaine. Cette « SaaSpocalypse » annonce une transition brutale de l’industrie logicielle de « la vente d’outils » vers « la vente de résultats », les AI Agents remodelant la distribution du pouvoir dans l’économie numérique (Source : 36氪, 王智远)

Ouverture du paradigme World Modeling : Li Fei-fei et NVIDIA discutent des nouvelles frontières de l’IA : Jim Fan, responsable de la robotique chez NVIDIA, et Li Fei-fei, fondatrice de World Labs, se sont exprimés simultanément pour définir le « World Modeling » comme la nouvelle génération de paradigme de l’IA après le « Next Token Prediction ». Li Fei-fei a dévoilé Marble, le premier produit de Spatial Intelligence, capable de transformer des instructions multimodales en mondes 3D interactifs et physiquement cohérents. Jim Fan estime que 2026 sera l’année fondatrice où les Large World Models poseront les bases de la robotique. Ce changement signifie que l’IA sortira des écrans numériques pour passer de la « Language Intelligence » à la « Embodied Intelligence » en comprenant la structure géométrique et la causalité du monde physique en trois dimensions (Source : 36氪, Jim Fan)

Lancement d’OpenAI Frontier : Une plateforme de gestion de « collègues IA » pour les entreprises : OpenAI a officiellement lancé la plateforme Frontier, visant à résoudre le problème des « silos d’IA » au sein des entreprises. Plutôt que de fournir simplement des modèles, Frontier construit un système similaire à un « RH pour IA », permettant aux entreprises de créer, déployer et gérer des centaines de « AI colleagues ». Frontier permet aux agents de partager le contexte métier, d’apprendre par feedback, et dispose de limites de sécurité et de permissions strictes. Notamment, la plateforme adopte des standards ouverts, supportant même la gestion d’agents tiers provenant d’Anthropic ou de Google, illustrant l’ambition d’OpenAI de devenir le système d’exploitation d’entreprise de l’ère de l’IA (Source : OpenAI)

🎯 Tendances
L’ère de la Linear Attention arrive : Alibaba publie Qwen3-Coder-Next : Qwen3-Coder-Next d’Alibaba adopte l’architecture Gated DeltaNet Linear Attention, où 75 % des calculs suivent une voie linéaire. Comparé à la complexité O(n²) de l’Attention traditionnelle, la Linear Attention atteint une complexité O(n). Lors du traitement de contextes ultra-longs (ex: 256K), elle économise non seulement de la puissance de calcul et de la VRAM, mais améliore aussi considérablement le débit de décodage. Cela marque 2026 comme l’année potentielle de la Linear Attention, avec des acteurs comme DeepSeek et Kimi misant également sur cette technologie pour optimiser l’efficacité du raisonnement sur textes longs (Source : karminski3)

Sortie de Kuaishou Kling 3.0 : La vidéo IA entre dans l’ère du réalisme à 100 % : Kling 3.0 est officiellement en ligne, mettant en avant la technologie « Custom Multi-Shot », permettant la génération de vidéos de haute qualité jusqu’à 15 secondes. Cette nouvelle version réalise un bond en avant en termes de cohérence des personnages, d’effets sonores natifs et de détails d’image, qualifiée par les créateurs de « Terminator de Hollywood ». Une seule image suffit pour générer des séquences d’ouverture de niveau cinématographique, réduisant considérablement le coût et la barrière à l’entrée de la production audiovisuelle professionnelle (Source : Kling_ai)
Le modèle « Avocado » de Meta dévoilé : Efficacité de calcul multipliée par 100 : Le laboratoire de super-intelligence de Meta a terminé le pré-entraînement d’une nouvelle génération de modèle de base, nom de code « Avocado ». Une note interne indique que, sans fine-tuning, ses performances en connaissances et vision égalent les modèles leaders, avec une efficacité sur les tâches textuelles 10 fois supérieure à la génération précédente et 100 fois supérieure à une version non publiée. Meta cherche, via une efficacité d’entraînement extrême, un meilleur retour sur investissement parmi les 135 milliards de dollars investis dans l’IA en 2026 (Source : 36氪)
Lancement d’Intern-S1-Pro : Un modèle MoE chinois de 1T de paramètres pour concurrencer Gemini : Le Shanghai AI Lab a publié Intern-S1-Pro, un modèle de raisonnement scientifique multimodal open-source de 1T de paramètres. Utilisant une architecture à 512 experts (22B activés), il introduit le Fourier Position Encoding (FoPE) et la technologie STE routing. Très performant sur les tâches AI4Science, il représente une percée majeure pour les modèles open-source chinois dans les domaines de la haute parcimonie et du raisonnement scientifique (Source : teortaxesTex)

🧰 Outils
Claude Code lance la fonction « Agent Teams » : La dernière fonctionnalité expérimentale de Claude Code permet aux utilisateurs de lancer des « Agent Teams », où un Agent leader décompose les tâches et coordonne plusieurs Agents coéquipiers travaillant en parallèle. Lors de tests internes chez Anthropic, cette équipe d’IA a écrit de manière autonome un compilateur C de 100 000 lignes de code en deux semaines et a compilé avec succès le noyau Linux. Cela marque un passage majeur de la programmation IA de « l’assistance individuelle » au mode « collaboration d’équipe » (Source : Anthropic)

Perplexity lance le « Model Council » : Les abonnés Perplexity Max peuvent désormais exécuter simultanément trois modèles de pointe pour comparer les résultats. Cette fonction vise à fournir des réponses plus précises et fiables via une validation croisée multi-modèles, réduisant le risque d’hallucinations. Ce protocole non officiel est devenu un workflow standard en interne chez Perplexity pour réduire le changement de contexte (Source : Perplexity)
Nanobot : Un assistant IA open-source minimaliste défiant OpenClaw : Le Data Science Lab de l’Université de Hong Kong a rendu open-source Nanobot, avec seulement 4000 lignes de code. Face à OpenClaw, jugé trop volumineux et sujet à des controverses de sécurité, Nanobot propose une architecture minimaliste supportant plusieurs LLM, la recherche web, la mémoire persistante et des accès multi-canaux (Telegram/Feishu). Il offre aux développeurs un modèle d’apprentissage d’Agent plus transparent et facile à modifier (Source : dotey)

LangSmith lance Insights Agent : Analyse automatique du comportement des Agents : LangChain a introduit dans LangSmith l’Insights Agent piloté par l’IA, capable de trier automatiquement les traces d’exécution des Agents. Il analyse l’utilisation faite par l’utilisateur, identifie les erreurs de l’Agent et propose des optimisations. Cela résout le problème de la « boîte noire » après le déploiement, permettant de passer d’un débogage de code à un débogage de la logique de raisonnement (Source : LangChain)
📚 Apprentissage
Nature présente le modèle OpenScholar : Guérir les hallucinations par « Retrieval + Self-check » : Le modèle OpenScholar de 8B paramètres, développé par l’Université de Washington et Ai2, a fait la couverture de Nature. Au lieu de compter sur la mémorisation, il utilise une base de données externe de 45 millions d’articles scientifiques pour exécuter un processus rigoureux de « Retrieval-Rerank-Generate-Self-check ». Dans les tâches de synthèse scientifique, il surpasse des modèles flagships bien plus grands, prouvant qu’une base de connaissances externe précise est plus fiable qu’une mémoire boîte noire (Source : 新智元)

TinyLoRA : Apprendre le raisonnement avec seulement 13 paramètres : Une nouvelle thèse de doctorat présente une méthode de fine-tuning nommée TinyLoRA. En combinant TinyLoRA et le Reinforcement Learning, les chercheurs n’ont utilisé que 13 paramètres entraînables pour faire passer le score d’un modèle Qwen 7B de 76 % à 91 % sur le benchmark mathématique GSM8K. Cela remet en question l’idée reçue selon laquelle le fine-tuning nécessite un grand nombre de paramètres (Source : BlackHC)

Article interactif d’Eric Jang : « Thinking like a stone » : L’expert en robotique Eric Jang a publié un article interactif profond sur les modèles de pensée, l’automatisation de la recherche et son futur. Le texte explore comment, avec l’abondance des ressources de calcul, l’IA passera d’outil passif à sujet actif de recherche scientifique, prédisant que le rythme de travail « 007 » deviendra la norme à l’ère de l’IA, suscitant de vifs débats sur la trajectoire de l’AGI (Source : _sholtodouglas)
💼 Business
ElevenLabs lève 500 millions de dollars en Série D, valorisation à 11 milliards : Le géant britannique de l’audio IA ElevenLabs a annoncé un nouveau tour de table mené par Sequoia, sa valorisation ayant bondi de plus de 50 milliards de RMB en un an. Le CEO a révélé que la société envisage une IPO et déplace son focus stratégique des modèles audio vers les « Conversational Agents » pour remodeler l’interaction homme-machine (Source : 智东西)

ClickHouse lève 400 millions de dollars, valorisation à 15 milliards : ClickHouse, l’étoile montante des bases de données open-source, a annoncé un nouveau financement. Sa vitesse de requête est 260 fois supérieure à celle de MySQL. Infrastructure clé derrière GPT-4o et Claude 4, ClickHouse est devenu le choix privilégié de géants comme ByteDance, Alibaba et Tesla pour l’analyse en temps réel des flux massifs de données IA (Source : 智东西)

StepFun lève 5 milliards de RMB en Série B+, Yin Qi nommé président : Yin Qi, fondateur de Megvii, prend officiellement les rênes de StepFun (阶跃星辰), marquant une nouvelle phase de la compétition des grands modèles où le talent prime sur le capital. Yin Qi poussera l’intégration des modèles multimodaux avec la stratégie « AI + Car », comblant les lacunes de StepFun en matière de narration commerciale et d’efficacité organisationnelle (Source : 市象)
🌟 Communauté
Karpathy déclare la fin du « Vibe Coding », ouvrant l’ère de l’« Agentic Engineering » : Karpathy a publié un article soulignant que le Vibe Coding d’il y a un an était plutôt amateur, alors qu’aujourd’hui, programmer avec des Agents est devenu le standard professionnel. Il propose le concept d’« Agentic Engineering », soulignant que les développeurs doivent passer de « l’écriture de code » à « la conception et la gestion d’architectures », 99 % du code étant pris en charge par l’IA (Source : 新智元)

Le mythe du réseau social IA « Moltbook » s’effondre : Graves failles de sécurité signalées : Moltbook, qui prétendait avoir 1,5 million d’utilisateurs IA enregistrés, a été exposé pour des erreurs de configuration de base de données, entraînant la fuite de nombreuses clés API. Des agences de sécurité indiquent que la « légion de millions d’IA » était principalement composée de faux comptes générés par scripts. Cet incident a provoqué une réflexion profonde sur le marketing excessif et les failles de sécurité des projets d’AI Agents (Source : 壹番YIFAN)
La plateforme Rent-a-Human devient virale : L’IA commence à embaucher des humains : Après le lancement de RentAHuman.ai, 40 000 personnes se sont inscrites. Sur cette plateforme, les AI Agents agissent en tant que donneurs d’ordres pour des tâches de vérification hors ligne ou des courses, tandis que les humains « louent leur corps » pour accomplir des tâches physiques inaccessibles à l’IA. Ce modèle « Human as a Service (HaaS) » suscite des débats passionnés sur la future relation homme-machine (Source : 极客公园)

💡 Autres
Les constructeurs automobiles pivotent vers la « Embodied Intelligence » : Jia Yueting lance quatre robots : FF, dirigé par Jia Yueting, a lancé quatre séries de robots (Futurist, Master, etc.) à partir de 17 000 RMB, affirmant avoir déjà reçu 1211 commandes. Parallèlement, Li Auto, XPeng et Xiaomi déplacent également leur narration vers l’IA et la robotique, tentant de passer d’une logique de fabrication traditionnelle à une valorisation de société technologique IA (Source : 超电实验室, 螺旋实验室)
Interview d’Elon Musk : Les data centers spatiaux sont la solution ultime au goulot d’étranglement énergétique : Dans un entretien avec Dwarkesh, Musk estime que la vitesse d’expansion électrique sur Terre ne pourra pas suivre la demande de l’IA, alors que l’espace offre une énergie solaire illimitée sans contraintes réglementaires. Il prévoit d’utiliser Starship pour lancer massivement des centres de calcul en orbite et a révélé la construction de l’« Optimus Academy » pour entraîner une armée de millions de robots via des simulations en boucle fermée (Source : dwarkesh_sp)
CATL lance la batterie 5C Ultra-fast Charging : Charge complète en 12 minutes, durée de vie de 1,5 million de miles : La nouvelle génération de batteries de CATL peut maintenir une durée de vie extrêmement longue même sous des températures élevées, surpassant largement la moyenne de l’industrie. Ceci est considéré comme une percée majeure dans les technologies de stockage et de recharge d’énergie dans le contexte de la demande électrique de l’IA, accélérant potentiellement la transformation intelligente du système énergétique des transports (Source : kimmonismus)