Mots-clés:AGI (Intelligence Artificielle Générale), Modèles d’IA à grande échelle, Agent intelligent, Modèle du monde, Mémoire permanente Claude, Paradoxe de la recherche en IA
🔥 Focus
Le lauréat du prix Nobel Hassabis prédit l’arrivée de l’AGI d’ici cinq ans : la clé réside dans les World Models et les percées des Agents : Demis Hassabis, dirigeant de Google DeepMind, donne un calendrier ultime pour l’AGI, estimant que l’humanité n’est qu’à 1 ou 2 percées technologiques majeures de sa réalisation, potentiellement d’ici 5 ans. Il souligne que si les grands modèles actuels sont puissants, ils relèvent d’une « intelligence inégale », manquant d’une réelle compréhension des lois du monde physique et de capacités de planification à long terme. L’avenir nécessite de compléter les « World Models » pour comprendre les lois physiques et d’évoluer vers des « systèmes d’Agents » dotés de capacités de « correction cognitive ». L’impact de cette transformation sera 10 fois supérieur à celui de la révolution industrielle, l’AI devenant l’outil ultime de découverte scientifique, ouvrant un âge d’or dans des domaines tels que la recherche de médicaments et les énergies propres. (Source : 新智元)

Mise à niveau choc de Claude avec la « Mémoire Permanente » : Knowledge Bases et mode Cowork redéfinissent le travail avec l’AI : Anthropic s’apprête à injecter une fonction de « mémoire permanente » dans Claude Cowork via des « Knowledge Bases » pour un stockage durable des connaissances. L’AI n’aura plus une « mémoire de poisson rouge », mais pourra enregistrer automatiquement les préférences des utilisateurs, les processus de décision et les retours d’expérience, devenant plus pertinente au fil de l’utilisation. De plus, Cowork deviendra le point d’entrée principal de Claude, intégrant la barre latérale Artefacts et des connecteurs d’automatisation MCP plus puissants. Cette mise à niveau marque l’évolution de l’assistant AI d’un simple outil de dialogue vers un « collègue AI » capable de collaboration à long terme et d’exécution de tâches complexes, changeant radicalement le paradigme du travail assisté par AI. (Source : 新智元)

ICML 2026 introduit un mécanisme d’« auto-évaluation des auteurs » : utiliser la théorie des jeux contre la crise de l’examen académique : Face à l’explosion des soumissions lors de conférences majeures comme NeurIPS, provoquant la saturation du système d’examen, l’ICML 2026 lance une politique disruptive d’« auto-évaluation des auteurs ». Basé sur la « Isotonic Regression » issue de la théorie des jeux, ce mécanisme exige des auteurs soumettant plusieurs articles de les classer par ordre de priorité. Les expériences prouvent que le classement des auteurs est plus précis que celui des examinateurs aléatoires pour prédire l’impact à long terme d’un article. Cette mesure vise à transformer l’ambition des auteurs en un signal de calibration, bien qu’elle soulève des inquiétudes quant à l’équité pour les « petits chercheurs » face aux algorithmes exploités par les « grands laboratoires ». (Source : 新智元)

Un article de Tsinghua dans Nature révèle le paradoxe de la recherche AI : l’explosion de la productivité « verrouille » les frontières scientifiques : L’équipe des professeurs Xu Fengli et Li Yong de l’Université Tsinghua a publié une étude dans Nature analysant 41 millions d’articles sur 45 ans. Elle révèle que si l’AI augmente considérablement la production individuelle des scientifiques (volume d’articles x3, citations x4,8), elle entraîne une baisse de 4,63 % de l’étendue des connaissances collectives. L’orientation par l’AI pousse les chercheurs vers des domaines populaires aux « données abondantes et problèmes clairs », entraînant une uniformisation de l’innovation et une réduction des collaborations interdisciplinaires. L’équipe propose un « système d’Agents de recherche scientifique complet » pour faire évoluer l’AI d’un outil d’assistance vers un « AI Scientist » capable de proposer activement des hypothèses et d’explorer l’inconnu. (Source : 新智元)

Google Research découvre une astuce de Prompt : répéter la question peut faire passer la précision de 21 % à 97 % : Une étude de Google montre que pour les tâches n’impliquant pas de raisonnement, le simple fait de répéter la question d’entrée (copier-coller) améliore considérablement les performances des grands modèles, presque sans latence supplémentaire. Cette technique de « perroquet » a fait passer la précision de Gemini 2.0 Flash-Lite de 21,33 % à 97,33 % dans le test NameIndex. La logique scientifique réside dans l’exploitation de l’« angle mort causal » de l’architecture Transformer : la répétition offre au modèle une perspective de type « attention bidirectionnelle ». Cette découverte signifie que les développeurs peuvent utiliser des petits modèles moins coûteux pour atteindre les capacités d’extraction et de recherche des modèles haut de gamme. (Source : 新智元)

🎯 Tendances
Lancement officiel de GLM-4.7-Flash : Z.ai présente un modèle polyvalent et léger de classe 30B : Z.ai (Zhipu AI) a officiellement lancé GLM-4.7-Flash, positionné comme un assistant local pour le codage et les Agents. Le modèle dispose de 30B de paramètres totaux avec environ 4B de paramètres actifs, intégrant l’architecture MLA pour équilibrer performance et efficacité. Lors des benchmarks, ses performances égalent ou surpassent celles de GLM-4.5-Air, particulièrement dans l’appel d’outils et l’écriture créative. En tant qu’option légère de classe 30B, il est idéal pour un déploiement local avec 2x24GB de VRAM, offrant une base rentable pour le développement d’Agents. (Source : scaling01; Reddit)

DeepSeek lance la primitive Engram : une nouvelle ère de mémoire conditionnelle sensible au contexte : DeepSeek a publié une primitive de mémoire conditionnelle nommée « Engram », faisant passer les tables de recherche statiques N-gram à une mémoire dynamique sensible au contexte. Cette technologie supporte la recherche de mémoire à très grande échelle avec une complexité O(1), n’activant que les parties liées à l’état caché actuel. Engram permet de stocker la mémoire dans la CPU RAM plutôt que dans la coûteuse GPU HBM, réduisant considérablement les coûts. Cette percée prouve que le « Memory Scaling » peut partiellement remplacer le « Parameter Scaling », offrant un nouveau support système pour les contextes longs et l’apprentissage continu. (Source : ZhihuFrontier)

Huawei publie cinq systèmes d’inférence phares pour 2025 : briser le mur de capacité HBM et les silos de ressources : Le chercheur de Huawei, Zuo Pengfei, a passé en revue cinq percées des systèmes d’inférence pour 2025 : SparseServe utilise le déchargement DRAM du cache KV froid pour briser le mur de la mémoire ; Adrenaline permet le transfert dynamique entre les nœuds Decode et Prefill via la mutualisation des ressources ; l’architecture TaiChi équilibre de manière adaptative le TTFT et le TPOT ; DualMap concilie affinité de cache et équilibrage de charge ; enfin, MemArt stocke la mémoire des Agents sous forme de blocs KV réutilisables. Ces reconceptions de systèmes full-stack marquent le passage d’une optimisation de noyau unique à une planification complexe sensible au SLO, posant les bases des flux multimodaux à grande échelle et des Agents à long terme. (Source : ZhihuFrontier)

Baichuan Intelligence lance Baichuan-M3 : un pari total sur le secteur de l’AI médicale sérieuse : Baichuan Intelligence a lancé Baichuan-M3, une nouvelle génération de modèle médical à grande échelle, affirmant surpasser GPT-5.2 pour la première fois dans le domaine médical. Le modèle s’appuie sur une architecture Fact-Aware RL (apprentissage par renforcement sensible aux faits), réduisant le taux d’hallucination à 3,5 % sans dépendre de recherches externes. Baichuan-M3 possède des capacités de consultation active SCAN, simulant un médecin interrogeant sur les antécédents médicaux. Wang Xiaochuan a déclaré que l’entreprise se tournait entièrement vers le médical, employant des équipes de médecins professionnels pour l’annotation de données à grande échelle, visant à résoudre la pénurie de ressources médicales de base en Chine, avec un projet d’IPO pour 2027. (Source : 36氪)

Le pari matériel d’OpenAI : un stylo AI sans écran tente d’échapper à l’interface graphique : Selon les rumeurs, OpenAI s’apprête à lancer son premier produit matériel sous le nom de code « Gumdrop » : un stylo AI minimaliste. Conçu par l’équipe de Jony Ive, l’appareil n’a ni écran ni caméra, pèse seulement 10 à 15 grammes et met l’accent sur la disponibilité immédiate et la discrétion. Son cœur n’est pas l’écriture, mais l’utilisation de la voix et de l’entrée manuscrite comme canaux de capture d’intention. Ce design reflète la volonté d’OpenAI de contourner les interfaces graphiques traditionnelles pour intégrer l’AI de manière naturelle et imperceptible dans le monde physique, marquant un changement de paradigme de l’interaction homme-machine pilotée par les commandes vers celle pilotée par l’intention. (Source : 36氪)

🧰 Outils
La bibliothèque open source Claude Skills explose : 48 packs de compétences d’experts pour le développement d’Agents : Le développeur alirezarezvani a rendu open source la bibliothèque claude-skills, contenant 48 packs de compétences de niveau production couvrant le marketing, l’ingénierie, les produits, le juridique, etc. Ces packs intègrent des outils d’analyse Python, des cadres de meilleures pratiques et des modèles, supportant plus de 9 types d’Agents AI tels que Claude Code, Cursor et VS Code. Les utilisateurs peuvent les installer rapidement via la commande /plugin, comme pour la « capture de besoins marketing » ou la « conception d’architecture système », améliorant considérablement les capacités réelles des Agents dans des domaines non liés à la programmation. (Source : GitHub; dotey)
Ollama compatible avec l’API Anthropic : les modèles locaux peuvent piloter directement Claude Code : Ollama est désormais officiellement compatible avec l’API Claude Code d’Anthropic, ce qui signifie que les utilisateurs peuvent utiliser des modèles locaux hébergés par Ollama (tels que Llama 3, Qwen, etc.) au sein du puissant Agent de terminal Claude Code. Actuellement, cette fonction supporte principalement les modèles avec un contexte de plus de 64K. Cette mise à jour brise la dépendance de Claude Code aux API propriétaires, offrant aux développeurs un environnement de Vibe Coding local à moindre coût et plus respectueux de la vie privée. (Source : op7418)

Mise à jour majeure de Coze 2.0 : intégration complète de la création, distribution et monétisation des Skills : Coze (Kouzi), filiale de ByteDance, a publié sa version 2.0. L’évolution majeure réside dans l’unification du cycle de vie des Skills. Les utilisateurs peuvent désormais créer des Skills en langage naturel dans l’environnement de programmation Coze, puis les distribuer et les monétiser directement. Cette mise à jour abaisse considérablement la barrière à l’entrée pour les non-techniciens souhaitant développer des plugins AI et des flux de travail automatisés. En combinant l’orchestration en langage naturel, Coze tente de bâtir un écosystème de compétences AI similaire à l’App Store. (Source : op7418)
Manus AI lance une fonction de publication d’App : mise en ligne sur Google/Apple Store sans configuration d’environnement : Manus AI a mis à jour son flux de travail de publication d’App, permettant aux utilisateurs de packager et de publier directement leurs applications sur Google Play (test interne) et l’Apple App Store (TestFlight). L’ensemble du processus ne nécessite pas l’installation de Xcode, d’Android Studio ou la gestion de configurations de build complexes ; Manus gère automatiquement les certificats et l’upload. Cette fonction réduit considérablement la distance entre le prototype AI et le test mobile réel. (Source : hidecloud)

Projet open source Eigent : une alternative libre à Anthropic Cowork : En réponse au lancement de Claude Cowork par Anthropic, la startup Eigent a choisi de rendre son produit open source. Eigent vise à offrir une expérience de collaboration pour les tâches non techniques similaire à Cowork, permettant aux utilisateurs de gérer des flux de travail, des fichiers et des automatisations via l’AI. Ce projet offre une référence aux équipes souhaitant implémenter des fonctions de type Cowork dans des environnements privés ou des plateformes personnalisées. (Source : ClementDelangue)
📚 Apprentissage
Le Stanford AI Lab lance « AI Bites » : apprentissage fragmenté en audio des cours fondamentaux d’AI : Le Stanford AI Lab (SAIL) a lancé une série de podcasts intitulée « AI Bites », visant à combler le fossé entre le matériel académique profond et l’apprentissage fragmenté. Les contenus des cours fondamentaux tels que CS124 (NLP/LLM) et CS221 (Principes de l’Intelligence Artificielle) sont déjà en ligne. En transformant des conférences académiques denses en audio facile à digérer, ce projet offre un accès pratique à la théorie de pointe de l’AI pendant les trajets ou les moments de loisir. (Source : stanfordnlp)
Partage d’un manuel gratuit : Algèbre linéaire pour la Computer Vision, la Robotique et le Machine Learning : La communauté a partagé un manuel complet et gratuit couvrant les théories mathématiques fondamentales, des espaces vectoriels et matrices aux normes, valeurs propres et SVD. Le livre met l’accent sur l’application pratique de ces outils mathématiques dans des domaines tels que la PCA, la théorie des graphes, l’analyse de formes d’onde et les rotations 3D. C’est une excellente ressource pour consolider les bases mathématiques en Computer Vision et en Robotique. (Source : TheTuringPost)

Publication du benchmark MIMIC : analyse approfondie des défauts de compréhension multi-images des LVLM : Des chercheurs ont introduit le benchmark MIMIC (Multi-Image Model Insights and Challenges), spécifiquement conçu pour évaluer les capacités des LVLM en matière de compréhension et de raisonnement multi-images. L’étude révèle que les modèles actuels présentent des lacunes généralisées dans l’agrégation d’informations entre les images et le suivi simultané de plusieurs concepts. L’équipe propose des stratégies de génération de données programmatiques et des schémas de masquage d’attention pour améliorer les performances. (Source : HuggingFace)
Hugging Face publie le manuel d’entraînement Smol : partage d’expérience sur l’entraînement de petits modèles de classe mondiale : L’équipe Hugging Face a partagé l’enregistrement de la conférence « Smol Training Playbook », détaillant comment entraîner des modèles performants avec un petit nombre de paramètres. Le contenu couvre le filtrage des données, l’optimisation des stratégies d’entraînement et des astuces pratiques pour extraire le maximum de performance d’une puissance de calcul limitée. (Source : _lewtun)
💼 Business
Anthropic fait un don de 1,5 million de dollars à la Python Software Foundation : Anthropic a annoncé un don de 1,5 million de dollars à la Python Software Foundation (PSF) pour soutenir le développement continu de l’écosystème Python. Étant donné que la grande majorité de la R&D en AI et des chaînes d’outils (comme Claude Code) dépendent profondément de Python, ce geste est perçu comme un investissement à long terme des géants de l’AI dans la communauté open source fondamentale. (Source : Reddit)

La startup canadienne de défense AI Dominion Dynamics lève 21 millions de dollars : Dominion Dynamics, une entreprise canadienne spécialisée dans les réseaux de capteurs arctiques et les capacités de défense, a clôturé un tour de table d’amorçage de 21 millions de dollars. L’entreprise se consacre à l’utilisation de l’AI pour améliorer la défense territoriale et la surveillance. Des leaders de l’industrie comme Aidan Gomez ont salué cette étape importante pour le Canada dans le domaine des technologies souveraines critiques. (Source : aidangomez)

Synthesia entre dans le Sunday Times 100 et reste la licorne à la croissance la plus rapide au Royaume-Uni : La plateforme de génération de vidéos AI Synthesia a été incluse dans le top 100 des entreprises du Sunday Times. Son produit phare révolutionne les processus de production vidéo en entreprise grâce à la technologie des avatars numériques. La société a annoncé que des nouvelles majeures seraient publiées prochainement, suggérant des percées dans la génération multimodale. (Source : synthesiaIO)

🌟 Communauté
La tendance ChatGPT « Que ferais-tu de moi si tu prenais le contrôle du monde » fait le buzz : Une tendance a émergé sur les réseaux sociaux consistant à demander à ChatGPT de générer une image montrant comment il traiterait l’utilisateur après avoir pris le contrôle du monde, sur la base de ses interactions récentes. Les utilisateurs partagent des images générées par AI allant de l’utilisateur traité comme un invité d’honneur à celui enfermé dans une « chambre de respiration cognitive ». Ce phénomène reflète la relation complexe du public avec l’anthropomorphisation de l’AI. (Source : Yuchenj_UW; Reddit)

Débat sur le Vibe Coding : révolution de la productivité ou « Slop » de code ? : La communauté débat intensément du « Vibe Coding ». Les partisans, comme levelsio, estiment que l’utilisation d’outils comme Claude Code pour faire tourner plusieurs Agents en parallèle permet un développement ultra-rapide et des revenus massifs. Les détracteurs, comme swyx, critiquent une « vanité technique », arguant que cette pratique produit du « Slop » (déchet) difficile à maintenir. Le cœur du débat : à l’ère de l’AI, les développeurs doivent-ils se concentrer sur la valeur client ou sur l’illusion d’efficacité des outils ? (Source : swyx; seo_leaders)
La finalité de l’AI est l’électricien : les Data Centers provoquent une pénurie de main-d’œuvre ouvrière aux États-Unis : Alors que la guerre du Scaling s’intensifie, l’énergie devient le nerf de la guerre. Le Bureau des statistiques du travail des États-Unis prévoit une pénurie massive d’électriciens au cours de la prochaine décennie. Les géants technologiques comme Amazon et Google multiplient les recrutements dans le secteur de l’énergie. Elon Musk a déclaré que « la monnaie du futur est le Watt », l’approvisionnement électrique devenant plus critique que les GPU. Cette tendance valorise les métiers manuels comme les électriciens et les plombiers. (Source : 36氪)

Discussions sur la désinformation AI suite au litige territorial sur le Groenland : Des discussions récentes sur les tentatives supposées des États-Unis d’acheter ou de contrôler le Groenland ont suscité de vives controverses politiques. L’affaire implique des lettres falsifiées et des menaces diplomatiques, dont certaines sont soupçonnées d’être de la propagande générée par AI. La communauté souligne le potentiel inquiétant de l’AI pour amplifier la polarisation politique et créer un chaos diplomatique, soulignant le défi mondial de la vérification de l’information à l’ère de l’AI. (Source : teortaxesTex; halvarflake)
Retours d’expérience des développeurs sur les hallucinations AI et les « angles morts causaux » : Suite à l’étude de Google sur la répétition des prompts, de nombreux développeurs ont effectué des tests. Certains ont constaté que pour la recherche dans de longs documents, la répétition des instructions réduit effectivement le taux d’omission. Cependant, d’autres notent que pour les tâches de raisonnement logique, une répétition excessive peut entraîner une « perroquetisation » ou une rupture logique. L’architecture Transformer actuelle présente des défauts de « lecture unidirectionnelle » intrinsèques. (Source : Reddit; Gemini)
💡 Autres
TaskExplorer : un outil puissant de gestion des tâches pour Windows : Projet populaire sur GitHub, TaskExplorer est un outil de surveillance système approfondi qui va au-delà de la simple gestion d’applications. Il offre un suivi en temps réel de la pile de threads, l’édition de mémoire, la visualisation des handles et la surveillance des connexions Socket. Développé avec Qt, il prévoit d’être porté sur Linux pour devenir un standard de gestion système graphique multiplateforme. (Source : GitHub)

Inquiétudes sur la vie privée des cartes d’enregistrement AI : des risques de données sous une coque élégante : De nombreuses cartes d’enregistrement ultra-fines axées sur « l’enregistrement en un clic et le résumé AI » inondent le marché. Bien que pratiques, l’absence de puissance de calcul locale oblige à télécharger tous les enregistrements sur le cloud, soulevant de graves questions sur la protection de la vie privée. De plus, la finesse du design limite la qualité des microphones, affectant la précision de la transcription. (Source : 36氪)

Le Japon développe un robot humanoïde géant pour la maintenance ferroviaire : Pour faire face à la pénurie de main-d’œuvre due au vieillissement de la population, le Japon a développé un robot humanoïde géant pour la maintenance des voies. Installé sur le bras articulé d’un véhicule de chantier, il est contrôlé par un opérateur via un casque VR. Il peut manipuler des câbles et des pièces lourdes, réduisant les risques pour les travailleurs. C’est un cas typique d’« Embodied AI » lourde. (Source : Ronald_vanLoon)