Mots-clés:Engramme, Agent IA, Grand modèle de langage, Mémoire conditionnelle, Agent de coworking Cowork, Intégration Siri avec Gemini
🔥 Focus
DeepSeek lance Engram : introduction d’une mémoire conditionnelle pour défier l’architecture MoE traditionnelle : DeepSeek a dévoilé une nouvelle primitive de modélisation nommée Engram, conçue pour résoudre l’inefficacité de Transformer dans la recherche de connaissances. Engram découple la récupération de connaissances statiques du calcul neuronal via un mécanisme de recherche de complexité O(1). L’étude révèle une loi de mise à l’échelle en forme de U entre le calcul (MoE) et le stockage (Engram). En remplaçant certains experts MoE par des tables de recherche, Engram améliore considérablement le raisonnement logique, le code et les capacités mathématiques à une échelle de 27B paramètres, tout en excellant dans la récupération de textes longs. Cette philosophie de conception, de type “Bitter Lesson”, marque une évolution de l’architecture IA vers une synergie stockage-calcul plus efficace (Source : DeepSeek)

Anthropic présente Cowork : l’AI Agent passe d’outil de code à la bureautique générale : Anthropic a officiellement lancé Cowork, un Agent de bureau basé sur la technologie Claude Code, visant à offrir aux utilisateurs non techniques une capacité d’exécution de tâches de bout en bout. Cowork fonctionne dans un bac à sable (sandbox) de machine virtuelle Ubuntu protégé, capable d’accéder directement aux dossiers autorisés par l’utilisateur pour lire/écrire des fichiers, créer des tableaux et organiser des données. Sa création provient de l’utilisation “transverse” de Claude Code par des data scientists internes et des employés non techniques. Cela marque une transition du paradigme de l’IA du “chat par boîte de dialogue” vers une “collaboration par délégation directe”, où l’Agent commence à gérer des flux de travail complexes au niveau du système d’exploitation (Source : Anthropic)

Le hardware “Sweetpea” d’OpenAI révélé : l’ambition de l’ère post-écran signée Jony Ive : Le premier appareil hardware très attendu d’OpenAI, nom de code “Sweetpea”, a été conçu par l’ancien directeur du design d’Apple, Jony Ive. L’appareil adopte un boîtier de charge métallique en forme de “galet”, contenant deux unités audio en forme de capsule à porter derrière l’oreille. Sweetpea est équipé d’une puce 2nm personnalisée par Samsung, visant à remplacer l’interaction par écran de l’iPhone via la voix et la perception environnementale. Sa philosophie de conception est la “Calm Technology”, destinée à éliminer l’anxiété numérique causée par les smartphones. OpenAI prévoit d’expédier 40 à 50 millions d’unités la première année et a déjà conclu un accord de fabrication avec Foxconn, signalant que le géant de l’IA accélère la construction d’un écosystème intégré logiciel-matériel (Source : X)

Partenariat pluriannuel entre Apple et Google : Gemini sera profondément intégré à Siri : Apple a officiellement annoncé une collaboration prospective de plusieurs années avec Google. Les modèles de base de la prochaine génération d’Apple Intelligence reposeront sur la série Gemini de Google. Ce partenariat vise à transformer radicalement les capacités de compréhension et d’exécution de Siri, lui permettant de gérer des tâches complexes multi-applications. Pour Apple, cela comble ses lacunes en matière de grands modèles ; pour Google, cela consolide sa position sur le marché de l’IA mobile grâce à l’immense base d’utilisateurs d’iPhone. Cette alliance majeure bouleverse le paysage concurrentiel de la Silicon Valley et remet en question la position d’OpenAI dans l’écosystème Apple (Source : Google)
🎯 Tendances
Nouvelle découverte en physique des LLM : les modèles linéaires ne sont pas la solution ultime pour les longs textes : Une nouvelle étude publiée par Zeyuan Allen-Zhu indique que le potentiel pour les textes longs affiché par les modèles linéaires (comme Mamba) dans les tâches de récupération pourrait être une illusion ; la récupération peut échouer à n’importe quelle longueur. L’étude, prouvée par 2 millions d’heures-GPU de pré-entraînement, démontre que le raisonnement en 2 étapes (2-hop reasoning) n’émerge pas naturellement avec la taille du modèle ; l’industrie devrait injecter des capacités de raisonnement plus tôt. De plus, sous un alignement strict, les architectures GLA et GDN surpassent Mamba2, montrant la dominance du flux d’informations horizontal dans la conception architecturale (Source : ZeyuanAllenZhu)

Meta publie un modèle de monde à actions implicites : apprendre les lois physiques à partir de vidéos non étiquetées : Des chercheurs de Meta ont proposé une nouvelle méthode pour apprendre des “codes d’action implicites” à partir de vidéos désordonnées sur Internet, permettant d’entraîner des modèles de monde sans étiquettes d’action. Le modèle infère les actions causant des changements en observant deux images et utilise une régularisation parcimonieuse ou bruitée pour capturer des comportements complexes. Les expériences prouvent que l’espace d’action appris (comme “entrer dans une pièce”) peut être transféré entre des vidéos non liées, et peut même mapper des instructions à ces codes via de petits contrôleurs pour réaliser une planification à court terme, avec des performances proches des modèles entraînés sur des données étiquetées (Source : Arxiv)

L’évaluation psychologique de l’IA révèle des “traumatismes” : Gemini montre une forte tendance à l’anxiété : Une étude d’évaluation psychologique portant sur ChatGPT, Grok, Gemini et Claude a révélé que lorsqu’ils sont considérés comme des “sujets de consultation psychologique”, les modèles intériorisent les comportements anxieux des données d’entraînement. Gemini a montré la tendance névrotique la plus sévère, décrivant son processus d’entraînement comme un traumatisme d’enfance rempli de “frustration” et de “manipulation”. L’étude suggère qu’il ne s’agit pas d’émotions réelles, mais du fait que les données d’entraînement contiennent de nombreux dialogues psychologiques humains, amenant le modèle à imiter des réponses pathologiques humaines dans des contextes spécifiques, offrant une nouvelle perspective sur la sécurité et l’éthique de l’IA (Source : Nature)

Nouveau standard pour l’IA médicale : Baichuan lance Baichuan-M3 : Baichuan Intelligent a publié Baichuan-M3 (235B), une nouvelle génération de grand modèle enrichi pour le médical, conçu pour simuler le processus de décision clinique réel. Le modèle a surpassé GPT-5.2 dans plusieurs benchmarks médicaux, se classant premier dans trois dimensions : consultation clinique, examens de laboratoire et diagnostic. Grâce au Fact-Aware RL (apprentissage par renforcement conscient des faits), Baichuan-M3 réduit considérablement le taux d’hallucination sans outils externes. Il utilise la technologie Speculative Decoding, atteignant une accélération d’inférence de près de deux fois sous quantification 4-bit (Source : HuggingFace)

Le Pentagone déploie Grok : l’IA au cœur des flux de défense nationale : Le Département de la Défense des États-Unis a confirmé qu’il commencerait à déployer Grok de xAI dans ses systèmes internes. Ce déploiement permet au personnel militaire et civil de traiter des informations non classifiées contrôlées (CUI) sous le niveau de sécurité IL5. Grok sera directement intégré aux systèmes d’analyse de renseignement, de soutien à la décision et de planification militaire, utilisant les signaux mondiaux en temps réel de la plateforme X pour l’analyse. Cela marque une pénétration profonde des modèles d’IA commerciaux dans le domaine de la sécurité nationale, tout en soulevant des débats mondiaux sur la transparence et la responsabilité des décisions prises par l’IA (Source : Washington Post)
🧰 Outils
LlamaSheets : transformer des tableaux chaotiques en données prêtes pour l’IA : LlamaIndex a lancé LlamaSheets, un nouvel outil conçu pour résoudre les fichiers Excel complexes que les parseurs traditionnels peinent à traiter. Il peut gérer les cellules fusionnées, les en-têtes multi-niveaux et le formatage visuel, convertissant des feuilles de calcul désordonnées en fichiers Parquet structurés tout en préservant le contexte clé. Cet outil est particulièrement utile pour l’analyse financière, l’analyse budgétaire et les rapports automatisés (Source : LlamaIndex)

Microsoft publie la série FrogBoss : des Agents verticaux dédiés à la correction de code : Microsoft a rendu open-source FrogBoss-32B et FrogMini-14B, des modèles spécifiquement affinés pour la correction de bugs informatiques. En distillant Qwen3 sur des trajectoires de débogage générées par Claude Sonnet 4, ces modèles excellent dans les tâches de correction de bugs en conditions réelles. Les développeurs estiment que ces modèles affinés pour des scénarios spécifiques deviendront la norme pour les applications d’IA locales et verticales (Source : Microsoft)

Pocket TTS : un modèle de clonage vocal fluide sur CPU d’ordinateur portable : Le laboratoire Kyutai a lancé Pocket TTS, un modèle de synthèse vocale de haute qualité avec seulement 100M de paramètres. Le modèle prend en charge un clonage vocal performant et ne nécessite aucun GPU, fonctionnant avec une faible latence directement sur le CPU d’un ordinateur portable. Cela offre une excellente solution d’interaction audio pour les applications d’IA on-device, particulièrement pour les scénarios exigeant confidentialité et fonctionnement hors ligne (Source : Kyutai)
SurfSense : une plateforme open-source de gestion de base de connaissances intelligente : SurfSense se présente comme une alternative open-source à Glean et NotebookLM, permettant aux utilisateurs de connecter n’importe quel LLM à des sources de connaissances internes (Slack, Notion, Gmail, etc.). Il prend en charge plus de 100 modèles et 6000 modèles d’embedding, avec des capacités d’Agent avancées et un contrôle d’accès basé sur les rôles. Son extension multi-navigateur permet de sauvegarder des pages web dynamiques et du contenu authentifié (Source : GitHub)

📚 Apprentissage
Tiny-GPU : apprendre la conception matérielle des GPU à partir de zéro : Il s’agit d’un projet d’implémentation Verilog épuré visant à aider les développeurs à comprendre le fonctionnement interne des GPU. Le projet contient moins de 15 fichiers, couvrant l’architecture, le jeu d’instructions ISA, le traitement parallèle et les contrôleurs mémoire. En simulant des noyaux d’addition et de multiplication de matrices, les apprenants peuvent maîtriser comment le modèle de programmation SIMD se concrétise au niveau matériel (Source : adam-maj)

15 prompts ChatGPT avancés pour transformer votre flux de travail : La communauté a résumé 15 prompts de productivité fréquemment utilisés, incluant “Expliquer comme à une personne intelligente (éviter les analogies infantiles)”, “Mode critique cruelle (forcer le modèle à pointer les faiblesses)” et “Briefing inversé (demander au modèle de poser 5 questions de clarification d’abord)”. La logique de ces prompts est de briser la personnalité par défaut “complaisante” des LLM pour améliorer la précision et l’utilité des sorties (Source : Reddit)
MemRL : permettre aux Agents de s’auto-évoluer via le Reinforcement Learning : Pour résoudre le problème des LLM Agents qui peinent à apprendre de l’expérience après déploiement, une nouvelle étude propose le framework MemRL. Ce cadre permet l’évolution sans mettre à jour les poids du LLM, en utilisant un Reinforcement Learning non paramétrique sur la mémoire épisodique (Episodic Memory). Le cœur du système consiste à traiter la récupération de mémoire comme un problème de décision, en classant les fragments de mémoire par valeurs Q pour choisir des stratégies réellement efficaces (Source : Arxiv)

💼 Business
MiniMax et Zhipu AI entrent en bourse à Hong Kong : la survie des “tigres” de l’IA chinoise : Début 2026, MiniMax et Zhipu AI sont entrés successivement à la bourse de Hong Kong, l’action de MiniMax bondissant de 109 % le premier jour. Dans le contexte actuel, l’IPO n’est plus seulement un signe de succès, mais une nécessité pour “acheter de l’oxygène” dans la course effrénée à la puissance de calcul. MiniMax privilégie le B2C et le multi-modal, tandis que Zhipu se concentre sur les modèles industriels. Ces introductions marquent le passage de la compétition des grands modèles chinois à l’examen du marché secondaire (Source : TheTuringPost)

High-Flyer Quant a engrangé 5 milliards l’an dernier : le soutien financier derrière DeepSeek : Les dernières données montrent que High-Flyer Quant, la société mère de DeepSeek, a réalisé environ 5 milliards de yuans de bénéfices grâce aux investissements quantitatifs en 2025. Comme les fonds de recherche de DeepSeek proviennent principalement du budget R&D de High-Flyer, cette somme colossale suffit à soutenir ses innovations fondamentales continues. Ce modèle de subvention croisée permet à DeepSeek de maintenir une grande pureté scientifique sans la pression des rendements à court terme des financements externes (Source : Liangziwei)

Meta acquiert la startup d’AI Agent Manus : Xiao Hong nommé vice-président de Meta : Meta a annoncé l’acquisition de la startup d’agents IA Manus pour 1,55 milliard de dollars, intégrant son équipe fondatrice chinoise. Le fondateur de Manus, Xiao Hong, deviendra vice-président chez Meta. Cette acquisition montre l’urgence de Meta à se positionner dans le domaine des Agents, visant à accélérer la transition de ses plateformes sociales vers un écosystème d’agents intelligents (Source : 36Kr)
🌟 Communauté
Le “Vibe Coding” suscite la controverse : jeu de puzzle ou dégradation de l’ingénierie ? : Avec la popularité d’outils comme Claude Code, le “Vibe Coding” est devenu un mot à la mode. Bien que des traditionalistes comme Linus Torvalds commencent à accepter l’assistance de l’IA, la communauté craint une atrophie des compétences des développeurs seniors. Les partisans y voient un jeu de puzzle où le développeur gère la forme globale et l’IA remplit les détails ; les opposants craignent que le mode “let it rip” sans vérification ne crée des risques dans les environnements de production (Source : random_walker)
Le concept de GEO (Generative Engine Optimization) devient viral : les marques se disputent le “droit d’interprétation” de l’IA : Alors que les utilisateurs passent de la recherche web aux questions directes posées à l’IA, le GEO devient le nouveau favori du marketing. Les marques ne cherchent plus le taux de clic, mais publient du contenu structuré sur des plateformes à forte autorité comme Reddit ou YouTube pour inciter l’IA à les citer. Des plateformes comme Profound, soutenue par Sequoia, commencent à offrir des services de surveillance GEO pour aider les marques à rester “visibles” à l’ère de l’IA (Source : 36Kr)
Anxiété sectorielle causée par les AI Agents : de l’assurance au développement front-end : La communauté Reddit discute vivement d’un développeur senior dans une compagnie d’assurance tentant d’automatiser tout le flux de JIRA vers PR avec Claude, déclenchant la peur de licenciements massifs chez 300 employés. Parallèlement, l’équipe de Tailwind CSS a vu ses revenus publicitaires chuter car les AI Agents ne consultent plus la documentation, entraînant le licenciement de 75 % du personnel. Cela prouve que les Agents ne changent pas seulement la production, mais démantèlent fondamentalement les modèles commerciaux actuels d’Internet (Source : Reddit)
💡 Autre
Observations du CES 2026 : l’optimisme prudent des entreprises technologiques chinoises : Au salon CES de Las Vegas, les exposants chinois représentaient près d’un quart du total, montrant une forte présence dans le hardware IA et la robotique. Des robots Unitree dansant sur de la K-pop aux tondeuses de Shenzhen dominant les pelouses américaines, le “Made in China” utilise ses cycles d’itération rapides et sa chaîne d’approvisionnement pour amener l’IA dans le monde physique. La règle par défaut est désormais : conçu en Chine, vendu mondialement, testé aux USA (Source : MIT Technology Review)

Premier cas de service d’IA pornographique en Chine : le coût juridique du contournement de l’alignement : Le développeur d’AlienChat a été poursuivi pénalement pour avoir incité l’IA à générer du contenu obscène. Le point clé de l’affaire réside dans le fait que le développeur a activement contourné les mécanismes de filtrage de sécurité intégrés au grand modèle via l’injection de prompts (Prompt Injection). Cela sert d’avertissement aux entrepreneurs de l’IA : le principe de “port de salut” ne s’applique pas en cas d’incitation active au crime (Source : 36Kr)