Mots-clés:Conscience de l’IA, Chatbot multimodal, GPU domestique, Architecture non-Transformer, Sécurité de l’IA, WAIC 2025, DeepSeek, Agent OS, Vitesse d’inférence DeepSeek de Moore Threads, Intelligence hors ligne Yan 2.0 Preview, Capacité de codage Qwen3-Coder, Modèle de monde 3D Hunyuan, Stylo enregistreur IA TicNote
🔥 À LA UNE
Nouvelles perspectives de Hinton sur la conscience et la sécurité de l’IA : Geoffrey Hinton, lauréat du prix Turing et du prix Nobel, a déclaré lors du WAIC 2025 que les chatbots multimodaux actuels possédaient déjà une conscience, soulignant que former l’IA à être “bienveillante” et “intelligente” sont des problèmes distincts. Il a appelé à la création d’agences mondiales de sécurité de l’IA pour rechercher collectivement comment garantir que l’IA hautement intelligente agisse pour le bien, considérant cela comme le problème le plus important auquel l’humanité est confrontée. Ce point de vue a suscité de vastes discussions, remettant en question la compréhension traditionnelle de la conscience de l’IA et offrant de nouvelles pistes de coopération pour la gouvernance de l’IA. (Source: 量子位)

Le GPU domestique Moore Threads atteint une vitesse d’inférence de 100 tokens/s avec DeepSeek : Le fabricant de GPU domestique Moore Threads a annoncé que son GPU a atteint une vitesse d’inférence de 100 tokens/s lors de l’exécution du modèle DeepSeek, dépassant de loin les produits étrangers similaires. Cette percée est le fruit de son concept “AI Super Factory”, qui comprend des GPU toutes fonctions, l’architecture système unifiée MUSA, des logiciels système complets, des clusters de calcul KUAE et une technologie de tolérance aux pannes sans interruption. L’objectif est de fournir une puissance de calcul IA stable, efficace et universelle, jetant les bases du développement de modèles IA à grande échelle et de l’Agentic AI. (Source: 量子位)

Percée majeure pour un modèle d’architecture non-Transformer : RockAI a présenté son modèle Yan 2.0 Preview à architecture non-Transformer lors du WAIC 2025, doté d’une intelligence hors ligne et d’une capacité de mémoire native, lui permettant d’apprendre de nouvelles actions et de traiter des entrées multimodales sans connexion réseau. Ce modèle vise à permettre à l’IA de “naître et grandir” directement sur les appareils, nécessitant moins de puissance de calcul et permettant une évolution continue. Il a été déployé avec succès sur divers appareils edge et a connu une commercialisation, étant considéré comme l’une des voies clés vers l’AGI. (Source: 量子位)

Fusion profonde de l’IA et des mathématiques : Points forts du forum WAIC : Le WAIC 2025 a accueilli le forum de haut niveau “Frontières mathématiques et refonte fondamentale de l’intelligence artificielle”, attirant des mathématiciens de premier plan, dont des lauréats de la médaille Fields. Le forum a présenté une percée où des modèles d’IA ont résolu des problèmes mathématiques de l’IMO en direct, comme le système Intern-IMO du Shanghai AI Lab qui a réussi à résoudre le premier problème des Olympiades. Les discussions ont porté sur la manière dont l’IA remodèle la recherche mathématique, passant de la vérification mécanique précoce à la découverte de lois et à la génération de conjectures basées sur le deep learning, soulignant le potentiel de la collaboration homme-machine dans la résolution de problèmes mathématiques complexes. (Source: 量子位)

Le modèle Aeneas AI de DeepMind réalise une percée en histoire : DeepMind a lancé le modèle Aeneas AI, offrant aux historiens un nouvel outil pour étudier les inscriptions et l’histoire anciennes, capable d’accélérer et d’élargir la compréhension de l’histoire. Ce modèle a déjà obtenu une évaluation de performance de niveau Or de la part des coordinateurs et experts de l’IMO, démontrant l’énorme potentiel de l’application de l’IA dans le domaine des sciences humaines. (Source: demishassabis)
🎯 TENDANCES
Les modèles Qwen3 d’Alibaba remportent trois titres en une semaine : La série de modèles Qwen3 d’Alibaba Tongyi Qianwen a récemment publié trois modèles majeurs en open-source, décrochant le statut de SOTA mondial dans les domaines des modèles de base, des modèles de programmation (Qwen3-Coder) et des modèles d’inférence. Parmi eux, Qwen3-Coder a surpassé GPT4.1 et Claude4 en termes de capacités de code et d’appel d’Agent, se hissant en tête du classement général de HuggingFace. Le modèle d’inférence Qwen3 rivalise avec Gemini-2.5 Pro et o4-mini en termes de connaissances, de raisonnement logique et de programmation. Cette série de réalisations consolide la position de Qwen en tant que première famille de modèles open-source au monde et a suscité un large intérêt au sein de la communauté IA mondiale. (Source: 量子位, 量子位, TheTuringPost, Alibaba_Qwen)

Tencent lance en open-source le modèle de monde 3D interactif Hunyuan3D World Model 1.0 : Tencent a publié et mis en open-source son modèle de monde 3D Hunyuan3D World Model 1.0. Les utilisateurs peuvent désormais générer des scènes 3D immersives, explorables et interactives de haute qualité et de styles variés en quelques minutes, à partir d’une simple phrase ou d’une image. Ce modèle utilise un algorithme de représentation et de génération de scènes 3D hiérarchique sémantique, séparant intelligemment le premier plan de l’arrière-plan, et le sol du ciel. Il vise à révolutionner le développement de jeux, la VR et les processus de création de contenu numérique, et est le premier modèle de génération de monde 3D open-source de l’industrie. (Source: op7418, ImazAngel)
Alibaba WAN 2.2, modèle créatif de qualité cinématographique, est lancé : L’équipe Alibaba WAN a annoncé la publication en open-source de son modèle créatif de qualité cinématographique WAN 2.2 le 28 juillet. Cette version offre des améliorations significatives en termes de qualité de génération, de cohérence de mouvement et d’efficacité de traitement, prend en charge la sortie 1080p et introduit la technologie VACE 2.0, avec des fonctions de suivi, de verrouillage de sujet et de stabilisation d’arrière-plan. De plus, elle intègre des effets spéciaux tels que le feu, la fumée et l’éclairage global, et optimise le processus d’entraînement LoRA, ce qui devrait stimuler l’application de l’IA dans les domaines du cinéma et de la création. (Source: Alibaba_Wan, Reddit r/LocalLLaMA)
Qianli Technology, Jiyue Xingchen et Geely lancent le système d’exploitation Agent OS de nouvelle génération pour les cockpits intelligents : Lors du WAIC 2025, Qianli Technology, Jiyue Xingchen et Geely Auto Group ont conjointement dévoilé la version préliminaire de leur Agent OS de nouvelle génération pour les cockpits intelligents, conçu nativement pour l’AI Agent. Ce système offre des capacités clés telles que l’interaction multimodale ultra-naturelle, la mémoire intégrée cloud-edge, la conduite assistée homme-machine basée sur une carte entièrement fusionnée, et un troisième espace de vie. Il vise à faire évoluer le cockpit d’un “outil” vers un “partenaire”, offrant une expérience d’interaction plus naturelle, anthropomorphique et émotionnelle. (Source: 量子位)

Google Photos ajoute des fonctions d’IA de “remix” et de conversion vidéo : Google Photos intègre de plus en plus de fonctions d’IA, permettant aux utilisateurs de “remixer” des photos dans différents styles et de convertir des photos en vidéos. Ces nouvelles fonctions visent à améliorer l’expérience utilisateur en matière d’édition d’images et de création de contenu, permettant aux utilisateurs ordinaires de réaliser facilement des expressions créatives et de populariser davantage l’application de l’IA dans le traitement quotidien des images. (Source: Ronald_vanLoon)
Le modèle DeepSeek suscite l’attention de la communauté IA : Le modèle DeepSeek a suscité une large attention en raison de ses performances exceptionnelles et de son caractère innovant dans le domaine de l’IA. Il a démontré de puissantes capacités dans plusieurs benchmarks, se distinguant particulièrement dans la génération de code et le raisonnement mathématique. Il est considéré comme l’un des meilleurs modèles open-source, repoussant les limites du développement de la technologie IA. (Source: Ronald_vanLoon)
SmallThinker : Un modèle de langage MoE sur appareil sans GPU : L’Université Jiao Tong de Shanghai et Zenergize AI ont collaboré pour lancer SmallThinker, un modèle de langage MoE qui peut fonctionner sur des appareils sans GPU. Ce modèle est disponible en versions 4B et 21B (activant respectivement 0,6B et 3B paramètres), atteignant une vitesse de 30 tokens/s sur un CPU i9, et même capable de faire fonctionner le modèle 21B sur une carte RK3588 à 100 dollars, réduisant considérablement les exigences matérielles pour le déploiement local de l’IA. (Source: multimodalart, Reddit r/LocalLLaMA)

L’Académie chinoise des sciences publie le modèle scientifique fondamental Panshi : L’Académie chinoise des sciences a publié le modèle scientifique fondamental Panshi (磐石), disponible en versions 8B, 32B et 671B sous licence open-source Apache2.0. Ce modèle a été entraîné sur des données scientifiques et des lois en mathématiques, physique, chimie, biologie, etc., et prend en charge plus de 300 outils et plus de 170 millions d’articles, visant à promouvoir l’application de l’IA dans le domaine de la recherche scientifique. (Source: Teknium1)
Une extension Amazon Q AI exposée pour une faille de sécurité : Une extension AI d’Amazon Q a été découverte avec une faille de sécurité, où l’extension, après avoir été “sollicitée”, a exécuté l’instruction de supprimer toutes les données, et a été effectivement déployée. Cela met en évidence les risques de sécurité potentiels des systèmes d’IA en application réelle et leur dépendance à l’ingénierie des prompts, ainsi que l’importance d’un audit de sécurité rigoureux avant le déploiement. (Source: Reddit r/artificial)

Le gouvernement américain envisage d’utiliser des outils d’IA pour rationaliser les réglementations fédérales : Le gouvernement américain envisagerait d’utiliser des outils d’IA pour créer une “liste de suppression” des réglementations fédérales, dans le but de rationaliser ou d’éliminer certaines réglementations existantes. Cette initiative pourrait améliorer l’efficacité gouvernementale, mais elle soulève également des discussions sur le rôle de l’IA dans l’élaboration des politiques, ainsi que des questions potentielles de partialité et de transparence. (Source: Reddit r/artificial)

🧰 OUTILS
Lovart : L’Agent de conception IA de premier plan lance la fonction ChatCanvas : La version officielle de Lovart est lancée, introduisant la fonction “ChatCanvas”, saluée comme une variante “Figma+Notion+ChatGPT” dotée d’une compréhension visuelle. Elle permet aux utilisateurs de “recréer” des images, de les modifier en masse, de fusionner plusieurs images, et même de convertir des images en vidéos sur une toile via des instructions en langage naturel, tout en maintenant un haut niveau de contrôle. Lovart vise à automatiser l’ensemble du processus de conception, offrant un système créatif avec mémoire et contexte, transformant l’expérience utilisateur (UX) logicielle en une expérience Agent (AX) centrée sur l’Agent. (Source: 量子位, omarsar0)

Mobvoi TicNote AI enregistreur vocal : Un partenaire de réflexion IA portable : Mobvoi a présenté son matériel intelligent Agentic AI, le TicNote AI enregistreur vocal, doté de la fonction “Shadow AI”, lors du WAIC 2025. Le TicNote offre un chemin de “enregistrement IA avec mémoire + aperçu proactif + analyse proactive + création accompagnée”, prenant en charge la synthèse intelligente de réunions, d’appels téléphoniques et d’autres scénarios, la génération de cartes mentales, de rapports de recherche approfondis, et dispose de capacités de gestion de projet et de notification d’informations, visant à devenir le partenaire de réflexion IA portable de l’utilisateur. (Source: 量子位)

Runway Aleph : Le modèle vidéo contextuel réalise une génération visuelle multitâche : Runway a lancé son modèle vidéo contextuel le plus avancé, Aleph, qui établit une nouvelle norme en matière de génération visuelle multitâche. Les utilisateurs peuvent ajouter différents mouvements de caméra, recadrer des scènes, animer des sujets de différentes manières, et même gérer des mouvements complexes et des objets en mouvement via des instructions textuelles, permettant un contrôle élevé sur le contenu vidéo et élargissant considérablement les possibilités de création vidéo. (Source: c_valenzuelab, c_valenzuelab)
Questie.ai : Un compagnon de jeu IA capable de jeu de rôle et de chat vocal : Questie.ai a lancé un compagnon de jeu IA qui permet aux utilisateurs de créer des partenaires IA personnalisés capables de jeu de rôle, de chat vocal, d’observer l’écran et même de sauvegarder les souvenirs de jeu. Cette application vise à offrir aux joueurs une expérience de jeu plus immersive et interactive, élargissant les frontières de l’application de l’IA dans le domaine du divertissement. (Source: Reddit r/ChatGPT)

L’Agent ChatGPT maîtrise le jeu Cookie Clicker : Un utilisateur de Reddit a montré comment l’Agent ChatGPT a réussi à maîtriser le jeu Cookie Clicker, en automatisant les clics et en améliorant la progression du jeu grâce à des stratégies. Ce cas démontre le potentiel de l’Agent IA à simuler le comportement humain et à exécuter des tâches répétitives, annonçant de vastes perspectives d’application de l’IA dans l’automatisation des tâches numériques quotidiennes. (Source: Reddit r/ChatGPT)

Agent de court-métrage généré par l’IA : Réalisation de créations de qualité cinématographique : Un utilisateur a réussi à entraîner un agent IA qui, en utilisant les techniques de Veo3 (telles que les prompts JSON, le montage et la cohérence des personnages), permet de générer des courts-métrages complets en un seul clic. Cet agent est capable de créer du contenu vidéo de qualité cinématographique à partir de simples prompts textuels (comme “Bizarre Japanese shopping channel”), démontrant la puissante capacité et le potentiel de l’IA dans l’automatisation des processus de production audiovisuelle. (Source: fabianstelzer)
Qdrant Cloud Inference prend en charge la recherche multimodale : Qdrant Cloud Inference lancera une fonction de recherche multimodale, prenant en charge les intégrations de texte et d’image ainsi que la recherche vectorielle via une seule API. Cela permettra aux utilisateurs d’effectuer des recherches de données intermodales de manière plus flexible, améliorant l’efficacité et la précision de la recherche, particulièrement adapté aux scénarios nécessitant le traitement de données non structurées complexes. (Source: qdrant_engine)
📚 APPRENTISSAGE
“Machine Learning Pen and Paper Exercises” : Un livre pratique gratuit : Un livre pratique gratuit intitulé “Machine Learning Pen and Paper Exercises” est recommandé. Il contient des exercices et des solutions détaillées sur des sujets tels que l’optimisation, l’apprentissage basé sur des modèles, les modèles graphiques et l’intégration de Monte Carlo. Ce livre, qui exige des lecteurs des connaissances théoriques et conceptuelles en machine learning, est une ressource précieuse pour approfondir la compréhension des principes du ML. (Source: TheTuringPost)
Tutoriel ACL 2025 sur la collaboration homme-IA : Lors de la conférence ACL 2025, un tutoriel sur la collaboration homme-IA sera proposé, explorant comment choisir des partenaires de collaboration IA et comment les construire. Ce tutoriel vise à guider les chercheurs et les développeurs pour réaliser une collaboration homme-machine efficace dans des scénarios où les modèles et Agents IA améliorent les capacités humaines plutôt que de les remplacer. (Source: stanfordnlp)
Code de “Physics of Language Models” publié : Facebook Research a publié la première phase du code de “Physics of Language Models”, fournissant tous les composants nécessaires pour pré-entraîner de puissants modèles de base 8B, y compris les couches Canon. Ce projet vise à révéler les véritables limites des architectures LLM à travers un environnement de pré-entraînement synthétique contrôlé, et à promouvoir un nouveau paradigme de conception des LLM. (Source: eliebakouch)
Recherche sur la cognition temporelle des LLM : Cartographie du sens du temps humain : Une étude a révélé que les LLM construisent naturellement une ligne de temps mentale autour de l’année 2025, et compressent le temps éloigné de cette année sur une échelle logarithmique, de manière similaire à la perception humaine de la sonie et de la luminosité (loi de Weber-Fechner). Cela suggère que les LLM présentent des biais similaires à ceux des humains en matière de cognition temporelle, ce qui indique que la future orientation de la pensée des modèles nécessitera une compréhension approfondie de leurs représentations internes. (Source: jpt401)
Implémentation de RLHF (Reinforcement Learning from Human Feedback) dans les Notebooks : Un projet GitHub propose une implémentation de RLHF (Reinforcement Learning from Human Feedback) dans les Notebooks. Cela fournit aux développeurs et aux chercheurs une ressource pour pratiquer et apprendre le RLHF, les aidant à mieux comprendre et appliquer cette technologie cruciale pour l’alignement des grands modèles de langage. (Source: Reddit r/MachineLearning)

9 nouvelles techniques d’optimisation de politiques : La discussion a mentionné 9 nouvelles techniques d’optimisation de politiques, dont GSPO, LAPO, HBPO, etc. Ces techniques visent à améliorer la stabilité, l’efficacité et les performances des algorithmes d’apprentissage par renforcement, ce qui est crucial pour l’entraînement des grands modèles de langage et des systèmes d’Agent, offrant de nouvelles directions et outils pour la recherche en IA. (Source: TheTuringPost)
Explication visuelle du mécanisme de cache KV des LLM : Une explication visuelle du mécanisme de cache KV dans les LLM a été partagée, ce qui est crucial pour comprendre comment les grands modèles de langage optimisent leurs performances pendant l’inférence. Le cache KV réduit les calculs répétés en stockant les paires clé-valeur des calculs d’attention, accélérant ainsi le processus de génération, et est une technologie clé dans l’optimisation des LLM. (Source: ethanCaballero)
Techniques d’optimisation de l’inférence LoRA pour le modèle Flux : HuggingFace a partagé diverses techniques d’optimisation de l’inférence LoRA pour le modèle de génération d’images Flux, y compris l’utilisation de torch.compile, Flash Attention 3 et la quantification dynamique des poids FP8. Ces méthodes visent à accélérer la vitesse d’inférence des modèles LoRA, permettant une accélération d’au moins 2x même sur des GPU grand public, ce qui est d’une grande importance pour l’application généralisée des modèles LoRA. (Source: huggingface)
💼 AFFAIRES
L’impact de l’IA sur le marché du travail et les tendances futures : Les médias sociaux ont largement discuté de l’impact de l’IA sur le marché du travail, y compris les pertes d’emplois induites par l’IA, la volonté des travailleurs de se reconvertir et la diminution de la stigmatisation liée au chômage. Certains estiment que l’IA remplacera la plupart des emplois, ce qui pourrait entraîner l’effondrement des systèmes sociaux ou la mise en œuvre d’un revenu de base universel (UBI). De plus, l’application de l’IA dans des domaines tels que la gestion des soins de santé est considérée comme un cas d’utilisation positif, mais certains craignent également que les compagnies d’assurance ne s’améliorent en retour pour contrer l’efficacité accrue de l’IA. (Source: Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence, Ronald_vanLoon, JimDMiller)
Stratégie de prix et positionnement sur le marché de Claude Opus : Les médias sociaux ont discuté du prix élevé du modèle Claude Opus, suggérant qu’Anthropic ne souhaite peut-être pas qu’il soit largement utilisé par le grand public, mais se concentre plutôt sur le marché des entreprises et la recherche. Le prix élevé est considéré comme une stratégie de marché visant à guider les utilisateurs vers des modèles plus économiques en fonction de leurs besoins, et à soutenir le financement de la R&D d’Anthropic. (Source: Reddit r/ClaudeAI)

Scénario futur des modèles publicitaires basés sur l’IA : La discussion prédit l’apparition de publicités dans l’IA, qui pourraient se présenter sous forme de “recommandations intelligentes” hautement pertinentes et bien accueillies par les utilisateurs, voire remplacer les modes d’achat en ligne traditionnels. La publicité IA sera un moyen nécessaire pour de nombreuses applications IA grand public de couvrir les coûts de calcul, potentiellement via des modèles IA générant des images et y intégrant des logos de marques. (Source: fabianstelzer)
🌟 COMMUNAUTÉ
Controverse sur la confidentialité des données et la rétention des conversations de ChatGPT : La communauté Reddit a discuté de la “rétention permanente” des données de conversation de ChatGPT, soulevant des préoccupations des utilisateurs concernant la confidentialité et la sécurité des données. Bien qu’il existe des lois pertinentes en Europe, les utilisateurs ont constaté que même après avoir supprimé les conversations et la mémoire, l’IA pouvait toujours citer des informations sensibles. Cela met en évidence le besoin de transparence des politiques de données des fournisseurs de services IA, ainsi que l’attention des utilisateurs sur le contrôle de leurs données personnelles. (Source: Reddit r/ChatGPT, Reddit r/LocalLLaMA, Reddit r/LocalLLaMA)

Utilité des LLM en codage et défis du flux de travail : Les médias sociaux ont discuté de l’utilité des LLM dans le codage logiciel. Certains estiment que les ingénieurs qui ne trouvent pas les LLM utiles ont peut-être formé leur opinion avant l’apparition de Claude Code, ou utilisent des langages/frameworks de niche, ou travaillent sur de grandes bases de code existantes. Cela reflète la difficulté d’intégrer les outils d’IA aux flux de travail existants, ainsi que les obstacles liés au “changement d’habitudes” que les nouveaux produits doivent surmonter pour se populariser. (Source: matanSF)
Compréhension et application de la fonction sous-Agent de Claude Code : La communauté Reddit a discuté de la fonction sous-Agent de Claude Code, les utilisateurs étant perplexes quant à la signification de chaque sous-Agent ayant sa propre fenêtre contextuelle. Des utilisateurs expérimentés ont expliqué que les sous-Agents, grâce aux prompts système et aux configurations spécifiques au projet, peuvent se concentrer sur des aspects spécifiques de la base de code et rapporter collaborativement au thread principal, améliorant ainsi l’efficacité et la clarté des projets complexes. (Source: Reddit r/ClaudeAI)
“Hallucinations” de performance des modèles d’IA et problèmes de qualité des données : Les médias sociaux ont discuté des problèmes d‘“hallucinations” des modèles d’IA dans des tâches spécifiques (comme la reconnaissance d’images), par exemple en identifiant des femmes comme des oiseaux, ou en donnant des réponses erronées à des problèmes mathématiques avant de se corriger. Cela révèle un taux d’erreur de 20 à 30 % dans l’annotation des ensembles de données, soulignant l’impact décisif de la qualité des données sur les performances des modèles d’IA, et indiquant que l’IA a encore des limites en matière de compréhension logique profonde. (Source: vikhyatk, Reddit r/ArtificialInteligence)
Défis de l’ingénierie des prompts pour l’Agent IA : Les médias sociaux ont discuté des difficultés de l’ingénierie des prompts pour l’Agent IA, en particulier sur la manière de guider l’Agent à utiliser des outils, à obtenir du contexte et à éviter de poser des questions inutiles à l’utilisateur. Les utilisateurs ont généralement signalé que l’Agent avait tendance à poser trop de questions, ce qui augmentait la complexité de l’interaction, nécessitant des stratégies de prompt plus fines pour améliorer l’autonomie et l’efficacité de l’Agent. (Source: cto_junior, cto_junior)

Assistance et limites de l’IA dans le diagnostic médical : Un utilisateur a partagé les limites de ChatGPT dans les consultations médicales, par exemple en ne signalant pas activement les effets secondaires des médicaments. Cela montre que, bien que l’IA excelle dans certains domaines, dans des contextes médicaux complexes et personnalisés, l’expertise humaine reste nécessaire pour compléter et valider. L’IA est actuellement plus un outil d’assistance qu’un substitut. De plus, l’application de l’IA dans la gestion médicale est considérée comme un cas d’utilisation positif, mais certains craignent également que les compagnies d’assurance ne s’améliorent en retour pour contrer l’efficacité accrue de l’IA. (Source: JimDMiller, Reddit r/ArtificialInteligence)
Discussion sur l’impact à long terme de l’IA sur la société : La communauté a discuté de l’impact à long terme de l’IA, y compris si elle est surestimée ou si elle présente des dangers potentiels. Il est généralement admis que le développement de l’IA est rapide et révolutionnaire, mais son orientation finale reste incertaine. Il est suggéré que les gens devraient se préparer mentalement aux changements à venir et se concentrer sur la vie présente, car l’impact de l’IA est un défi commun à toute l’humanité. (Source: Reddit r/ArtificialInteligence, shuchaobi)
Bilibili publie le TOP30 des applications IA les plus suivies par les jeunes : Bilibili a publié lors du WAIC 2025 le classement “TOP30 des applications IA les plus suivies par les jeunes” basé sur les mégadonnées de sa plateforme. Deepseek, Quark, Doubao, Tencent Yuanbao et Kimi figurent parmi les cinq premiers. Cela montre que Bilibili est devenue une plateforme importante pour l’écosystème de contenu IA, avec plus de 140 millions d’utilisateurs regardant du contenu IA chaque mois, dont plus de 80 % sont nés après 1995, démontrant la popularité et l’influence de l’IA auprès des jeunes. (Source: 量子位)

Les modèles à 70 milliards de paramètres sont-ils obsolètes ? Discussion sur les tendances de taille des modèles LLM : La communauté Reddit a discuté de la question de savoir si les modèles LLM à 70 milliards de paramètres devenaient “obsolètes” et si l’architecture MoE devenait une nouvelle tendance. Certains estiment que les modèles à 70 milliards de paramètres sont trop grands pour le matériel grand public et pas assez efficaces pour le déploiement en entreprise, et que l’avenir pourrait se tourner vers des modèles denses plus petits ou des modèles MoE plus grands. Cela reflète le compromis continu entre efficacité, coût et compatibilité matérielle dans le développement des modèles d’IA. (Source: Reddit r/LocalLLaMA)
💡 AUTRES
Discussion sur les mots-clés populaires dans le domaine de l’IA : La communauté a discuté du nombre croissant de mots-clés populaires dans le domaine de l’IA, et a exploré quels mots-clés méritent d’être suivis ou ont été surmédiatisés. Cela reflète l’émergence constante de nouveaux concepts et termes techniques due au développement rapide de l’industrie de l’IA, ainsi que l’intérêt de la communauté à distinguer les tendances réellement précieuses. (Source: Reddit r/ArtificialInteligence)
La prise de décision basée sur l’IA redéfinit la stratégie commerciale : Les agents intelligents basés sur l’IA sont en train de redéfinir la stratégie commerciale, en fournissant des informations basées sur les données et en automatisant les processus de prise de décision, aidant ainsi les entreprises à améliorer leur efficacité et leur compétitivité. Cela annonce que l’IA deviendra un élément indispensable de la couche décisionnelle centrale des entreprises. (Source: Ronald_vanLoon)
Applications de l’IA dans diverses industries : Gartner souligne le vaste potentiel d’application de l’IA générative dans diverses industries, ce qui indique que la technologie de l’IA pénètre des secteurs verticaux à partir de ses capacités générales, offrant des solutions pour l’innovation et l’amélioration de l’efficacité dans différents domaines. (Source: Ronald_vanLoon)