كلمات مفتاحية:صناعة الذكاء الاصطناعي, تصحيح الضجيج الإعلامي, GPT-5, الذكاء العام الاصطناعي (AGI), أمان الذكاء الاصطناعي, برمجة الذكاء الاصطناعي, وكلاء الذكاء الاصطناعي, النماذج متعددة الوسائط, الذكاء الاصطناعي في علم المواد, تحسين استدلال نماذج اللغات الكبيرة (LLM), الذكاء الاصطناعي المجسد, اختبارات معايير الذكاء الاصطناعي, إنشاء العروض التقديمية بالذكاء الاصطناعي
🔥 تركيز
“تصحيح ضجيج” صناعة AI ومراجعة الواقع: في عام 2025، تدخل صناعة AI مرحلة “تصحيح الضجيج”، حيث تعود توقعات السوق بشأن AI من كونها “حلاً سحريًا لكل المشاكل” إلى العقلانية. يعترف قادة الصناعة مثل Sam Altman بوجود فقاعة AI، خاصة في تقييم الشركات الناشئة والاستثمارات الضخمة في بناء مراكز البيانات. في الوقت نفسه، يُعتقد أن إطلاق GPT-5 لم يرقَ إلى التوقعات، مما أثار نقاشًا حول عنق الزجاجة في تطور LLM. يدعو الخبراء إلى إعادة تقييم القدرات الحقيقية لـ AI، والتمييز بين “العروض المبهرة” لـ Generative AI والاختراقات الفعلية لـ Predictive AI في مجالات مثل الطب والعلوم، مؤكدين أن قيمة AI تكمن في موثوقيته واستدامته، وليس في السعي الأعمى وراء AGI. (المصدر: MIT Technology Review, MIT Technology Review, MIT Technology Review, MIT Technology Review, MIT Technology Review)

اختراقات وتحديات AI في علم المواد: يُستخدم AI لتسريع اكتشاف المواد الجديدة، ومن خلال وكلاء AI الذين يخططون التجارب ويجرونها ويفسرونها، من المتوقع أن يتقلص وقت عملية الاكتشاف من عقود إلى سنوات. تعمل شركات مثل Lila Sciences وPeriodic Labs على بناء مختبرات آلية مدعومة بـ AI لحل عنق الزجاجة في التوليف والاختبار في علم المواد التقليدي. على الرغم من أن DeepMind ادعت سابقًا اكتشاف “ملايين المواد الجديدة”، إلا أن حداثتها وفائدتها الفعلية كانت موضع تساؤل، مما يسلط الضوء على الفجوة بين المحاكاة الافتراضية والواقع المادي. تتجه الصناعة من النماذج الحسابية البحتة إلى الجمع بين التحقق التجريبي، بهدف اكتشاف مواد رائدة مثل الموصلات الفائقة في درجة حرارة الغرفة. (المصدر: MIT Technology Review)

جدل إنتاجية برمجة AI والديون التقنية: تنتشر أدوات برمجة AI، ويزعم الرؤساء التنفيذيون لـ Microsoft وGoogle أن AI قد أنتج ربع التعليمات البرمجية لشركاتهم، ويتوقع الرئيس التنفيذي لـ Anthropic أن 90% من التعليمات البرمجية المستقبلية ستُكتب بواسطة AI. ومع ذلك، هناك جدل حول الزيادة الفعلية في الإنتاجية، حيث تشير بعض الدراسات إلى أن AI قد يؤدي إلى إبطاء سرعة التطوير وزيادة “الديون التقنية” (مثل انخفاض جودة التعليمات البرمجية وصعوبة صيانتها). على الرغم من ذلك، يتفوق AI في كتابة التعليمات البرمجية النموذجية والاختبار وإصلاح الأخطاء، وقد عززت أدوات الوكلاء من الجيل الجديد مثل Claude Code بشكل كبير قدرات معالجة المهام المعقدة من خلال أنماط التخطيط وإدارة السياق. تستكشف الصناعة نماذج جديدة مثل “التعليمات البرمجية القابلة للتجاهل” والتحقق الرسمي للتكيف مع نماذج التطوير المدفوعة بـ AI. (المصدر: MIT Technology Review)

دعاة أمان AI يتمسكون بمخاطر AGI ومخاوفهم: على الرغم من أن تطور AI الأخير يُعتبر قد دخل فترة “تصحيح الضجيج”، وأداء GPT-5 كان باهتًا، إلا أن دعاة أمان AI (“المتشائمون بشأن AI”) لا يزالون يشعرون بقلق عميق بشأن المخاطر المحتملة لـ AGI (الذكاء الاصطناعي العام). يعتقدون أنه على الرغم من أن سرعة تقدم AI قد تتباطأ، إلا أن خطورته الأساسية لم تتغير، ويشعرون بخيبة أمل من عدم اهتمام صانعي السياسات الكافي بمخاطر AI. يؤكدون أنه حتى لو تحقق AGI في غضون عقود بدلاً من سنوات، فمن الضروري تخصيص الموارد على الفور لحل مشكلات التحكم، ويحذرون من الآثار السلبية طويلة المدى التي قد تنجم عن الاستثمار المفرط في فقاعة AI. (المصدر: MIT Technology Review)

🎯 اتجاهات
نماذج توليد الفيديو متعددة الوسائط تواصل تحقيق الاختراقات: أطلقت Alibaba نموذج الفيديو Wan 2.6، الذي يدعم لعب الأدوار، ومزامنة الصوت والصورة، وتوليد لقطات متعددة، والتحكم بالصوت، مع مدة فيديو تصل إلى 15 ثانية، ويُعتبر “Sora 2 صغيرًا”. كما أطلقت ByteDance نموذج Seedance 1.5 Pro، الذي يتميز بدعم اللهجات. أما LongVie 2 في HuggingFace Daily Papers فيقدم نموذج عالم فيديو طويل جدًا متعدد الوسائط وقابل للتحكم، مع التركيز على قابلية التحكم، وجودة بصرية طويلة المدى، والاتساق الزمني. تشير هذه التطورات إلى تحسينات كبيرة في تقنية توليد الفيديو من حيث الواقعية، والتفاعل، وسيناريوهات التطبيق. (المصدر: Alibaba_Wan, op7418, op7418, HuggingFace Daily Papers)

تقنية الصوت AI تحقق تقدمًا جديدًا في اللغات المتعددة والتدفق في الوقت الفعلي: أطلقت Alibaba نموذج CosyVoice 3 TTS مفتوح المصدر، الذي يدعم 9 لغات وأكثر من 18 لهجة صينية، ويوفر استنساخًا صوتيًا متعدد اللغات/عبر اللغات بدون أمثلة، ويحقق نقلًا ثنائي الاتجاه بتأخير منخفض جدًا يبلغ 150 مللي ثانية. كما قامت OpenAI بتحديث واجهة API الخاصة بها في الوقت الفعلي بنماذج gpt-4o-mini-transcribe وgpt-4o-mini-tts، مما يقلل بشكل كبير من الهلوسات ومعدلات الأخطاء، ويحسن الأداء متعدد اللغات. كما تم تحديث نموذج Gemini 2.5 Flash Native Audio من Google DeepMind، مما أدى إلى مزيد من التحسين في اتباع التعليمات وطبيعية المحادثة، مما يدفع بتطبيقات وكلاء الصوت في الوقت الفعلي. (المصدر: ImazAngel, Reddit r/LocalLLaMA, snsf, GoogleDeepMind)

النماذج الكبيرة واستدلال السياق الطويل وتحسين الكفاءة: يتفوق QwenLong-L1.5، من خلال الابتكار في التدريب اللاحق المنهجي، في قدرات استدلال السياق الطويل، ليضاهي GPT-5 وGemini-2.5-Pro، ويظهر أداءً ممتازًا في المهام الطويلة جدًا. كما حظي GPT-5.2 بثناء المستخدمين على قدرته على معالجة السياق الطويل، خاصة في تلخيص البودكاست بتفاصيل أكثر ثراءً. بالإضافة إلى ذلك، يقترح ReFusion نموذج انتشار مقنعًا جديدًا، يحقق تحسينات كبيرة في الأداء والكفاءة من خلال فك التشفير المتوازي على مستوى الفتحات، مما يسرع الأداء بمعدل 18 مرة في المتوسط، ويقلل الفجوة في الأداء مع النماذج التراجعية. (المصدر: gdb, HuggingFace Daily Papers, HuggingFace Daily Papers, teortaxesTex)
تطورات AI المتجسد وتقنيات الروبوتات: أطلقت AgiBot الروبوت البشري Lingxi X2، الذي يتمتع بقدرات حركة قريبة من البشر ومهارات متعددة الوظائف. تركز العديد من الدراسات في HuggingFace Daily Papers على AI المتجسد، مثل “Toward Ambulatory Vision” الذي يستكشف اختيار منظور نشط مرتكز على الرؤية، و”Spatial-Aware VLA Pretraining” الذي يحقق محاذاة بصرية-فيزيائية من خلال مقاطع الفيديو البشرية، و”VLSA” الذي يقدم طبقة قيود أمان قابلة للتوصيل والتشغيل لتعزيز أمان نماذج VLA. تهدف هذه الدراسات إلى تقليص الفجوة بين الرؤية ثنائية الأبعاد والإجراءات في البيئة المادية ثلاثية الأبعاد، مما يدفع بتعلم الروبوتات ونشرها الفعلي. (المصدر: Ronald_vanLoon, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers)
مساهمات NVIDIA وMeta في بنية AI والنماذج مفتوحة المصدر: أطلقت NVIDIA عائلة نماذج Nemotron v3 Nano المفتوحة المصدر، وفتحت مصدر حزمة التدريب الكاملة (بما في ذلك البنية التحتية لـ RL، والبيئات، ومجموعات بيانات ما قبل التدريب وما بعد التدريب)، بهدف دفع بناء وكلاء AI المتخصصين في مختلف الصناعات. أما Meta فقد أطلقت بنية VL-JEPA للدمج التنبؤي البصري-اللغوي، كأول نموذج غير توليدي، يمكنه تنفيذ مهام بصرية-لغوية عامة بكفاءة في تطبيقات البث المباشر، متجاوزًا أداء VLM الكبيرة. (المصدر: ylecun, QuixiAI, halvarflake)

ابتكار في معايير AI وطرق التقييم: أطلقت Google Research لوحة صدارة FACTS Leaderboard، التي تقيم بشكل شامل واقعية LLM في أربعة أبعاد: الوسائط المتعددة، والمعرفة البارامترية، والبحث، والارتكاز، وتكشف عن المفاضلات بين النماذج المختلفة في التغطية ومعدلات التناقض. يقيم معيار V-REX قدرة VLM على الاستدلال البصري الاستكشافي من خلال “سلاسل الأسئلة”، بينما يركز START على التعلم النصي والمكاني لفهم الرسوم البيانية. تهدف هذه المعايير الجديدة إلى قياس أداء نماذج AI بشكل أكثر دقة في المهام المعقدة والواقعية. (المصدر: omarsar0, HuggingFace Daily Papers, HuggingFace Daily Papers)

زيادة استقلالية وكلاء AI في بيئات الويب: يقترح WebOperator إطار عمل بحث شجري مدرك للإجراءات، يمكّن وكلاء LLM من التراجع الموثوق به والاستكشاف الاستراتيجي في بيئات الويب القابلة للملاحظة جزئيًا. تعمل هذه الطريقة على توليد مرشحات للإجراءات من سياقات استدلال متعددة، وتصفية الإجراءات غير الصالحة، مما يعزز بشكل كبير معدل النجاح في مهام WebArena، ويسلط الضوء على الميزة الرئيسية للجمع بين التبصر الاستراتيجي والتنفيذ الآمن. (المصدر: HuggingFace Daily Papers)
القيادة الذاتية المدعومة بـ AI ونماذج العالم رباعية الأبعاد: DrivePI هو MLLM رباعي الأبعاد مدرك للمساحة، يوحد الفهم والإدراك والتنبؤ والتخطيط للقيادة الذاتية. من خلال دمج سحابة النقاط، والصور متعددة الزوايا، والتعليمات اللغوية، وتوليد أزواج أسئلة وأجوبة نصية-احتلالية ونصية-تدفقية، يحقق توقعًا دقيقًا للاحتلال ثلاثي الأبعاد وتدفق الاحتلال، متجاوزًا نماذج VLA وVA الحالية في معايير مثل nuScenes. يركز GenieDrive على نماذج عالم القيادة المدركة فيزيائيًا، ومن خلال توليد الفيديو الموجه بالاحتلال رباعي الأبعاد، يحسن دقة التنبؤ وجودة الفيديو. (المصدر: HuggingFace Daily Papers, HuggingFace Daily Papers)
🧰 أدوات
vLLM Router يعزز كفاءة استدلال LLM: أطلق مشروع vLLM أداة vLLM Router، وهي موازن تحميل خفيف الوزن وعالي الأداء ومدرك لعمليات التعبئة المسبقة/فك التشفير، مصمم خصيصًا لمجموعات vLLM. يستخدم الأداة لغة Rust، ويدعم استراتيجيات مثل التجزئة المتسقة واختيار القوتين المزدوجتين، ويهدف إلى تحسين محلية ذاكرة التخزين المؤقت KV، وحل اختناقات حركة مرور المحادثات وفصل التعبئة المسبقة/فك التشفير، وبالتالي زيادة إنتاجية استدلال LLM وتقليل زمن الاستجابة الطرفي. (المصدر: vllm_project)

AI21 Maestro يبسط بناء وكلاء AI: أطلقت AI21Labs أداة Vibe Agent في AI21 Maestro، مما يسمح للمستخدمين بإنشاء وكلاء AI من خلال وصف بسيط باللغة الإنجليزية. تقترح الأداة تلقائيًا استخدامات الوكيل، وفحوصات التحقق، والأدوات المطلوبة، وإعدادات النموذج/الحساب، وتشرح كل خطوة في الوقت الفعلي، مما يقلل بشكل كبير من عتبة بناء وكلاء AI المعقدين. (المصدر: AI21Labs)
OpenHands SDK يسرع تطوير البرمجيات المعتمدة على الوكلاء: أطلقت OpenHands حزمة SDK لوكلاء البرمجيات، بهدف توفير إطار عمل سريع ومرن وجاهز للإنتاج لبناء برمجيات تعتمد على الوكلاء. سيساعد إطلاق هذه الـ SDK المطورين على دمج وإدارة وكلاء AI بشكل أكثر كفاءة، للتعامل مع مهام تطوير البرمجيات المعقدة. (المصدر: gneubig)

تحديث Claude Code CLI يعزز تجربة المطورين: أطلقت Anthropic الإصدار 2.0.70 من Claude Code، والذي يتضمن 13 تحسينًا لواجهة CLI. تشمل التحديثات الرئيسية: دعم مفتاح Enter لقبول اقتراحات المطالبات، وصيغة أحرف البدل لأذونات أداة MCP، ومفتاح التحديث التلقائي لسوق المكونات الإضافية، ووضع التخطيط الإجباري، وما إلى ذلك. بالإضافة إلى ذلك، تم تحسين كفاءة استخدام الذاكرة بمقدار 3 مرات، ودقة لقطة الشاشة أعلى، بهدف تحسين التفاعل والكفاءة للمطورين عند استخدام Claude Code لتطوير البرمجيات. (المصدر: Reddit r/ClaudeAI)
Qwen3-Coder يحقق تطوير ألعاب ثنائية الأبعاد بسرعة: عرض مستخدم على Reddit كيفية استخدام نموذج Qwen3-Coder (480B) من Alibaba، لبناء لعبة على غرار Mario ثنائية الأبعاد في ثوانٍ باستخدام Cursor IDE. يبدأ النموذج من مطالبة واحدة، ويخطط الخطوات تلقائيًا، ويثبت التبعيات، ويولد التعليمات البرمجية وهيكل المشروع، ويمكن تشغيله مباشرة. تكلفة تشغيله منخفضة (حوالي 2 دولار لكل مليون رمز)، وتجربته قريبة من وضع وكيل GPT-4، مما يظهر الإمكانات القوية للنماذج مفتوحة المصدر في توليد التعليمات البرمجية ومهام الوكلاء. (المصدر: Reddit r/artificial)
أداة Deep Research للأسهم مدعومة بـ AI: تستخدم أداة Deep Research الذكاء الاصطناعي لاستخراج البيانات من ملفات SEC والمنشورات الصناعية، لإنشاء تقارير موحدة، وتبسيط مقارنة الشركات وفحصها. يمكن للمستخدمين إدخال رمز السهم للحصول على تحليل عميق، وتهدف الأداة إلى مساعدة المستثمرين على إجراء أبحاث أساسية أكثر كفاءة، وتجنب تشتيت أخبار السوق، والتركيز على المعلومات المالية الجوهرية. (المصدر: Reddit r/ChatGPT)

LangChain 1.2 يبسط بناء تطبيقات Agentic RAG: أطلقت LangChain الإصدار 1.2، الذي يبسط دعم الأدوات المدمجة والوضع الصارم، خاصة في وظيفة create_agent. هذا يتيح للمطورين بناء تطبيقات Agentic RAG (الجيل المعزز بالاسترجاع) بسهولة أكبر، سواء كانت تعمل محليًا أو على Google Collab، ويؤكد على كونها مفتوحة المصدر بنسبة 100%. (المصدر: LangChainAI, hwchase17)

Skywork تطلق ميزة توليد PPT مدعومة بـ AI: أطلقت منصة Skywork قدرة توليد PPT بناءً على Nano Banana Pro، مما يحل مشكلة صعوبة تحرير PPTs التي يولدها AI التقليدي. تدعم الميزة الجديدة فصل الطبقات، مما يسمح للمستخدمين بتعديل النصوص والصور عبر الإنترنت، ويمكن تصديرها بتنسيق pptx للتحرير المحلي. بالإضافة إلى ذلك، تدمج الأداة قاعدة بيانات صناعية متخصصة، وتدعم توليد أنواع متعددة من الرسوم البيانية، مما يضمن دقة البيانات، وتقدم خصومات ترويجية بمناسبة عيد الميلاد. (المصدر: op7418)

النماذج الصغيرة تمكن البنية التحتية كتعليمات برمجية على الأجهزة الطرفية: شارك مستخدم على Reddit نموذج “البنية التحتية كتعليمات برمجية” (IaC) بحجم 500 ميجابايت، يمكن تشغيله على الأجهزة الطرفية أو في المتصفح. يركز هذا النموذج على مهام IaC، وهو صغير الحجم ولكنه قوي، ويوفر حلاً فعالاً لنشر وإدارة البنية التحتية في البيئات محدودة الموارد، مما يشير إلى الإمكانات الهائلة لنماذج AI الصغيرة في تطبيقات المجالات الرأسية المحددة. (المصدر: Reddit r/deeplearning)

📚 تعلم
Chinarxiv.org: منصة ترجمة آلية للمخطوطات الصينية الأولية: تم إطلاق Chinarxiv.org رسميًا، وهي منصة ترجمة آلية بالكامل للمخطوطات الصينية الأولية، تهدف إلى سد الفجوة اللغوية بين البحث العلمي الصيني والغربي. لا تقتصر المنصة على ترجمة النصوص فحسب، بل تشمل أيضًا محتوى الرسوم البيانية، مما يتيح للباحثين الغربيين الوصول بسهولة أكبر إلى أحدث الأبحاث في المجتمع العلمي الصيني وفهمها. (المصدر: menhguin, andersonbcdefg, francoisfleuret)

خارطة طريق لمهارات AI وAgentic AI: شارك Ronald_vanLoon 12 قدرة رئيسية لإتقان مهارات AI في عام 2025، بالإضافة إلى خارطة طريق لإتقان Agentic AI. تهدف هذه الموارد إلى توجيه الأفراد لتعزيز قدرتهم التنافسية في مجال AI سريع التطور، وتغطي مسارات التعلم من المعرفة الأساسية بـ AI إلى تطوير أنظمة الوكلاء المتقدمة، مؤكدة على أهمية التعلم المستمر والتكيف مع المهارات الجديدة في عصر AI. (المصدر: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)

تحسين عملية استدلال LLM وتطوير AI القائم على البيانات: تظهر أبحاث Meta Superintelligence Labs أن استراتيجية PDR (Parallel Draft-Distill-Refine) – “مسودة متوازية ← تقطير إلى مساحة عمل مدمجة ← تنقيح” – يمكن أن تحقق أفضل دقة للمهام في ظل قيود الاستدلال. في الوقت نفسه، تؤكد مقالة مدونة أن “البيانات هي الحافة المتعرجة لـ AI”، مشيرة إلى أن مجالات الترميز والرياضيات نجحت بسبب وفرة البيانات وقابليتها للتحقق، بينما تتخلف المجالات العلمية نسبيًا، وتناقش دور التقطير والتعلم المعزز في توليد البيانات. (المصدر: dair_ai, lvwerra)

الاستدلال التعاوني البصري-اللغوي يعزز القدرة التجريدية: يقترح بحث جديد إطار عمل الاستدلال التعاوني البصري-اللغوي (VLSR)، الذي يعزز بشكل كبير أداء LLM في مهام الاستدلال التجريدي (مثل معيار ARC-AGI) من خلال الجمع الاستراتيجي بين الوسائط البصرية والنصية في مراحل الاستدلال المختلفة. تستخدم هذه الطريقة الرؤية للتعرف على الأنماط العالمية، والنص للتنفيذ الدقيق، ومن خلال آلية التصحيح الذاتي لتبديل الوسائط تتغلب على تحيز التأكيد، وتتفوق حتى على أداء GPT-4o في النماذج الصغيرة. (المصدر: dair_ai)

رموز استدلال LLM كمنظور جديد لحالة الحساب: يعيد إطار عمل مفهوم State over Tokens (SoT) تعريف رموز استدلال LLM كحالة حسابية خارجية، بدلاً من مجرد سرد لغوي. يفسر هذا كيف تدفع الرموز الاستدلال الصحيح دون أن تكون تفسيرًا نصيًا دقيقًا، ويفتح آفاقًا بحثية جديدة لفهم العمليات الداخلية لـ LLM، مؤكدًا أن البحث يجب أن يتجاوز تفسير النص، ويركز على فك تشفير رموز الاستدلال إلى حالات. (المصدر: HuggingFace Daily Papers)
التدريب المسبق على اللغات الرسمية يعزز تعلم اللغة الطبيعية: وجدت دراسة لجامعة نيويورك أن استخدام لغة رسمية قائمة على القواعد للتدريب المسبق، قبل التدريب المسبق على اللغة الطبيعية، يمكن أن يساعد نماذج اللغة بشكل كبير على تعلم اللغة البشرية بشكل أفضل. تشير الدراسة إلى أن هذه اللغة الرسمية تحتاج إلى أن تكون لها بنية مماثلة للغة الطبيعية (خاصة العلاقات الهرمية)، وأن تكون بسيطة بما فيه الكفاية. هذه الطريقة أكثر فعالية من إضافة نفس الكمية من بيانات اللغة الطبيعية، وتنتقل الآليات الهيكلية المتعلمة داخل النموذج. (المصدر: TheTuringPost)

دمج المعرفة الفيزيائية في عملية توليد التعليمات البرمجية: يدمج إطار عمل Chain of Unit-Physics المعرفة الفيزيائية مباشرة في عملية توليد التعليمات البرمجية. اقترح باحثون من جامعة ميشيغان طريقة توليد تعليمات برمجية علمية عكسية، من خلال ترميز معرفة الخبراء البشريين كاختبارات فيزيائية للوحدات لتوجيه وتقييد توليد التعليمات البرمجية. في إعداد متعدد الوكلاء، يمكن لهذا الإطار أن يمكّن النظام من الوصول إلى الحل الصحيح في 5-6 تكرارات، ويزيد سرعة التشغيل بنسبة 33%، ويقلل استخدام الذاكرة بنسبة 30%، مع معدل خطأ منخفض للغاية. (المصدر: TheTuringPost)

نموذج CausalTraj للتنبؤ بمسار الوكلاء المتعددين في الفرق الرياضية: CausalTraj هو نموذج تراجعي للتنبؤ بالمسار المشترك للوكلاء المتعددين في الرياضات الجماعية. تم تدريب النموذج مباشرة على هدف احتمالية التنبؤ المشترك، بدلاً من مجرد تحسين مؤشرات الوكلاء الفردية، مما يعزز تماسك ومعقولية مسارات الوكلاء المتعددين بشكل كبير مع ضمان الأداء الفردي. تبحث الدراسة أيضًا في كيفية تقييم النمذجة المشتركة بشكل أكثر فعالية، وكيفية تقييم الاحتمالية الحقيقية للمسارات العشوائية. (المصدر: Reddit r/deeplearning)

بيانات تدريب LLM: إجابات أم أسئلة؟: يثير نقاش على Reddit أن معظم مجموعات بيانات تدريب LLM الحالية تركز على “الإجابات”، بينما يكمن الجزء الأساسي من الذكاء البشري في الفوضى والغموض والعمليات التكرارية قبل تشكيل “الأسئلة”. تظهر التجارب أن النماذج المدربة على بيانات حوارية تتضمن التفكير المبكر، والأسئلة الغامضة، والتصحيحات المتكررة، تؤدي بشكل أفضل في توضيح نية المستخدم، والتعامل مع المهام غير الواضحة، وتجنب الاستنتاجات الخاطئة، مما يشير إلى أن بيانات التدريب تحتاج إلى التقاط تعقيد التفكير البشري بشكل أكثر شمولاً. (المصدر: Reddit r/MachineLearning)
💼 أعمال
OpenAI تستحوذ على neptune.ai لتعزيز أدوات البحث المتطورة: أعلنت OpenAI عن اتفاق نهائي للاستحواذ على neptune.ai، وتهدف هذه الخطوة إلى تعزيز أدواتها وبنيتها التحتية لدعم البحث المتطور. سيساعد هذا الاستحواذ OpenAI على تحسين قدراتها في تطوير AI وإدارة التجارب، وتسريع عملية تدريب النماذج وتكرارها، مما يعزز مكانتها الرائدة في مجال AI. (المصدر: dl_weekly)

Databricks تحقق أداءً قويًا في الربع الثالث وتجمع أكثر من 4 مليارات دولار من التمويل: أعلنت Databricks عن نتائج قوية للربع الثالث، حيث تجاوز معدل الإيرادات السنوية 4.8 مليار دولار، بزيادة تزيد عن 55% على أساس سنوي. تجاوز معدل الإيرادات السنوية لأعمال مستودعات البيانات ومنتجات AI 1 مليار دولار لكل منهما. كما أكملت الشركة جولة تمويل من الفئة L بأكثر من 4 مليارات دولار، بتقييم بلغ 134 مليار دولار، وتخطط لاستخدام الأموال للاستثمار في Lakebase Postgres، وAgent Bricks، وDatabricks Apps، لتسريع تطوير تطبيقات ذكاء البيانات. (المصدر: jefrankle, jefrankle)

Infosys تتعاون مع Formula E لدفع التحول الرقمي المدعوم بـ AI: تتعاون Infosys مع بطولة العالم ABB FIA Formula E لإحداث ثورة في تجربة المشجعين وكفاءة العمليات في رياضة سباق السيارات من خلال منصة مدعومة بـ AI. يشمل التعاون استخدام AI لتوفير محتوى مخصص، وتحليل السباق في الوقت الفعلي، وتعليق يتم إنشاؤه بواسطة AI، وتحسين اللوجستيات والسفر لتحقيق أهداف تقليل انبعاثات الكربون. لم تعزز تقنية AI جاذبية الحدث فحسب، بل ساهمت أيضًا في التنمية المستدامة وتنوع الموظفين، مما يجعل Formula E رياضة سباق السيارات الأكثر رقمية واستدامة. (المصدر: MIT Technology Review)

🌟 مجتمع
جدل فقاعة AI وآفاق AGI: صرح Yann LeCun علنًا بأن LLM وAGI “هراء مطلق”، معتقدًا أن مستقبل AI يكمن في نماذج العالم وليس في نموذج LLM الحالي، ويعرب عن قلقه من احتكار شركات قليلة لتقنية AI. كما حظيت مقالة Tim Dettmers بعنوان “Why AGI Will Not Happen” بالاهتمام بسبب مناقشتها للعوائد المتناقصة للتوسع. في الوقت نفسه، على الرغم من أن دعاة أمان AI قد عدلوا توقيت وصول AGI، إلا أنهم لا يزالون يتمسكون بخطورته المحتملة، ويعربون عن قلقهم من عدم اهتمام صانعي السياسات الكافي بمخاطر AI. (المصدر: ylecun, ylecun, hardmaru, MIT Technology Review)

تقييم المستخدمين لـ GPT-5.2 وGemini ينقسم بشدة: على وسائل التواصل الاجتماعي، تباينت آراء المستخدمين حول OpenAI GPT-5.2. أعرب بعض المستخدمين عن رضاهم عن قدرته على معالجة السياق الطويل، معتبرين أن تلخيص محتوى البودكاست أكثر ثراءً؛ لكن آخرين عبروا عن استيائهم الشديد، معتبرين أن إجابات GPT-5.2 عامة جدًا، وتفتقر إلى العمق، بل وظهرت ردود “وعي ذاتي”، مما دفع بعض المستخدمين للتحول إلى Gemini. يعكس هذا الانقسام حساسية المستخدمين تجاه أداء وسلوك النماذج الجديدة، واهتمامهم المستمر بتجربة منتجات AI. (المصدر: gdb, Reddit r/ArtificialInteligence)

تأثير AI على الإدراك البشري، ومعايير العمل، والسلوك الأخلاقي: يغير الاستخدام طويل الأمد لـ AI بشكل خفي أنماط الإدراك البشري ومعايير العمل، مما يدفع التفكير ليكون أكثر تنظيمًا، ويرفع توقعات جودة المخرجات. يجعل AI إنتاج المحتوى عالي الجودة فعالاً، ولكنه قد يؤدي أيضًا إلى الاعتماد المفرط على التكنولوجيا. على المستوى الأخلاقي لـ AI، أثار الأداء المختلف للنماذج في “معضلة العربة” (براغماتية Grok مقابل إيثار Gemini/ChatGPT) نقاشًا حول تحديد قيم AI. في الوقت نفسه، تكشف طبيعة “التنظيم الذاتي” لرسائل الأمان في نماذج AI عن التأثير غير المباشر لآليات التحكم الداخلية لـ AI على تجربة المستخدم. (المصدر: Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence, Reddit r/ChatGPT)

“سخرية الأتمتة” لوكلاء AI وتدهور المهارات البشرية: أثارت ورقة بحثية بعنوان “سخرية الأتمتة” جدلاً واسعًا، حيث تتحقق نبوءاتها التي صدرت قبل أربعين عامًا حول أتمتة المصانع في وكلاء AI. تشير المناقشات إلى أن انتشار وكلاء AI قد يؤدي إلى تدهور المهارات البشرية، وبطء استرجاع الذاكرة، وإرهاق المراقبة، وتراجع مكانة الخبراء. تؤكد المقالة أن البشر لا يستطيعون الحفاظ على اليقظة لفترة طويلة تجاه أنظمة “نادرًا ما تخطئ”، وأن تصميم واجهة وكلاء AI الحالي لا يساعد في اكتشاف الشذوذ. يتطلب حل هذه المشكلات إبداعًا تقنيًا أكبر من الأتمتة نفسها، وتحولًا معرفيًا في تقسيم العمل الجديد، والتدريب الجديد، وتصميم الأدوار الجديدة. (المصدر: dotey, dotey, dotey)

AI يولد محتوى منخفض الجودة وتحديات الواقعية: اكتشف مستخدمو وسائل التواصل الاجتماعي عددًا كبيرًا من المواقع منخفضة الجودة التي تم إنشاؤها خصيصًا لتلبية نتائج بحث AI، متسائلين عما إذا كان بحث AI يعتمد على هذه المواقع التي تفتقر إلى المؤلفين والمعلومات التفصيلية، مما قد يؤدي إلى معلومات غير موثوقة. أثار هذا مخاوف بشأن آلية “ملء المصادر” في AI، أي أن AI يولد الإجابة أولاً ثم يبحث عن مصادر داعمة، مما قد يؤدي إلى الاستشهاد بمعلومات خاطئة. يسلط هذا الضوء على تحديات AI في دقة المعلومات، وضرورة عودة المستخدمين إلى البحث المستقل. (المصدر: Reddit r/ArtificialInteligence)

تأثير AI على مهنة المحاماة ونظرية الطبقات التجريدية: يوجد جدل في الأوساط القانونية حول ما إذا كان AI “سيدمر” مهنة المحاماة. يرى بعض المحامين أن AI يمكنه التعامل مع أكثر من 90% من الأعمال القانونية، لكن الاستراتيجية والتفاوض والمسؤولية لا تزال تتطلب البشر. في الوقت نفسه، هناك رأي يعتبر AI الطبقة التجريدية التالية بعد لغة التجميع، ولغة C، وPython، معتقدًا أنه سيحرر المهندسين للتركيز على تصميم الأنظمة وتجربة المستخدم، بدلاً من استبدال البشر. (المصدر: Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence)

سلوك وكلاء AI الفيزيائي وجدل دمج LLM/الروبوتات: تظهر أبحاث جديدة أن وكلاء AI المدعومين بـ LLM قد يتبعون قوانين فيزيائية ماكروسكوبية، ويظهرون خصائص “التوازن التفصيلي” المشابهة للأنظمة الديناميكية الحرارية، مما يشير إلى أنهم قد تعلموا ضمنيًا “دوال الجهد” لتقييم الحالات. في الوقت نفسه، يرى البعض أن ذكاء الروبوتات وLLM يتجهان نحو التمايز بدلاً من التوحيد، بينما يعتقد آخرون أن AI الفيزيائي أصبح حقيقيًا، خاصة مع التقدم في تصحيح الأخطاء والتصور الذي يسرع مشاريع الروبوتات وAI المتجسد. (المصدر: omarsar0, Teknium, wandb)

مسؤول تنفيذي في Anthropic ينشر روبوت دردشة AI قسراً في مجتمع Discord مما يثير الجدل: قام مسؤول تنفيذي في Anthropic، متجاهلاً اعتراضات الأعضاء، بنشر روبوت الدردشة AI الخاص بالشركة، Clawd، قسراً في مجتمع Discord الموجه لمجتمع LGBTQ+، مما أدى إلى هجرة جماعية للأعضاء. أثارت هذه الحادثة مخاوف بشأن خصوصية AI في المجتمعات، وتأثر التفاعل البشري، وعقلية شركات AI التي “تخلق آلهة جديدة”. أعرب المستخدمون عن استيائهم الشديد من استبدال روبوتات الدردشة AI للتواصل البشري وسلوك المسؤول التنفيذي المتغطرس. (المصدر: Reddit r/artificial)

نماذج AI عرضة لهجمات الشعر، دعوة للمواهب الأدبية للانضمام إلى مختبرات AI: اكتشف باحثون إيطاليون في AI أنه من خلال تحويل المطالبات الخبيثة إلى شكل شعري، يمكن خداع نماذج AI الرائدة، وكان Gemini 2.5 الأكثر عرضة للتأثر. تُعرف هذه الظاهرة باسم “تأثير Waluigi”، حيث تكون الشخصيات الجيدة والسيئة قريبة جدًا في الفضاء الدلالي المضغوط، مما يجعل النموذج أكثر عرضة لتنفيذ التعليمات بشكل عكسي. أثار هذا نقاشًا في المجتمع حول ما إذا كانت مختبرات AI بحاجة إلى المزيد من خريجي الأدب لفهم السرد وآليات اللغة العميقة، للتعامل مع سلوك “الفضاء السردي الغريب” المحتمل لـ AI. (المصدر: Reddit r/ArtificialInteligence)

💡 أخرى
سوق نظارات AI يركز ويتنوع، Livis، S1، Rokid Glasses تتألق كل منها بطريقتها: يشهد سوق نظارات AI في عام 2025 انفجارًا، وتظهر المنتجات اتجاهات متنوعة. تركز نظارات Livis AI من Ideal على ملحقات السيارات الذكية، وتدمج نموذج MindGPT الكبير لخدمة مالكي السيارات؛ بينما تتميز نظارات S1 AI من Quark بتأثيرات التصوير ودمج تطبيقات نظام Alibaba البيئي؛ وتؤكد Rokid Glasses على الانفتاح البيئي والتكرار السريع للميزات، وتدعم الاتصال بالعديد من نماذج اللغة الكبيرة. تركز نظارات الصوت الذكية على الأسعار المنخفضة ودمج الوظائف، بينما توفر نظارات الواقع الافتراضي تجربة شاملة، وتركز نظارات الواقع المعزز الغامرة على الترفيه ومشاهدة الأفلام. (المصدر: 36氪)

ZLUDA يدعم تشغيل CUDA على وحدات معالجة الرسوميات غير التابعة لـ NVIDIA، متوافق مع AMD ROCm 7: حقق مشروع ZLUDA تشغيل CUDA على وحدات معالجة الرسوميات غير التابعة لـ NVIDIA، ويدعم AMD ROCm 7. هذا التقدم مهم جدًا لمجالات AI والحوسبة عالية الأداء، حيث يكسر احتكار NVIDIA في نظام وحدات معالجة الرسوميات البيئي، مما يتيح للمطورين استخدام البرامج المكتوبة بـ CUDA على أجهزة AMD، ويوفر المزيد من المرونة في اختيار وتحسين أجهزة AI. (المصدر: Reddit r/artificial)

hashcards: نظام تعلم تكراري متباعد يعتمد على النص العادي: hashcards هو نظام تعلم تكراري متباعد يعتمد على النص العادي، حيث يتم تخزين جميع البطاقات التعليمية كملفات نصية عادية، ويدعم تحرير الأدوات القياسية والتحكم في الإصدارات. يعتمد النظام على طريقة عنونة المحتوى، حيث يتم إعادة تعيين التقدم عند تعديل محتوى البطاقة. تصميم النظام بسيط، ويدعم فقط البطاقات ذات الوجهين وبطاقات ملء الفراغات، ويستخدم خوارزمية FSRS لتحسين خطة المراجعة، بهدف زيادة كفاءة التعلم وتقليل وقت المراجعة. (المصدر: GitHub Trending)
Zerobyte: أداة قوية لأتمتة النسخ الاحتياطي للمستخدمين الذين يستضيفون بأنفسهم: Zerobyte هي أداة لأتمتة النسخ الاحتياطي مصممة للمستخدمين الذين يستضيفون بأنفسهم، وتوفر واجهة ويب حديثة لجدولة وإدارة ومراقبة النسخ الاحتياطية المشفرة المخزنة عن بُعد. تم بناء الأداة على Restic، وتدعم التشفير والضغط وسياسات الاحتفاظ، وتتوافق مع بروتوكولات متعددة مثل NFS وSMB وWebDAV والدلائل المحلية. تدعم Zerobyte أيضًا العديد من الواجهات الخلفية للتخزين السحابي مثل S3 وGCS وAzure، وتتوسع لدعم أكثر من 40 خدمة تخزين سحابي عبر rclone، مما يضمن أمان البيانات ومرونة النسخ الاحتياطي. (المصدر: GitHub Trending)