كلمات مفتاحية:البنية التحتية للذكاء الاصطناعي, الذكاء الاصطناعي السيادي, الوكيل الذكي, نموذج الكعكة الخماسي, هندسة إنجرام, ضاغط الإدراك للوكيل
🔥 تركيز
رؤية جنسن هوانغ من NVIDIA حول “كعكة الطبقات الخمس” للبنية التحتية للذكاء الاصطناعي: طرح الرئيس التنفيذي لشركة NVIDIA جنسن هوانغ نموذج “كعكة الطبقات الخمس” لصناعة الذكاء الاصطناعي في منتدى دافوس 2026: الطاقة، الرقاقات، خدمات الحوسبة السحابية، النماذج والتطبيقات. وأشار إلى أن الاستثمارات الحالية التي تصل إلى مئات المليارات من الدولارات ليست سوى البداية، حيث ستشهد المستقبل موجة استثمارات تصل إلى تريليونات الدولارات في البنية التحتية. وأكد هوانغ أن الذكاء الاصطناعي يجب أن يُنظر إليه على أنه بنية تحتية وطنية (الذكاء الاصطناعي السيادي)، واستشهد بمثال زيادة عدد أطباء الأشعة بدلاً من انخفاضهم، موضحًا أن الذكاء الاصطناعي يعمل على أتمتة “المهام” وليس استبدال “الأهداف”، مما يعزز الكفاءة ويخلق طلبًا جديدًا. هذه الرؤية تقدم منظورًا جديدًا للتعامل مع قلق البطالة الناتج عن الذكاء الاصطناعي، حيث يُعتبر الذكاء الاصطناعي مضخمًا للإنتاجية وليس منافسًا للبشر (المصدر: NVIDIA)

إطلاق Anthropic “دستور كلاود”: تعريف الشخصية المستقلة وقيم الذكاء الاصطناعي: كشفت Anthropic رسميًا عن الدستور الجديد لـ Claude، والذي يصف رؤيته السلوكية وقيمه الأساسية. لا يقتصر هذا المستند على توجيه عملية التدريب فحسب، بل يحاول أيضًا تشكيل Claude كـ “كيان عالمي” جديد يختلف عن التصورات الخيالية السابقة. يؤكد الدستور على استقلالية Claude خارج بيانات التدريب، ويشمل حتى التزامات Anthropic تجاه الذكاء الاصطناعي. أثار هذا ردود فعل قوية في المجتمع، حيث يُنظر إليه على أنه علامة على تحول الذكاء الاصطناعي من أداة إلى كيان يتمتع بـ “شخصية رقمية”، كما أثار نقاشات عميقة حول كيفية تحقيق التوازن بين قيود الذكاء الاصطناعي واستقلاليته (المصدر: Anthropic)

إطلاق DeepSeek لبنية Engram: اختراق في الحوسبة باستبدال HBM بـ DRAM: أشاد تقرير من Morgan Stanley ببحث DeepSeek الأخير الذي طرح بنية Engram (الطباعة). تفصل هذه البنية بين أنماط التخزين الثابتة والاستدلال الديناميكي من خلال آلية “الذاكرة المشروطة”، مما يسمح للنموذج بتحميل كميات كبيرة من المعرفة إلى ذاكرة النظام منخفضة التكلفة (DRAM) والبحث فيها عند الحاجة فقط. يساهم هذا الاختراق في تخفيف اختناقات ذاكرة النطاق العريض عالية التكلفة (HBM)، ويُثبت أنه في بيئات الحوسبة المحدودة، يمكن تحقيق “الفوز بالقليل” من خلال الابتكار في الخوارزميات. تتنبأ Morgan Stanley بأن DeepSeek V4 الذي يستخدم هذه البنية يمكن تشغيله على بطاقات الرسوميات الاستهلاكية (مثل RTX 5090)، مما يعيد كتابة قواعد توسع الذكاء الاصطناعي (المصدر: Morgan Stanley)

كشف النقاب عن مشروع xAI “Macrohard”: حواسيب Tesla قد تصبح قاعدة لملايين الـ Agents: كشف المهندس السابق في xAI سليمان غوري في بودكاست تفاصيل المشروع الداخلي الذي يحمل الاسم الرمزي “Macrohard”. يهدف هذا المشروع إلى بناء “محاكٍ بشري” يعمل بسرعة 8 أضعاف العمليات البشرية للوحة المفاتيح والماوس، لتحقيق أتمتة العمل المكتبي. الصدمة الأكبر كانت خطة xAI لاستخدام قدرات الحوسبة لملايين السيارات Tesla غير المستخدمة (منصة HW4) لنشر هذه الـ Agents، عبر شبكة موزعة لتجنب دورة بناء مراكز البيانات التقليدية. تم فصل غوري لاحقًا بسبب الكشف غير القانوني، لكن الثقافة العدوانية والجدول الزمني المتسارع الذي كشف عنه أعاد تقييم إمكانات xAI التنافسية في الصناعة (المصدر: The Information)

انضمام Google إلى Shopify في مجال التجارة الإلكترونية بالذكاء الاصطناعي: الانتقال من مدخل البحث إلى حلقة المعاملات المغلقة: أعلنت Google عن إطلاق بروتوكول التجارة العالمي (UCP)، بالتعاون مع عمالقة مثل Shopify و Walmart لتحويل Gemini إلى مدخل تسوق متكامل. يمكن للمستخدمين إكمال العملية بأكملها من مقارنة الأسعار ومعايير المقارنة إلى الدفع الفوري داخل مربع الحوار، دون الحاجة إلى الانتقال إلى التطبيق. يمكن لـ Gemini حتى الاتصال بالمتاجر المحلية لتأكيد المخزون نيابة عن المستخدم. يُنظر إلى هذه الخطوة على أنها رد قوي على ميزة “الدفع الفوري” في ChatGPT، مما يمثل تحولًا في نموذج الإعلانات البحثية إلى “تجارة الـ Agents”، حيث أصبحت شركات النماذج الكبيرة قوة جديدة تعيد تشكيل قنوات التجزئة العالمية (المصدر: Google)

🎯 تحركات
تسريب خطط Apple للأجهزة والترقية الجديدة لـ Siri “Campos”: وفقًا للتسريبات، تعمل Apple سرًا على تطوير جهاز قابل للارتداء بالذكاء الاصطناعي مشابه لـ AirTag، مزود بعدة كاميرات وأجهزة استشعار، ومن المتوقع إطلاقه في 2027. في الوقت نفسه، سيظهر Siri الجديد الذي يحمل الاسم الرمزي “Campos” في سبتمبر القادم، مع تكامل عميق لنموذج Google Gemini 3، مما يمنحه قدرة “إدراك الشاشة” للتحكم المباشر في الملفات والتطبيقات على الشاشة. تهدف Apple من خلال هذه الخطوة إلى الرد على OpenAI و Meta في مجال الذكاء الاصطناعي الطرفي، مع هدف إنتاج أولي يصل إلى 20 مليون جهاز (المصدر: The Information)

إطلاق Microsoft لـ VibeVoice-ASR: معالجة ساعة كاملة من الصوت في جلسة واحدة: قامت Microsoft بفتح مصدر نموذج التعرف على الصوت VibeVoice-ASR بحجم 9B على Hugging Face. يكسر هذا النموذج الطريقة التقليدية لتقطيع الصوت في ASR، حيث يدعم نافذة 64K token لمعالجة 60 دقيقة من الصوت في جلسة واحدة، مما يتجنب فقدان السياق العالمي والارتباك في تتبع المتحدثين. أظهرت الاختبارات أداءً قويًا في الخلفيات المعقدة (مثل التعرف على الأصوات البشرية في الموسيقى) والنصوص الطويلة (مثل قراءة الروايات)، مع دقة متوسطة تصل إلى 91.9٪، ودعم لتكوين الكلمات الساخنة لتصحيح التعرف على الأسماء الخاصة (المصدر: Microsoft)

إطلاق Meta لإطار Dr. Zero: التطور الذاتي للـ Agents بدون بيانات: طرح معمل الذكاء الفائق في Meta إطار Dr. Zero، الذي يمكّن الـ Agents من التطور بكفاءة بدون بيانات معلمة. يستخدم هذا الإطار آلية “المقترح-الحل” للاستكشاف النشط وإنشاء أسئلة معقدة باستخدام محركات البحث. تعمل تقنية HRPO (تحسين السياسة النسبية المجمعة بالقفز) على تجميع الأسئلة المتشابهة لبناء معايير، مما يتجنب أخذ العينات المتداخلة المكلفة، ويتفوق على خط الأساس المشرف بالكامل بنسبة 14.1٪ في مهام الأسئلة المعقدة، مما يوفر مسارًا جديدًا لحل مشكلة نضوب بيانات تدريب الذكاء الاصطناعي (المصدر: Meta)

تحول الصناعة نحو تقييم المهام طويلة المدى: إصدار معايير متعددة للسيناريوهات الحقيقية: يتحول تركيز تقييم الذكاء الاصطناعي من اختبارات الرياضيات/الكود إلى المهام طويلة المدى. يقيس اختبار APEX-Agents قدرة الـ Agents على التعاون المهني في Google Workspace؛ بينما يغطي DSAEval 641 مشكلة حقيقية في علم البيانات. أظهرت الاختبارات تقدم GPT-5.2 في الكفاءة، بينما كان Claude-Sonnet-4.5 الأقوى في الأداء الشامل. يعكس ظهور هذه المعايير إجماعًا صناعيًا: لم تعد قدرة الاستدلال هي العامل المحدد لتطور الـ Agents، بل القدرة على الحفاظ على الاتساق المنطقي والتحكم في الذاكرة على المدى الطويل (المصدر: Mercor, DSAEval)
ضاغط الإدراك للـ Agents (ACC): تحكم في الذاكرة مستوحى من البيولوجيا: اقترح الباحثون Agent Cognitive Compressor لحل مشكلة “تدهور السياق” في المحادثات متعددة الجولات للـ Agents. لا يعيد ACC تشغيل محادثات التاريخ ببساطة، بل يحافظ على “حالة إدراكية مضغوطة” مقيدة بالبنية، مع الاحتفاظ فقط بالمتغيرات الرئيسية مثل الأهداف والكيانات والعلاقات. أظهرت التجارب أن ACC حقق معدلات شبه صفرية من الهلوسة والانحراف في سير العمل المعقد لأكثر من 50 جولة، متفوقًا بشكل كبير على نمط استرجاع المعزز التقليدي (RAG) (المصدر: DAIR.AI)

🧰 أدوات
Prefect Horizon: منصة لإدارة وخوادم MCP: استجابة لانتشار Model Context Protocol (بروتوكول سياق النموذج)، أطلقت Prefect منصة Horizon. تعالج هذه المنصة نقاط الألم في نشر خوادم MCP على مستوى المؤسسات، وتوفر استضافة، تحكمًا في الوصول بناءً على الأدوار (RBAC)، سجلات التدقيق، وميزات اكتشاف الأدوات. تتيح Horizon للمؤسسات الكشف عن البيانات وسير العمل الخاص بها لـ Agents الذكاء الاصطناعي بأمان، مما يرفع MCP من بروتوكول بسيط إلى منصة إنتاجية قابلة للحكم على نطاق واسع (المصدر: Prefect)

CopilotKit + LangChain: حل بناء واجهة الـ Agents العميقة: يدعم CopilotKit الآن بنية Deep Agents التي طرحها LangChain، حيث يمكن للمطورين بناء واجهة مستخدم تفاعلية لـ Agents ذات قدرة التخطيط ببضعة أسطر من التعليمات البرمجية. تدعم هذه الأداة إخراج الدفق، تخصيص المهارات، وتنسيق الـ Agents الفرعية، مما يحل مشاكل عنق الزجاجة في واجهة المستخدم/تجربة المستخدم التي يواجهها المطورون عند بناء تطبيقات Agents معقدة، مما يسمح لـ Agents “ذات الأولوية للتخطيط” (مثل تطبيقات Manus و Claude Code) بالتحول بسرعة أكبر إلى منتجات نهائية (المصدر: CopilotKit)

Devin Review: أداة الذكاء الاصطناعي التي تعيد تشكيل تجربة مراجعة الكود: أطلقت Cognition أداة Devin Review، التي تهدف إلى حل مشكلة مراجعة البشر للكميات الكبيرة من الكود الذي يولده الذكاء الاصطناعي. لا تبحث هذه الأداة عن الأخطاء فحسب، بل تساعد البشر على فهم منطق طلبات السحب (PR) المعقدة بسرعة من خلال واجهة معاد تصميمها. تدعم الأداة الاستخدام المباشر عن طريق استبدال النطاق في روابط GitHub، ويمكنها في الاختبارات اكتشاف أخطاء مرتبطة خارج الاختلافات (Diff). منطقها الأساسي هو: يجب أن تتم مراجعة الكود الذي يولده الذكاء الاصطناعي بواسطة أدوات مساعدة أكثر كفاءة، بدلاً من إغراق المبرمجين في “قمامة الكود” (المصدر: Cognition)

تحسين GLM-4.7 Flash للتشغيل المحلي: تشغيل سياق 200K على بطاقة واحدة: قام المجتمع بإصلاح دعم KV cache في vLLM لـ GLM-4.7-Flash بسطر واحد من التعليمات البرمجية، مما ينشط آلية MLA (الانتباه الكامن متعدد الرؤوس). هذا يقلل استخدام الذاكرة للنموذج 30B بسياق 200K من 180GB إلى 10GB. الآن، يمكن تشغيل هذا النموذج ذي قدرة الاستدلال الممتازة بكامل سرعته على بطاقة RTX 5090 (32GB VRAM)، مما يمثل بداية عصر الـ Agents المحلية عالية الأداء (المصدر: Zai_org)

📚 تعلم
دورة عملية لـ Gemini CLI: بناء سير عمل أوتوماتيكي متعدد الخطوات: أطلقت DeepLearning.AI بالتعاون مع Google دورة قصيرة مجانية لتعليم المطورين استخدام Gemini CLI لبناء Agents مفتوحة المصدر. تغطي الدورة العملية الكاملة من تشغيل الملفات المحلية، تكامل أدوات التطوير، إلى استدعاء الخدمات السحابية، مع التركيز على كيفية استخدام الـ Agents لأتمتة الكود، وإنشاء لوحات البيانات، وتخطيط المهام المعقدة