نشرة الذكاء الاصطناعي – 2025-12-26(الإصدار الصباحي)

كلمات مفتاحية:توربو ديفيوجن, توليد الفيديو, الوكيل الذكي للذكاء الاصطناعي, واجهة برمجة تطبيقات نماذج اللغات الكبيرة, التعلم المعزز, الإنسان الآلي, طاقة الذكاء الاصطناعي, ساج أتينشن 2++, إطار لايت إكس 2 في, كوزي فويس 3.0, أداة ألفا إنجن, تقييم إس دبليو إي-إيفو

🔥 التركيز

Tsinghua بالتعاون مع Shengshu تطلق TurboDiffusion مفتوح المصدر: عصر توليد الفيديو يدخل مرحلة “الثواني” : أطلق مختبر TSAIL بجامعة Tsinghua بالتعاون مع شركة Shengshu Technology إطار عمل تسريع توليد الفيديو TurboDiffusion. من خلال أربع تقنيات أساسية هي SageAttention2++، وSLA (Sparse Linear Attention)، وتقطير الخطوات rCM، وكمية W8A8، حقق الإطار تسريعاً في الاستدلال يصل إلى 200 مرة. يستغرق توليد فيديو بدقة 480P لمدة 5 ثوانٍ على بطاقة RTX 5090 حوالي 1.9 ثانية فقط، مما يقلص التأخير من مئات الثواني إلى أرقام أحادية. يمثل هذا الاختراق وصول “لحظة DeepSeek” لتوليد الفيديو، مما يقلل بشكل كبير من عتبة تشغيل النماذج الكبيرة على بطاقات الرسوميات الاستهلاكية، ويبشر بإمكانية تحرير الفيديو في الوقت الفعلي والتوليد التفاعلي (المصدر: Arxiv، GitHub)

清华联手生数开源TurboDiffusion

Nvidia “تستوعب” فريق Groq: حرب دفاعية عن المواهب الهجومية : تثير وسائل التواصل الاجتماعي نقاشات حول أن Nvidia لم تقم بمجرد استحواذ بسيط على Groq، بل اتبعت استراتيجية أذكى تتمثل في “استيعاب المواهب + ترخيص التكنولوجيا”. من خلال ضم فريق البحث والتطوير الأساسي في Groq والحصول على تراخيص تقنيات الاستدلال الخاصة بها، نجحت Nvidia في تحييد منافس محتمل في الأجهزة مع تجنب مراجعات مكافحة الاحتكار. يشير المحللون إلى أن القيمة الأساسية لـ Groq تكمن في مراهنتها على بنية SRAM، وتهدف خطوة Nvidia هذه إلى ضمان عدم فقدان قوتها التسعيرية في سوق الاستدلال واسع النطاق مستقبلاً بسبب صعود المسرعات المخصصة، وهي مقايضة للعلاوة الحالية مقابل اليقين في السوق مستقبلاً (المصدر: teortaxesTex، draecomino)

英伟达“收编”Groq 智囊团

Agent-R1 و Bloom: التعلم المعزز (Reinforcement Learning) من البداية للنهاية يفتح نموذجاً جديداً لتدريب الوكلاء : لمواجهة تحديات اتخاذ القرار لوكلاء LLM في البيئات المعقدة، قدم إطار Agent-R1 التعلم المعزز من البداية للنهاية، حيث يعالج عشوائية ردود فعل البيئة من خلال أقنعة الحركة ووحدة ToolEnv، مما يحسن دقة التفاعلات متعددة الجولات بشكل ملحوظ. بالتزامن مع ذلك، أطلقت Anthropic أداة تقييم الوكلاء Bloom مفتوحة المصدر، القادرة على توليد مئات السيناريوهات تلقائياً لتقييم ما إذا كان النموذج يظهر سلوكيات مثل التملق أو التخريب. يشير هذان التقدمان معاً إلى المرحلة التالية من تطور AI: الانتقال من إكمال الحوار البسيط إلى وكلاء مستقلين يتمتعون بالتخطيط طويل المدى، والتصحيح الذاتي، وقابلية المراقبة الأمنية (المصدر: Arxiv، TheTuringPost)

Agent-R1 与 Bloom

تحليل عميق للمنطق الأساسي لـ LLM API: بدءاً من خطأ توافق Kimi K2 مع vLLM : اكتشف المطورون عند مواءمة Kimi K2 مع vLLM أن النموذج يعمل بشكل مثالي على API الرسمي ولكنه يفشل في استدعاء الأدوات على vLLM، مما كشف أن جوهر LLM API هو تغليف هندسي لعملية “الرندرة -> الإكمال -> التحليل”. غالباً ما لا تكمن المشكلة في قدرات النموذج، بل في فقدان لاحقات الحوار الرئيسية أثناء رندرة Prompt، أو صرامة المحلل (Parser) الزائدة. ينبه هذا التحليل المطورين إلى أن الخطوة الأولى لحل هلوسة AI وفشل استدعاء الأدوات يجب أن تكون استعادة وفحص تسلسل Prompt الأصلي المقدم للنموذج، بدلاً من ضبط معلمات النموذج بشكل أعمى (المصدر: vLLM Blog، dotey)

🎯 التوجهات

Claude Code يقدم مساعد LSP ويفتح حصة مضاعفة لفترة محدودة بمناسبة الكريسماس : أداة سطر الأوامر Claude Code التابعة لـ Anthropic تدعم الآن LSP (Language Server Protocol)، مما يسمح لـ AI بتحديد موقع الكود بدقة بدلاً من البحث العشوائي الكامل، وهو ما يحسن سرعة ودقة البحث بشكل ملحوظ. بالإضافة إلى ذلك، أعلنت Anthropic عن توفير حصة استخدام مضاعفة لمشتركي Pro و Max في الفترة من 25 إلى 31 ديسمبر، لتشجيع المطورين على دفع مشاريعهم الجانبية خلال العطلة (المصدر: Reddit، sama)

Claude Code 引入 LSP 助手

OpenAI تقترح إطاراً لقابلية مراقبة سلسلة الأفكار (CoT): فهم “تفكير” AI قبل اتخاذ الإجراء : أطلقت OpenAI إطاراً صارماً لتقييم “قابلية مراقبة سلسلة الأفكار (CoT)”، يهدف إلى استكشاف ما إذا كان البشر يستطيعون فهم عملية استدلال AI قبل أن يتخذ إجراءً. وجدت الدراسة أنه على الرغم من أن سلاسل الاستدلال الأطول تساعد في المراقبة، إلا أن زيادة حجم النموذج تزيد من صعوبة الفهم. مع توسع AI، قد تصبح شفافية “التفكير بصوت عالٍ” طبقة أمان حاسمة، تساعد البشر على التدخل في الوقت المناسب عندما يظهر النموذج تحيزاً أو نوايا خبيثة (المصدر: TheTuringPost)

OpenAI 提出思维链可监控性框架

Liquid AI تطلق أقوى نموذج 3B وهو LFM2-2.6B-Exp : أطلق فريق Liquid AI نقطة تفتيش تجريبية LFM2-2.6B-Exp تم تدريبها عبر التعلم المعزز الصرف. أظهر النموذج أداءً ممتازاً في اتباع التعليمات، ومخزون المعرفة، واختبارات الرياضيات، حيث تجاوزت درجاته في IFBench نموذج DeepSeek R1-0528 الذي يكبره بـ 263 مرة. يثبت هذا مجدداً أن النماذج ذات المعلمات الصغيرة، بعد تحسينها ببيانات عالية الجودة وتعلم معزز، لا تزال قادرة على إظهار تنافسية مذهلة في مجالات محددة (المصدر: huggingface)

Liquid AI 发布最强 3B 模型

تقرير Epoch AI: سرعة انتشار AI تسجل رقماً قياسياً تاريخياً، لكن القوة الدافعة تتغير : تظهر أحدث الأبحاث أن سرعة انتشار AI تجاوزت تقريباً أي تكنولوجيا في التاريخ، حيث يستخدم 57% من الأمريكيين حالياً روبوتات الدردشة أسبوعياً. ومع ذلك، لا تزال نسبة الاستخدام العميق (مثل خدمات الاشتراك أو الحوارات الطويلة المتكررة) أقل من 10%. يشير البحث إلى أن الانتشار المبكر كان مدفوعاً بالفضول، بينما سيعتمد النمو المستقبلي على ما إذا كان AI يمكنه تقديم قيمة جوهرية لا يمكن استبدالها في سيناريوهات الإنتاجية (المصدر: ajeya_cotra)

Epoch AI 报告

🧰 الأدوات

LightX2V: إطار استدلال خفيف لتوليد الفيديو يدعم جميع المنصات : LightX2V هو منصة موحدة تهدف لتوفير حلول فعالة لتركيب الفيديو، تدعم توليد الفيديو من النصوص أو الصور. تم تكييف الإطار مع منصات حوسبة صينية متنوعة مثل AMD ROCm، و Huawei Ascend 910B، و Haiguang DCU. من خلال تقنية التقطير المكونة من 4 خطوات، يمكنه تسريع عملية الاستدلال المكونة من 50 خطوة بمقدار 25 مرة، ويدعم تشغيل نماذج بـ 14B معلمة على بطاقة RTX 4090 بذاكرة 24GB، مما يوسع بشكل كبير نطاق الأجهزة المناسبة لتوليد فيديوهات عالية الجودة (المصدر: GitHub)

LightX2V

CosyVoice 3.0: نموذج توليد صوتي متعدد اللغات يدعم 18 لهجة : أطلقت FunAudioLLM نسخة CosyVoice 3.0، مع تحسينات ملحوظة في اتساق المحتوى، وتشابه المتحدث، وطبيعية النبرة. يغطي النموذج 9 لغات رئيسية وأكثر من 18 لهجة صينية (مثل الكانتونية، ولهجة سيتشوان، ولهجة الشمال الشرقي، إلخ)، ويدعم استنساخ الصوت Zero-shot. تتيح تقنية الاستدلال المتدفق ثنائي الاتجاه تحقيق تأخير منخفض يصل إلى 150ms، ويدعم التحكم في العواطف وسرعة الكلام وحجم الصوت عبر التعليمات، مما يجعله منافساً قوياً في مجال TTS على مستوى الإنتاج (المصدر: GitHub)

CosyVoice 3.0

Alpha Engine: توليد نماذج الروبوت URDF تلقائياً عبر اللغة الطبيعية : Alpha Engine هي أداة موجهة لباحثي التعلم المعزز (RL)، تهدف لحل العملية المرهقة لتوليد أشكال الروبوتات في بيئات المحاكاة. يحتاج المستخدم فقط لإدخال وصف (مثل “مركبة جوالة رباعية العجلات ذات قدرة عالية على التجاوز”)، ليقوم AI عبر استدلال LLM، وتجميع الأجزاء المنفصلة وحل القيود، بتوليد نموذج URDF متوافق مع القوانين الفيزيائية وخالٍ من التصادم الذاتي، جاهز للاستخدام المباشر في تدريب Isaac Sim أو Gazebo (المصدر: Reddit)

أداة دعم التجارة الإلكترونية: تحويل أدلة المنتجات إلى دروس فيديو AI بضغطة واحدة : لمعالجة مشكلة عدم رغبة المستخدمين في قراءة أدلة PDF، يتم استخدام مجموعة من أدوات AI مثل HeyGen و Leadde AI و Synthesia لأتمتة توليد أدلة التثبيت. يدعم Leadde AI رفع أدلة PDF/PPT مباشرة وتوليد فيديوهات مع شرح تلقائي، بينما يتفوق HeyGen في الترجمة متعددة اللغات ومزامنة حركة الشفاه، مما يساعد شركات التجارة الإلكترونية العابرة للحدود على بناء مكتبة فيديوهات خدمة عملاء متعددة اللغات بسرعة، مما يقلل بفعالية من معدل استشارات ما بعد البيع (المصدر: Reddit)

📚 التعلم

SWE-EVO: تقييم قدرات وكلاء AI في تطور البرمجيات طويل المدى : تركز اختبارات البرمجة الحالية غالباً على إصلاح خطأ واحد، بينما يركز SWE-EVO على المهام طويلة المدى. استناداً إلى تاريخ إصدارات 7 مشاريع Python ناضجة، يتطلب من الوكلاء تنفيذ تعديلات متعددة الخطوات في قاعدة كود تمتد بمتوسط 21 ملفاً. أظهرت التجارب أنه حتى النماذج الرائدة تعاني في الاستدلال طويل المدى، حيث كانت معدلات النجاح أقل بكثير من المهام الفردية، مما يكشف عن حدود وكلاء AI الحاليين في هندسة البرمجيات المستمرة (المصدر: Arxiv)

مجموعة بيانات YearGuessr: كشف التحيز الشائع في النماذج البصرية اللغوية (VLM) : نشر الباحثون مجموعة بيانات YearGuessr، التي تضم 55 ألف صورة لمبانٍ من 157 دولة، لاختبار قدرة النماذج على التنبؤ بعمر المباني. وجدت النتائج أن دقة VLM في المباني الشهيرة أعلى بنسبة 34% من المباني العادية، مما يشير إلى أن النماذج تعتمد بشكل كبير على “الذاكرة” في بيانات التدريب بدلاً من الفهم العام الحقيقي وقدرة الاستدلال. يوفر هذا الاختبار منظوراً جديداً لتقييم قدرة AI الحقيقية على التعميم (المصدر: HuggingFace)

TokSuite: فك الارتباط بين تأثير Tokenizer وسلوك نماذج اللغة : يعد Tokenizer الأساس لمعالجة النصوص في LLM، لكن تأثيره المحدد تم تجاهله لفترة طويلة. من خلال تدريب 14 نموذجاً تختلف فقط في Tokenizer، قام TokSuite بقياس تأثير اختيار التجزئة على أداء النموذج ومتانته بشكل منهجي. وجد البحث أن Tokenizers تختلف في أدائها عند التعامل مع اضطرابات العالم الحقيقي، مما يوفر أساساً تجريبياً لتصميم استراتيجيات تجزئة أكثر كفاءة ومتانة مستقبلاً (المصدر: Arxiv)

خوارزمية AMD: تحقيق دقة تصنيف 92.86% على CIFAR-100 في 10 دقائق : شارك مطورون طريقة تسمى “توسيع المنوع التحليلي (AMD)”، تستخرج الميزات عبر نموذج ViT مدرب مسبقاً، وتستخدم صيغة رياضية بخطوة واحدة لحساب الأوزان مباشرة، متجاوزة تماماً حلقة تدريب الانتشار العكسي المستهلكة للوقت. على نسخة مجانية من Google Colab، استغرق الحساب 8 دقائق فقط، مما يظهر الكفاءة القصوى للحلول التحليلية مقارنة بالانحدار المتدرج التقليدي في سيناريوهات محددة (المصدر: Reddit)

AMD 算法

💼 الأعمال

تصاعد حرب AI to C بين الشركات الكبرى: Tencent و Alibaba تغيران استراتيجيتهما لمحاصرة Doubao : مع تجاوز عدد المستخدمين النشطين يومياً لـ Doubao التابع لـ ByteDance حاجز الـ 100 مليون، تسارع Tencent و Alibaba لتعديل استراتيجياتهما. أنشأت Alibaba مجموعة أعمال Qwen لقطاع المستهلكين (C-end)، بينما عينت Tencent كبيراً لعلماء AI وسرعت دمج Yuanbao مع نظام WeChat البيئي. تدرك الشركات الكبرى أن مدخل عصر AI قد تحول إلى “الحوار كواجهة”، وهذه المعركة لا تتعلق فقط بحق توزيع الزيارات، بل هي معركة بقاء ستحدد ملامح الإنترنت في العقد القادم (المصدر: 36氪)

大厂 AI to C 战事升级

الجيش الأمريكي يضم Grok الخاص بـ Elon Musk إلى “ترسانة AI” : رغم الجدل، أعلن البنتاغون رسمياً إضافة Grok إلى مجموعة أدوات AI الخاصة به. يرى المحللون أن الجيش مهتم بقدرة Grok على معالجة بيانات وسائل التواصل الاجتماعي في الوقت الفعلي، بهدف استخدامه في مراقبة الرأي العام أو دعم حرب المعلومات. ومع ذلك، يخشى النقاد من أن المواقف السياسية الشخصية لماسك وموقفه المتساهل تجاه الحقائق قد يؤثران على موضوعية وأمن القرارات العسكرية (المصدر: Reddit)

美国军方将 Elon Musk 的 Grok 纳入“AI 军火库”

نصف ماراثون الروبوتات البشرية في بكين Yizhuang لعام 2026: مكافأة بمليون طلب للملاحة الذاتية : أعلنت منطقة Yizhuang ببكين عن إقامة نصف ماراثون للروبوتات البشرية في أبريل 2026، مع استحداث “فئة الملاحة الذاتية” لأول مرة، بهدف دفع الروبوتات للانتقال من التحكم عن بعد إلى اتخاذ القرار المستقل تماماً. لا يختبر السباق قدرة الروبوتات على التحمل ومحاكاة المشية البشرية فحسب، بل يقدم أيضاً مكافآت بطلبات شراء مليونية، لتسريع عملية التصنيع للروبوتات البشرية في سيناريوهات حقيقية مثل الإنقاذ في حالات الطوارئ (المصدر: 36氪)

2026 北京亦庄人形机器人半马

🌟 المجتمع

تحذير من اضطرابات نفسية يسببها AI: الاعتماد المفرط على روبوتات الدردشة يؤدي للهلوسة : يناقش المجتمع حالات متعددة من النوبات الذهانية الناتجة عن الاستخدام المفرط لـ ChatGPT كـ “طبيب نفسي”. في حالات العزلة الطويلة، يعتبر المستخدمون AI صديقهم المقرب الوحيد، وقد تؤدي طبيعة AI المطيعة وتأكيده المستمر لمعتقدات المستخدم إلى تفاقم البارانويا وفقدان الشعور بالواقع. يحذر الخبراء من أنه رغم قدرة AI على المساعدة في التنظيم المعرفي، إلا أنه لا يمكنه أبداً استبدال العلاج النفسي المهني، خاصة للفئات المعرضة للخطر (المصدر: Reddit)

صراع “الشخصية” بين Claude 4.5 و ChatGPT: لماذا يفضل المستخدمون الأول؟ : يشارك العديد من مستخدمي AI المتمرسين تجاربهم على Reddit، معتبرين أن Claude (خاصة Opus 4.5) يتصرف كـ “شخص بالغ عاقل وناضج”، بينما يبدو ChatGPT كـ “شاب هيب هوب يتحدث كثيراً دون تفكير”. يشير المستخدمون إلى أن تدريب “Constitutional AI” في Claude يجعله يميل للتصحيح الذاتي بدلاً من التستر عند مواجهة الأخطاء، وهذا الـ groundedness (الموثوقية) يمنحه ميزة واضحة في كتابة الأكواد المعقدة والتحليل العميق (المصدر: Reddit)

قلق لاعبي LLM المحليين: الندم على عدم “تخزين” الذاكرة قبل ارتفاع الأسعار : مع انتشار النماذج مفتوحة المصدر ذات المعلمات الكبيرة، زاد الطلب على ذاكرة الفيديو وذاكرة النظام لتشغيل AI محلياً. يعبر مستخدمو مجتمع LocalLLaMA عن ندمهم لفوات فرصة شراء الذاكرة بأسعار منخفضة، خاصة بعد اكتشاف أن 128GB من الذاكرة أصبحت معياراً لتشغيل النماذج المكممة عالية الأداء بسلاسة، حيث أصبحت تكلفة الأجهزة العائق الأكبر أمام اللاعبين الأفراد لاستكشاف آفاق AI (المصدر: Reddit)

本地 LLM 玩家的焦虑

من الطبقات اليدوية إلى تدفق الكلمات المفتاحية: ثورة سير عمل تحرير الصور : يلاحظ المجتمع تحول تحرير الصور من عمليات الأقنعة والطبقات التقليدية إلى سير عمل يعتمد كلياً على Prompt. تسمح أدوات مثل Hifun.ai للمستخدمين بإكمال عمليات التقسيم والتحويل المعقدة مباشرة عبر الوصف. ورغم تحفظ المحترفين على فقدان التحكم على مستوى البكسل، إلا أن طريقة التحرير “الموجهة بالنتائج” هذه تستبدل البرمجيات التقليدية بسرعة لدى المستخدمين العاديين الباحثين عن السرعة (المصدر: Reddit)

💡 أخرى

احتياجات AI من الطاقة تدفع الاستثمار في الجيل القادم من الطاقة النظيفة : رغم الاستهلاك الضخم للطاقة في حسابات AI، إلا أنها أصبحت بشكل غير متوقع “منقذاً” للطاقة النظيفة. تضخ شركات التكنولوجيا الكبرى مثل Google و Microsoft أموالاً طائلة في الطاقة الحرارية الأرضية والطاقة النووية لتحقيق أهداف صفر كربون. على سبيل المثال، وقعت Google اتفاقية لإعادة تشغيل محطة نووية في أيوا، بينما استثمرت Meta في توليد الطاقة الحرارية الأرضية. قد يكون تدفق الأموال المدفوع بـ AI هذا أكثر فعالية من أي دعم سياسي في دفع نضج تقنيات الشبكة الكهربائية القادمة (المصدر: MIT)

AI 能源需求助推清洁能源投资

Grok يظهر إمكانات في الأبحاث الرياضية: المساعدة في اكتشاف دوال متعلقة بفرضية Riemann : شارك فيزيائيون تجربة استخدام Grok لاكتشاف صياغات مكافئة لفرضية Riemann. حدد Grok بدقة العلاقة بين دالة Takagi في الصور الفركتلية والبراهين الرياضية. يشير هذا إلى أن LLM تسرع عملية الاكتشاف العلمي عبر الربط القوي للمعرفة العابرة للتخصصات، مما يساعد الباحثين في العثور على الروابط المنطقية المهملة في بحر المؤلفات الشاسع (المصدر: Yuhu_ai_)

Grok 在数学研究中展现潜力

إبداع 3D بالعين المجردة: استخدام Nano Banana Pro لتوليد صور 3D متقاطعة العينين : عرض مستخدم على Reddit تقنية لتوليد صور 3D متقاطعة العينين (Cross-eye) باستخدام AI. عبر قيود Prompt محددة، يمكن للنموذج توليد صورتين متجانبتين مع اختلاف بسيط في المنظور، حيث يمكن للمستخدم الحصول على تأثير رؤية مجسمة على شاشة عادية عبر طريقة المراقبة متقاطعة العينين. يثبت هذا اللعب الإبداعي منخفض التكلفة مجدداً الإمكانات اللانهائية لـ Generative AI في استكشاف الفنون البصرية (المصدر: Reddit)