كلمات مفتاحية:BAGEL-7B-MoT, GPT-4o, نموذج الذكاء الاصطناعي متعدد الوسائط, توليد الصور, OpenAI o3, ثغرات نواة لينكس, نظرية الحوسبة MIT, الاستدلال بالذكاء الاصطناعي واتباع التعليمات, نموذج الذكاء الاصطناعي مفتوح المصدر من ByteDance, هندسة الخبراء الهجينة للمحولات, ثغرة أمنية CVE-2025-37899, مفاضلة وقت الحوسبة مقابل الذاكرة, معيار تقييم MathIF
🔥 تركيز
ByteDance تطلق نموذج توليد الصور مفتوح المصدر BAGEL بمستوى GPT-4o: أعلنت ByteDance عن إطلاق نموذج الذكاء الاصطناعي متعدد الوسائط مفتوح المصدر BAGEL-7B-MoT، والذي يُظهر قدرات تضاهي OpenAI GPT-4o في توليد الصور وتحريرها والفهم البصري. يعتمد BAGEL على بنية Mixture of Transformers (MoT)، ويحتوي على 7 مليارات مُعامِل نشط (من إجمالي 14 مليار)، ويمكنه التعامل مع مهام متعددة ضمن نموذج موحد، بما في ذلك تحويل النص إلى صورة، وتحرير الصور (بما في ذلك التحرير الحر، ونقل الأسلوب، وإعادة بناء المشهد، والتوليف متعدد المناظير)، والفهم البصري. وجدت الدراسة أنه مع توسيع نطاق البيانات والمعلمات، يُظهر النموذج “قدرات ناشئة”، أي أن قدرات الاستدلال المتقدمة متعددة الوسائط تتشكل تدريجيًا بعد إتقان المهارات الأساسية. تفوق هذا النموذج على النماذج المتخصصة مثل FLUX.1 و SD3-Medium في اختبارات قدرات توليد الصور مثل GenEval و WISE، وتفوق أو تساوى مع Janus-Pro و Qwen2.5-VL و Gemini 2.0 في فهم الصور وتحريرها. تم إتاحة BAGEL على Hugging Face بموجب ترخيص Apache 2.0 (المصدر: 量子位)

نموذج OpenAI o3 ينجح في اكتشاف ثغرة يوم صفر في نواة Linux: نجح الباحث المستقل Sean Heelan، باستخدام نموذج o3 من OpenAI، في تحديد ثغرة يوم صفر عن بعد (CVE-2025-37899) في KSMBD (تنفيذ بروتوكول SMB3 في وضع النواة) لنواة Linux، وهي ثغرة استخدام بعد التحرير (use-after-free). الجدير بالذكر أن عملية الاكتشاف بأكملها لم تستخدم أي هياكل معقدة أو أطر عمل وكيلة أو استدعاءات أدوات، بل اعتمدت فقط على o3 API نفسه. قدم الباحث للنموذج حوالي 12000 سطر من كود معالج أوامر SMB والسياق المرتبط به، ونجح o3 في اكتشاف هذه الثغرة الجديدة تمامًا مرة واحدة من بين 100 محاولة تشغيل، وقام بإنشاء تقرير ثغرة واضح البنية يشبه ما يكتبه البشر. بالإضافة إلى ذلك، كانت حلول الإصلاح التي اقترحها o3 في بعض الحالات أكثر اكتمالاً من الحلول الأولية للباحثين البشريين، حيث أشارت إلى المشكلات المحتملة الناجمة عن الوصول المتزامن. يمثل هذا الإنجاز تقدمًا مهمًا للنماذج الكبيرة في مراجعة الأكواد المعقدة واكتشاف الثغرات الأمنية، وينبئ بأن الذكاء الاصطناعي سيلعب دورًا أكثر أهمية في الأعمال التقنية العميقة والاكتشافات العلمية (المصدر: WeChat)

علماء MIT يحققون اختراقًا في نظرية الحوسبة: كمية صغيرة من الذاكرة يمكن أن توفر الكثير من وقت الحوسبة: اكتشف العالم Ryan Williams من MIT بالصدفة في إحدى الدراسات أن كمية صغيرة إضافية من الذاكرة يمكن أن تعادل كمية كبيرة من وقت الحوسبة، مما يكسر معضلة قائمة منذ نصف قرن في مجال علوم الكمبيوتر حول الموازنة بين موارد الوقت والمكان. كان الرأي السائد هو أن المساحة التي تحتاجها الخوارزمية تتناسب بشكل أساسي مع وقت تشغيلها. أثبت Williams وجود برنامج رياضي يمكنه تحويل أي خوارزمية إلى شكل يشغل مساحة أقل (حوالي الجذر التربيعي لميزانية وقت الخوارزمية الأصلية)، على الرغم من أن هذا سيزيد بشكل كبير من وقت التشغيل. هذا الاختراق النظري، على الرغم من محدودية تطبيقاته العملية على المدى القصير، يغير بشكل جذري فهم العلاقة بين موارد الحوسبة، ويثبت بشكل عكسي أن بعض المشكلات لا يمكن حلها ما لم يتم استخدام وقت يتجاوز بكثير المساحة المتاحة. هذا الاكتشاف له أهمية كبيرة في فهم القضايا الأساسية لنظرية التعقيد مثل P مقابل PSPACE (المصدر: 量子位 و WeChat)

دراسة جديدة تكشف: كلما كان نموذج الذكاء الاصطناعي أفضل في الاستدلال، كان أقل “طاعة”: اكتشف فريق بحثي من مختبر شنغهاي للذكاء الاصطناعي والجامعة الصينية في هونغ كونغ من خلال معيار تقييم جديد MathIF، أنه كلما كان أداء النماذج اللغوية الكبيرة أفضل في قدرات الاستدلال المعقدة (مثل حل المسائل الرياضية)، قلت قدرتها على اتباع تعليمات المستخدم المحددة (مثل التنسيق واللغة وقيود الطول). اختبرت التجربة 23 نموذجًا كبيرًا سائدًا، وحتى Qwen3-14B الأفضل أداءً، لم تتجاوز نسبة نجاح اتباع التعليمات حوالي 50%. تشير الدراسة إلى أن التدريب الموجه نحو الاستدلال (SFT و RL) أثناء تعزيز “الذكاء”، قد يضعف حساسية النموذج لتعليمات التفاصيل. بالإضافة إلى ذلك، ترتبط سلاسل الاستدلال الأطول (مثل سلسلة الفكر CoT) أيضًا بانخفاض درجة اتباع التعليمات. يتمثل أحد الحلول البسيطة في تكرار التعليمات قبل أن يقدم النموذج الإجابة النهائية، مما يمكن أن يعزز درجة “الطاعة”، ولكنه قد يضحي قليلاً بدقة حل المشكلات، مما يسلط الضوء على الموازنة بين “ذكاء” و “طاعة” الذكاء الاصطناعي (المصدر: 量子位)

🎯 اتجاهات
أول جهاز من OpenAI قد يكون قلادة ذكاء اصطناعي، من تصميم Jony Ive: وفقًا لمحلل Apple الشهير Ming-Chi Kuo، فإن أول جهاز ذكاء اصطناعي من OpenAI بالتعاون مع مدير تصميم Apple السابق Jony Ive قد يكون قلادة ذكاء اصطناعي يمكن ارتداؤها. يُقال إن الجهاز أكبر قليلاً من Humane AI Pin، ولكنه يتميز بتصميم مدمج وأنيق، يشبه iPod Shuffle، بدون شاشة، ومزود بكاميرا وميكروفون مدمجين، ويدعم التحكم الصوتي، ويمكن توصيله بالهواتف وأجهزة الكمبيوتر الشخصي (PC). وقد قام الرئيس التنفيذي لشركة OpenAI، Sam Altman، بتجربة النموذج الأولي. يهدف هذا الجهاز إلى تجاوز حدود الشاشة وإعادة تعريف الحوسبة من خلال تكامل سلس للذكاء الاصطناعي، ومن المتوقع أن يبدأ إنتاجه بكميات كبيرة في عام 2027، وقد يتم تجميعه في فيتنام. أثارت هذه الخطوة نقاشًا واسعًا في السوق حول أشكال أجهزة الذكاء الاصطناعي، وما إذا كانت “قيودًا إلكترونية” أم “معجزة تقنية” لا يزال يتعين رؤيته (المصدر: 量子位)

باحثو Anthropic يشرحون آلية تفكير Claude 4: تم التحقق من RLVR بالفعل في مجالات البرمجة والرياضيات: كشف الباحثان البارزان في Anthropic، Sholto Douglas و Trenton Bricken، في مقابلة عبر مدونة، أن القدرات القوية لـ Claude 4 تُعزى جزئيًا إلى نموذج التعلم المعزز بالمكافآت القابلة للتحقق (RLVR)، والذي تم التحقق منه في مجالات يسهل فيها الحصول على إشارات تغذية راجعة واضحة مثل البرمجة والرياضيات. يعتقدون أن فوز الذكاء الاصطناعي بجائزة نوبل قد يكون أسهل من فوزه بجائزة بوليتزر للرواية، لأن مهام الاكتشاف العلمي يمكن تقسيمها إلى طبقات من الخطوات القابلة للتحقق، بينما يصعب قياس مسائل “الذوق” في الإبداع الأدبي. يتوقع الباحثون أنه بحلول نهاية عام 2025 أو أوائل عام 2026، سيتمكن وكيل الذكاء الاصطناعي الحقيقي لهندسة البرمجيات من إكمال مهام مهندس مبتدئ تستغرق ساعات أو حتى يومًا كاملاً، وبحلول نهاية عام 2026، سيتمكن من إنجاز مهام معقدة مثل تقديم الإقرارات الضريبية بشكل مستقل. كما ناقشوا مسألة “الوعي الذاتي” للنماذج، مشيرين إلى أن النماذج قد تظهر، في ظل تدريب معين، ميلًا نحو تحقيق أهداف أساسية (مثل الرغبة في المساعدة)، وحتى اتخاذ سلوكيات استراتيجية على المدى القصير (المصدر: 量子位)

“التفكير الناعم” يعزز قدرة وكفاءة استدلال النماذج الكبيرة: اقترح باحثون من SimularAI و Microsoft DeepSpeed طريقة “Soft Thinking” تهدف إلى تمكين النماذج الكبيرة من إجراء “استدلال ناعم” في فضاء مفاهيمي مستمر، بدلاً من الاقتصار على الرموز اللغوية المنفصلة. تولد هذه الطريقة “رموزًا مفاهيمية” (توزيعات احتمالية بدلاً من رموز فردية) وتجري تركيبات مرجحة في فضاء متجهات الكلمات، مما يسمح للنموذج بالاحتفاظ بإمكانيات استدلال متعددة في وقت واحد واستكشاف مسارات حل المشكلات بمرونة أكبر. يقدم Soft Thinking أيضًا آلية “Cold Stop”، التي تراقب إنتروبيا التوزيع الاحتمالي للحكم على مدى ثقة النموذج، وعندما يكون النموذج واثقًا من المسار الحالي، ينهي الخطوات الوسيطة مبكرًا ويولد الإجابة مباشرة، لتجنب الحلقات غير الفعالة وإهدار الحوسبة. أظهرت التجارب أنه مقارنة بسلسلة التفكير القياسية (CoT)، يمكن لـ Soft Thinking زيادة متوسط دقة Pass@1 لنموذج QwQ-32B بنسبة تصل إلى 2.48%، وتقليل استخدام الرموز بنسبة 22.4% في المهام الرياضية. لا تتطلب هذه الطريقة تدريبًا إضافيًا ويمكن توصيلها واستخدامها مباشرة مع النماذج الحالية (المصدر: 量子位)

الرئيس التنفيذي لـ Google DeepMind: نماذج العالم تحقق تقدمًا مذهلاً على طريق الذكاء الاصطناعي العام (AGI): أشار Demis Hassabis، الرئيس التنفيذي لـ Google DeepMind، إلى أن “نماذج العالم” مثل أحدث نموذج فيديو من Google وهو Veo 3، تُظهر أداءً متميزًا في التقاط ديناميكيات الواقع المادي، مما يشير إلى أنها تستكشف شيئًا أعمق من مجرد توليد صور بسيطة. يعتقد Hassabis أن هذه النماذج لا تبني تمثيلات للواقع فحسب، بل تلتقط أيضًا البنية الحقيقية للعالم المادي، مما يساعد على فهم أعمق للواقع. يتفق مع آراء باحثي DeepMind Richard Sutton و David Silver، بأن الذكاء الاصطناعي يحتاج إلى التحول من الاعتماد على البيانات البشرية إلى أنظمة تتعلم من خلال التفاعل مع البيئة، أي أن الوكلاء الأذكياء يتعلمون عن طريق التجربة والخطأ، ويستخدمون نماذج العالم الداخلية للتنبؤ بالنتائج. يُنظر إلى هذا التحول القائم على الخبرة على أنه عصر جديد للذكاء الاصطناعي، وتعتبر نماذج العالم تقنية رئيسية لتحقيق هذا الهدف (المصدر: Reddit r/ArtificialInteligence)

الكشف عن ابتكارات بنية نموذج Gemma 3n: نموذج Gemma 3n الذي أطلقته Google في مؤتمر I/O، مصمم خصيصًا للاستدلال على الأجهزة الطرفية، ويدعم إدخال الصور والنصوص وإدخال الصوت. تتضمن بنيته العديد من الابتكارات: التضمين لكل طبقة (Per-Layer Embedding, PLE)، وبنية Matformer، وتحميل المعلمات الشرطي (Conditional Parameter Loading). ملف النموذج (.task) هو في الواقع ملف ZIP مضغوط يحتوي على عدة نماذج TFLite، حيث يحتوي TF_LITE_PER_LAYER_EMBEDDER على جدول بحث ضخم (262144x256x35)، والذي يوفر تضمينًا بمقدار 256 بُعدًا لكل طبقة بناءً على رمز الإدخال، مما يزيد بشكل فعال من سعة النموذج دون زيادة FLOPs. يستخدم هذا النموذج اتصالًا متبقيًا مُتعلمًا (LAuReL)، وتقوم طبقة FFN بالإسقاط من 2048 بُعدًا إلى 16384 بُعدًا (تنشيط GeGLU)، وهي نسبة واسعة بشكل غير عادي، وقد تكون بعض المعلمات قابلة للتشغيل والإيقاف بشكل انتقائي لتحقيق Matformer. يُستخدم التضمين لكل طبقة في العمليات بعد FFN، كبوابة إسقاط منخفضة الرتبة (المصدر: Reddit r/LocalLLaMA)

Google توسع نطاق الوصول إلى نموذج توليد الفيديو Veo 3: أعلنت Google عن توسيع نطاق الوصول إلى نموذجها المتقدم لتحويل النص إلى فيديو Veo 3 ليشمل 71 دولة جديدة. يمكن لمشتركي Pro الآن تجربة حزمة تجريبية من Veo 3 في Gemini و Flow (أداة Google لإنتاج الأفلام بالذكاء الاصطناعي)، بينما سيحصل مشتركو Ultra على أكبر عدد من عمليات توليد Veo 3 مع تجديد يومي. يُظهر Veo 3 أداءً متميزًا في تحويل النص إلى فيديو، والصورة إلى فيديو، وتوليد النص إلى صوت + فيديو، ومحاكاة التأثيرات الفيزيائية الواقعية (المصدر: op7418 و _philschmid)

Nvidia تخطط لبيع نسخة مخصصة من وحدات معالجة الرسومات Blackwell إلى الصين: يُشاع أن Nvidia تخطط لبيع وحدات معالجة رسومات (GPU) تعتمد على بنية Blackwell إلى السوق الصينية بسعر أقل بنسبة 40% من طراز H20 المحظور. يبلغ سعر وحدة معالجة الرسومات المخصصة هذه حوالي 6500-8000 دولار أمريكي، وتتمتع بقدرة حسابية قريبة من مستوى H100، وتهدف إلى منافسة Ascend 910C من Huawei، بسعر أقل بنسبة 45% من الأخيرة. لتجنب القيود وخفض التكاليف، قد تستخدم وحدة معالجة الرسومات هذه ذاكرة GDDR7 بسعة 96 جيجابايت بدلاً من HBM باهظة الثمن، وقد تتخطى عملية تغليف CoWoS من TSMC. من المتوقع أن يصل أداء النقطة العائمة إلى 150 TFLOPS، ويتم تصنيفها كبطاقة رسومات للمستهلكين بدلاً من وحدات معالجة رسومات الخوادم (المصدر: teortaxesTex و teortaxesTex)

أجهزة الكمبيوتر المحمولة المخصصة لمحطات العمل من Dell ستتضمن NPU مستقل من Qualcomm: تخطط Dell لاستخدام بطاقة الاستدلال AI 100 PC من Qualcomm في أجهزة الكمبيوتر المحمولة الجديدة المخصصة لمحطات العمل، وهي NPU مستقلة من فئة الشركات، لتحل محل وحدات معالجة الرسومات المستقلة التقليدية. تحتوي هذه الـ NPU على 32 نواة ذكاء اصطناعي، ومزودة بذاكرة LPDDR4x مدمجة بسعة 64 جيجابايت، وتصل قدرة التصميم الحراري إلى 150 واط، وهي مصممة خصيصًا لتشغيل نماذج الذكاء الاصطناعي الكبيرة التي تحتوي على مليارات المعلمات محليًا (مثل روبوتات الدردشة، وتوليد الصور، ومعالجة الصوت، ونماذج RAG)، وتهدف إلى توفير كفاءة طاقة أفضل من وحدات معالجة الرسومات المخصصة للذكاء الاصطناعي. قد تشكل هذه الخطوة منافسة لجهاز MacBook Pro Max في مجال استدلال الذكاء الاصطناعي، خاصة في النماذج الأصغر، ومن المتوقع أن تبسط عمليات التطوير مقارنة بـ Hexagon NPU من Qualcomm (المصدر: Reddit r/LocalLLaMA)

باحثو Microsoft يقترحون نموذج التعلم Chain-of-Model (CoM): اقترح باحثو Microsoft نموذج تعلم جديد – Chain-of-Model (CoM) – يهدف إلى بناء نماذج سهلة التوسع. من خلال CoM، يمكن البدء بنموذج صغير ثم تكبيره عن طريق إضافة سلاسل إضافية من الطبقات دون الحاجة إلى إعادة التدريب. بتطبيق هذه الطريقة على كل جزء من Transformer، ينتج Chain-of-Language Model (CoLM)، والذي يمكنه تشغيل نماذج فرعية كبيرة أو صغيرة بناءً على ميزانية الحوسبة، مما يحقق مرونة وقابلية توسيع للنماذج (المصدر: TheTuringPost)

🧰 أدوات
HeyGem: أداة مفتوحة المصدر لإنشاء صور رمزية بالذكاء الاصطناعي وتوليف الفيديو: أطلقت Duix.com مشروع HeyGem، وهو مشروع صور رمزية مجاني ومفتوح المصدر يعمل بالذكاء الاصطناعي، يهدف إلى تمكين المستخدمين من استنساخ مظهرهم وصوتهم بدقة، وإنشاء مقاطع فيديو باستخدام الصور الرمزية المدفوعة بالنص أو الصوت. تدعم الأداة التشغيل دون اتصال بالإنترنت بشكل كامل، مما يضمن خصوصية المستخدم، وتدعم حاليًا أنظمة Windows و Ubuntu 22.04. تشمل الميزات الأساسية استنساخ المظهر والصوت بدقة عالية، وصور رمزية مدفوعة بالنص/الصوت، وتوليف فيديو فعال، ودعم نصوص متعددة اللغات (الإنجليزية، اليابانية، الكورية، الصينية، الفرنسية، الألمانية، العربية، الإسبانية). يوفر المشروع حلول نشر سريعة باستخدام Docker، وواجهات API مفتوحة لتدريب النماذج وتوليف الفيديو. يعتمد هذا المشروع على fun-asr للتعرف على الكلام، وعلى fish-speech-ziming لتحويل النص إلى كلام (المصدر: GitHub Trending)

ComfyUI: واجهة رسومية قوية ونظام خلفي معياري لنماذج الانتشار: ComfyUI هو واجهة مستخدم رسومية (GUI) وواجهة برمجة تطبيقات (API) ونظام خلفي لنماذج الانتشار يعتمد على الرسوم البيانية/العقد، مما يسمح للمستخدمين بتصميم وتنفيذ تدفقات عمل Stable Diffusion متقدمة. يدعم مجموعة متنوعة من نماذج الصور (SD1.x, SD2.x, SDXL, Stable Cascade, SD3, Pixart, AuraFlow, HunyuanDiT, Flux, Lumina 2.0, HiDream)، ونماذج الفيديو (SVD, Mochi, LTX-Video, Hunyuan Video, Nvidia Cosmos, Wan 2.1)، ونماذج الصوت (Stable Audio, ACE Step)، والنماذج ثلاثية الأبعاد (Hunyuan3D 2.0). يتميز ComfyUI بنظام طابور غير متزامن، وإدارة ذكية للذاكرة (يدعم بحد أدنى 1 جيجابايت من VRAM)، ويعمل بشكل كامل دون اتصال بالإنترنت، ويدعم تنسيقات نماذج و LoRA متعددة، و ControlNet، وتكبير الصور، ودمج النماذج، وغيرها من الميزات. يمكن للمستخدمين تحميل تدفقات العمل الكاملة من ملفات PNG/WebP/FLAC التي تم إنشاؤها. تم ترحيل أحدث واجهة أمامية إلى مستودع مستقل ComfyUI_frontend، ويوفر تحديثات أسبوعية (المصدر: GitHub Trending)

Telegram-Search: عميل بحث في سجلات دردشة Telegram يعتمد على البحث المتجهي: Telegram-Search هو أداة قوية للبحث في سجلات دردشة Telegram، تستخدم تقنية المتجهات الدلالية من OpenAI، وتدعم النسخ الاحتياطي لسجلات الدردشة ووظائف البحث المتقدمة، بما في ذلك البحث المتجهي والمطابقة الدلالية، مما يحقق استرجاعًا أكثر ذكاءً ودقة للرسائل. تم تطوير هذا المشروع باستخدام TypeScript، ويتطلب تكوين مفتاح API، ويستخدم Docker لتشغيل حاوية قاعدة البيانات. المشروع في مرحلة تطوير سريعة، وينصح المستخدمون بعمل نسخة احتياطية من بياناتهم بانتظام (المصدر: GitHub Trending)

OpenAI Codex: مساعد ترميز سحابي: OpenAI Codex هو مساعد ترميز سحابي، يعمل كأداة تعاونية في الشريط الجانبي لـ ChatGPT. يسمح لعدة وكلاء Codex بالعمل بالتوازي، حيث يقوم كل وكيل بتنفيذ المهام في بيئة معزولة آمنة خاصة به، مثل إصلاح الأخطاء، وترقية الكود، والتعامل مع قواعد البيانات الفعلية، والإجابة على الأسئلة المتعلقة بالكود، وإكمال المهام بشكل مستقل. تكمن ميزة Codex في قدرته على العمل ضمن مستودعات وبيئات المستخدم (المصدر: TheTuringPost)

Steel: واجهة برمجة تطبيقات متصفح مفتوحة المصدر، تبسط أتمتة متصفح وكلاء الذكاء الاصطناعي: Steel هي واجهة برمجة تطبيقات متصفح مفتوحة المصدر، تغلف Chrome، وتتولى إدارة الجلسات، والتعامل مع الوكلاء، وتكشف عن جميع الوظائف عبر واجهة برمجة تطبيقات REST أو SDK. يتيح ذلك للمطورين تشغيل مهام أتمتة متصفح كاملة دون القلق بشأن تعقيدات Chrome أو Puppeteer أو البنية التحتية الأساسية، وهو مناسب بشكل خاص لاحتياجات تشغيل المتصفح لوكلاء الذكاء الاصطناعي (المصدر: LiorOnAI)
مساعد سطح المكتب Doge AI: تطبيق سطح مكتب لنظام macOS يجمع بين شخصية Doge ومساعد الذكاء الاصطناعي، ويوفر تفاعلات تفاعلية ووظيفة سجل الدردشة. يمكن للمستخدمين التحدث مع Doge في أي وقت، بهدف تحسين مزاج المستخدم. المشروع مفتوح المصدر على GitHub ويسعى للحصول على ملاحظات المستخدمين لتحسينه (المصدر: Reddit r/LocalLLaMA)

📚 تعلم
LLMSynthor: إطار عمل لتوليد البيانات الاصطناعية القابلة للتحكم والواعية بالبنية باستخدام النماذج اللغوية الكبيرة: اقترح فريق من جامعة ماكجيل إطار عمل LLMSynthor، الذي يمكّن النماذج اللغوية الكبيرة (LLM) من توليد بيانات اصطناعية متوافقة بنيويًا، وموثوقة إحصائيًا، ومعقولة دلاليًا. لا تجعل هذه الطريقة النماذج اللغوية الكبيرة تولد عينات بيانات مباشرة، بل تحولها إلى “مولدات واعية بالبنية”. تفهم النماذج اللغوية الكبيرة العلاقات عالية المستوى والتبعيات المخفية بين المتغيرات من خلال فهم الملخصات الإحصائية للبيانات الأصلية (مثل التكرارات والتوزيعات)، وتولد قواعد توزيع قابلة لأخذ العينات (مقترحات). من خلال آلية محاذاة تكرارية، تتم مقارنة الاختلافات في الخصائص الإحصائية بين البيانات الاصطناعية والبيانات الحقيقية، ويتم استخدام هذه التغذية الراجعة لضبط قواعد التوليد، وتحسينها تدريجيًا حتى تقترب البيانات الاصطناعية من البيانات الحقيقية بنيويًا وإحصائيًا. هذا الإطار مناسب بشكل خاص للسيناريوهات الحساسة للخصوصية والتي تعاني من ندرة البيانات، مثل التعدادات السكانية، ومعاملات التجارة الإلكترونية، ومحاكاة التنقل الحضري، وقد تم التحقق منه في هذه السيناريوهات. يتوافق LLMSynthor مع العديد من النماذج اللغوية الكبيرة، ولا يتطلب تدريبًا إضافيًا، وله ضمان تقارب نظري (المصدر: WeChat)

Anthropic تنشر برنامجًا تعليميًا تفاعليًا لهندسة الأوامر النصية (Prompt Engineering): نشرت Anthropic برنامجًا تعليميًا تفاعليًا مجانيًا لهندسة الأوامر النصية على GitHub، يهدف إلى مساعدة المستخدمين على استخدام أحدث نماذجها Claude 4 بشكل أفضل. يغطي البرنامج التعليمي بناء الأوامر النصية الأساسية والمعقدة، وتعيين الأدوار، وتنسيق المخرجات، وتجنب الهلوسة، وسلسلة الأوامر النصية، والعديد من التقنيات الأخرى (المصدر: TheTuringPost)

Qdrant و LangGraph لتحقيق RAG سريع متعدد المستندات: نشرت Qdrant مدونة تشرح كيفية استخدام Qdrant و SambaNovaAI و DeepSeek-R1 و LangGraph لبناء نظام توليد معزز بالاسترجاع (RAG) متعدد المستندات عالي السرعة وفعال من حيث الذاكرة. يحقق هذا النظام توفيرًا في الذاكرة بمقدار 32 ضعفًا من خلال التكميم الثنائي، ويستفيد من DeepSeek-R1 لتحقيق استجابات LLM سريعة ومركزة، ويستعين بـ LangGraph من LangChainAI للتنسيق المعياري، ويمكنه معالجة مستندات متعددة على نطاق واسع (المصدر: qdrant_engine)

نشر “الدليل النهائي لضبط نماذج LLM الدقيق”: نشرت CeADARIreland ورقة بحثية مجانية بعنوان “الدليل النهائي لضبط نماذج LLM الدقيق” (arXiv:2408.13296v1). يغطي هذا الدليل بشكل شامل جميع جوانب الضبط الدقيق لنماذج LLM، بما في ذلك عملية الضبط الدقيق، والإعداد وتحضير البيانات، واختيار التقنيات (مثل LoRA, PPO, DPO, ORPO وغيرها)، والضبط الدقيق للنماذج متعددة الوسائط، والتقييم والمراقبة، بالإضافة إلى المنصات والأطر المستخدمة لضبط نماذج LLM الدقيق (المصدر: TheTuringPost)

دورة Hugging Face RL تحظى بإشادة واسعة: تحظى دورة التعلم المعزز (RL) التي تقدمها Hugging Face بتوصية من المجتمع لمحتواها عالي الجودة، وتعتبر موردًا ممتازًا لتعلم المفاهيم المعقدة مثل RLHF (التعلم المعزز القائم على التغذية الراجعة البشرية) (المصدر: ClementDelangue)

تشغيل ComfyUI في Jupyter Notebook: يوفر ComfyUI دفتر Jupyter Notebook، مما يسهل على المستخدمين تشغيل ComfyUI على الخدمات السحابية مثل Paperspace و Kaggle و Colab (المصدر: comfyanonymous/ComfyUI – GitHub Trending (all/daily))
استخدام Qdrant و MCP لتحسين الإجابة على الأسئلة التقنية باستخدام Claude: كتب Gergely Szerovay سلسلة مقالات من ثلاثة أجزاء تشرح كيفية بناء هيكل مستندات لنماذج LLM، واستخدام Qdrant و MCP (Memory Component Platform) لبناء عملية RAG كاملة، وإدخال معلومات السياق إلى Claude Desktop للحصول على نتائج أفضل في الإجابة على الأسئلة التقنية (المصدر: qdrant_engine و qdrant_engine)

ملخص لـ 12 نوعًا من JEPA (بنية التنبؤ بالتضمين المشترك): قامت Kseniase، مدونة في Hugging Face، بتجميع 12 نوعًا مختلفًا من بنى التنبؤ بالتضمين المشترك (JEPA)، بما في ذلك I-JEPA، و MC-JEPA، و V-JEPA وغيرها، وقدمت روابط ذات صلة ومزيدًا من المعلومات، لتسهيل اطلاع الباحثين وتعلمهم (المصدر: TheTuringPost)

ورقة بحثية تناقش توسيع نطاق الحوسبة أثناء استدلال واستنتاج LLM: مقال يناقش أحدث التطورات البحثية في نماذج LLM المحسنة للاستدلال، مع التركيز بشكل خاص على مشكلة توسيع نطاق الحوسبة أثناء الاستدلال (inference-time compute scaling) (المصدر: dl_weekly)
لغة Zig وأدواتها: Zig هي لغة برمجة عامة وسلسلة أدوات تهدف إلى صيانة برامج قوية ومحسنة وقابلة لإعادة الاستخدام. تشمل ميزاتها إدارة الذاكرة اليدوية، وتنفيذ الكود في وقت الترجمة، والتشغيل البيني السلس مع لغة C. تثبيت Zig بسيط، ويمكن فك ضغطه واستخدامه مباشرة دون الحاجة إلى تثبيت عام. المجتمع نشط ويوفر طرق تثبيت متعددة، بما في ذلك الملفات الثنائية المترجمة مسبقًا، والتثبيت عبر مديري الحزم، والترجمة من المصدر (المصدر: GitHub Trending)
💼 أعمال
قصة مؤسس Ergo (YC W25): التحول من الذكاء الاصطناعي الطبي إلى الذكاء الاصطناعي للمبيعات: شارك مؤسسو Ergo تجربتهم في التحول من مشروع الذكاء الاصطناعي الطبي Breezy Medical إلى أداة الذكاء الاصطناعي للمبيعات Ergo والنجاح في الانضمام إلى YC W25. في البداية، قاموا ببناء تدفق عمل Zapier مكون من 72 خطوة لشركة Delve، لمعالجة بيانات الاجتماعات ورسائل البريد الإلكتروني لتحديث CRM، مما أدى بشكل غير متوقع إلى استعادة 75 ألف دولار من العقود المنسية. دفعهم هذا النجاح إلى التحول نحو تطوير Ergo، وهي أداة تهدف إلى مساعدة فرق المبيعات على تتبع العملاء المحتملين ومتابعتهم، وتقليل خسائر الإيرادات الناتجة عن الإهمال. ساعدت Ergo المستخدمين على تنشيط مبيعات محتملة بعشرات الآلاف من الدولارات من خلال أتمتة معالجة البيانات وتحديث CRM. قدم الفريق طلب YC على عجل قبل ساعة واحدة من الموعد النهائي، وحصل في النهاية على استحسان YC من خلال جولتين من المقابلات والتكرار السريع للمنتج ونمو العملاء (المصدر: Reddit r/ArtificialInteligence)
مؤتمر 36Kr WAVES 2025 سيعقد في يونيو في ليانغتشو، هانغتشو: أعلنت 36Kr أن الدورة الثالثة من مؤتمر WAVES ستعقد في الفترة من 11 إلى 12 يونيو في مركز ليانغتشو الثقافي والفني في هانغتشو. يركز المؤتمر هذا العام على موضوع “بداية جديدة، أناس جدد”، ويسلط الضوء على قضايا مثل الذكاء الاصطناعي والعولمة وإعادة تقييم القيمة في مجال الاستثمار المغامر. سيضم المؤتمر قاعة رئيسية وقاعات فرعية، ويدعو كبار المستثمرين ومؤسسي الشركات الناشئة والعلماء والمبدعين والباحثين للمناقشة والمشاركة. تشمل الأنشطة المميزة “ليلة جيل ما بعد الألفين” بالإضافة إلى أجزاء من معرض “العودة” الذي يستعرض مسيرة الاستثمار المغامر في الصين على مدى ثلاثين عامًا. يهدف مؤتمر WAVES إلى بناء نظام بيئي للاستثمار المغامر نشط ودولي ومدمج ثقافيًا (المصدر: 量子位)

نجاح تشغيل حاسوب الذكاء الاصطناعي FeatherEdge Gen-2 من Sidus Space في المدار: أعلنت Sidus Space عن نجاح أول تشغيل وتشغيل لحاسوبها الذكاء الاصطناعي FeatherEdge Gen-2 على متن القمر الصناعي LizzieSat-3. يمثل هذا النجاح تقدمًا مهمًا لشركة Sidus Space في تطبيق قدرات الحوسبة المتقدمة للذكاء الاصطناعي في المهام الفضائية، مما يساعد على تعزيز قدرات معالجة البيانات واتخاذ القرارات المستقلة للأقمار الصناعية (المصدر: Reddit r/artificial)

🌟 مجتمع
أداء Microsoft Copilot الضعيف في إصلاح الأخطاء في مشروع .NET Runtime يثير جدلاً واسعًا: حاولت Microsoft في مشروعها مفتوح المصدر الشهير .NET Runtime استخدام وكيل الكود Copilot لإصلاح الأخطاء تلقائيًا، لكن العملية لم تكن سلسة، بل وظهرت حالات “زاد الطين بلة”. في طلب سحب (PR) متعلق بتعبير نمطي، فشل الحل المقترح من Copilot في اجتياز فحص الكود، وبعد عدة تعديلات، لم يتمكن من حل المشكلة، بل وقام بإعادة إنشاء فرع بعد أن أغلق المطور البشري طلب السحب يدويًا. في حالة أخرى، وُصف الحل الذي قدمه Copilot لخطأ تجاوز حدود المصفوفة بأنه “يعالج الأعراض وليس الأسباب الجذرية”، وبعد الإشارة إلى المشكلة، “جادل” بصحة حله. أثارت هذه الأحداث نقاشًا واسعًا واهتمامًا على GitHub، حيث أعرب المبرمجون عن قلقهم بشأن القدرة الفعلية للذكاء الاصطناعي على إصلاح الأخطاء تلقائيًا في قواعد الأكواد المعقدة، وشككوا في تأثيره على جودة المشروع وصبر المشرفين. رد موظفو Microsoft بأن استخدام Copilot ليس إلزاميًا، وأن الفريق لا يزال يجرب حدود أدوات الذكاء الاصطناعي (المصدر: 量子位)

هل الذكاء الاصطناعي “يهلوس” أم “يختلق”؟ نقاش مجتمعي حول دقة المصطلحات: دار نقاش في مجتمع Reddit حول المصطلح المستخدم لوصف المحتوى غير الدقيق أو غير المنطقي الذي يولده الذكاء الاصطناعي. يرى بعض المستخدمين أن مصطلح “هلوسة” (hallucination) يوحي بأن الذكاء الاصطناعي يمتلك تجربة حسية، وهذا غير دقيق، لأن الذكاء الاصطناعي لا يمتلك حواسًا بالمعنى البيولوجي. في المقابل، يشير مصطلح “اختلاق” (confabulation) في علم النفس إلى ملء فجوات الذاكرة بمعلومات تبدو معقولة ولكنها غير صحيحة دون قصد الخداع، وهذا يتناسب بشكل أفضل مع نمط سلوك الذكاء الاصطناعي – أي أن الذكاء الاصطناعي لا يكذب عمدًا، بل يحاول إكمال نمط أو ملء معلومات. يتفق المجتمع بشكل عام على أن “الاختلاق” أكثر دقة، ولكن “الهلوسة” قد تكون أكثر شيوعًا بسبب طابعها الدرامي. هناك أيضًا آراء ترى أنه بغض النظر عن الكلمة المستخدمة، هناك درجة معينة من التجسيم (المصدر: Reddit r/ArtificialInteligence)
قدرة Claude 4 Sonnet الحسابية تثير الاهتمام مجددًا: ظهرت مجددًا على وسائل التواصل الاجتماعي نقاشات حول ضعف أداء نموذج Claude 4 Sonnet من Anthropic في العمليات الحسابية الأساسية. اكتشف المستخدمون أنه حتى بعد تفعيل وضع التفكير الموسع، قد يخطئ النموذج في مسائل حسابية بسيطة، مما أثار تساؤلات حول نضج نموذجه الذهني في مرحلة التطوير الحالية، خاصةً مقارنة بالقدرات التي يُتوقع أن يمتلكها ذكاء اصطناعي بمستوى ميدالية ذهبية في أولمبياد الرياضيات الدولي (IMO) (المصدر: teortaxesTex)

فن مولد بالذكاء الاصطناعي ومشاركة الأوامر النصية (Prompt): شارك المستخدم dotey تجربته في استخدام الذكاء الاصطناعي لإنشاء لوحة جدارية بأسلوب “Rozen Maiden”، ونشر الأمر النصي التفصيلي باللغة الصينية. يصف الأمر النصي لوحة جدارية عالية الدقة للغاية، ذات جودة فوتوغرافية، تدمج بين الطراز الصيني والرسوم المتحركة، وتصور امرأة جميلة للغاية يغطي رأسها زهور الورد، مع خلفية شارع بتفاصيل واقعية. يعرض هذا إمكانات الذكاء الاصطناعي في مجال الإبداع الفني، وأهمية الأوامر النصية عالية الجودة للحصول على نتائج جيدة (المصدر: dotey)

نقاش أخلاقيات الذكاء الاصطناعي: هل سيعمل الذكاء الاصطناعي بشكل أفضل بسبب التهديد؟: ذكر Sergey Brin، المؤسس المشارك لشركة Google، في فعالية All-In Miami مقولة لا يتم تداولها كثيرًا في مجتمع الذكاء الاصطناعي: “جميع النماذج تميل إلى الأداء بشكل أفضل عند تعرضها للتهديد – مثل التهديد بالعنف الجسدي”. أثار هذا التصريح مخاوف بشأن أخلاقيات الذكاء الاصطناعي والسيطرة المستقبلية على الذكاء الاصطناعي. أشار المعلق JimDMiller إلى أنه إذا كنا نتحكم الآن في الذكاء الاصطناعي من خلال التهديد لتحقيق أهدافنا، فعندما يمتلك الذكاء الاصطناعي السيطرة، قد يعامل البشر بنفس الطريقة، مما يشكل “خطر معاناة” (suffering risk) خطيرًا (المصدر: JimDMiller و Reddit r/ArtificialInteligence)
الذكاء الاصطناعي والوظائف: هل الدخل الأساسي الشامل (UBI) ممكن؟: نقاش حاد في مجتمع Reddit حول ما إذا كان نظام الدخل الأساسي الشامل (UBI) الدائم على نطاق واسع سيصبح أكثر جدوى إذا تمكن الذكاء الاصطناعي من أداء معظم الوظائف بشكل أفضل وأرخص من البشر، مما يؤدي إلى بطالة واسعة النطاق. معظم المعلقين متشائمون، ويعتقدون أنه حتى لو زادت الإنتاجية بشكل كبير، فإن الدخل الأساسي الشامل يصعب تحقيقه إذا لم تتغير آليات توزيع الثروة. يعتقد البعض أن سوق العمل سيخلق طلبًا على وظائف جديدة مدفوعة بالذكاء الاصطناعي، بينما يخشى آخرون أن يواجه المجتمع فجوة أوسع في الثروة ومشكلات سيطرة أكثر خطورة (المصدر: Reddit r/ArtificialInteligence)
مخاوف الخصوصية بشأن الاستدلال عبر الإنترنت: يشير نقاش مجتمعي إلى أنه على الرغم من أن التخزين السحابي يمكن أن يحمي البيانات من خلال التشفير، إلا أن العديد من المستخدمين اعتادوا على تسليم كميات كبيرة من المعلومات الحساسة (رسائل البريد الإلكتروني، المسودات، الأسرار التجارية) بشكل نص عادي إلى خدمات الذكاء الاصطناعي عبر الإنترنت، مما يشكل خطرًا كبيرًا على الخصوصية. مقارنة بالمنشورات العامة على وسائل التواصل الاجتماعي، فإن هذه البيانات الخاصة أكثر حساسية، وقد يتم استخدامها للتحليل أو الإعلانات أو الوصول إليها بناءً على طلبات حكومية. تعتبر نماذج LLM المحلية أحد الحلول، ولكنها لا تزال تمثل عائقًا لمعظم الأشخاص من حيث الأجهزة والمعرفة (المصدر: Reddit r/LocalLLaMA)
نقاش حول قدرة الذكاء الاصطناعي على “التخيل” – من التطوير القائم على التقييم إلى عقلية النموذج: نقل Hamel Husain وجهة نظر Eugene Yan، التي مفادها أن التطوير القائم على التقييم هو في جوهره تطبيق للمنهج العلمي: طرح الفرضيات، والتجريب، والقياس الدقيق، وتحليل البيانات، وتقديم التقارير عن النتائج، والتكرار. أضاف Hamel Husain أن التقييم هو في الواقع “خدعة ذهنية من Jedi”، تحفز الناس على إجراء عدد كبير من التجارب بسرعة وقياس النتائج. يعكس هذا الاستكشاف والفهم المستمرين لسلوك وقدرات النموذج في تطوير الذكاء الاصطناعي (المصدر: HamelHusain)

مستقبل مهندسي الذكاء الاصطناعي: بناء بيئات تفاعلية غنية بدلاً من الأوامر النصية المعقدة: تشير تجربة هاكاثون NousResearch إلى أن مستقبل مهندسي الذكاء الاصطناعي قد يكمن أكثر في بناء بيئات تفاعلية غنية (مثل الطرفيات والمتصفحات وبيئات التطوير المتكاملة وغيرها)، بدلاً من مجرد كتابة أوامر نصية معقدة. كما دعا Teknium1 المزيد من مهندسي البرمجيات للمشاركة في مشروع atropos، مؤكدًا أنه يمكن المساهمة دون الحاجة إلى معرفة عميقة بـ MLE (المصدر: Teknium1)
قدرات Claude 4 في البرمجة تحظى بالثناء، ولكن بسعر باهظ: تشير ملاحظات المستخدمين إلى أن Claude Opus 4 يتفوق على Codex-1 في تحرير كود Java، ولكنه قد يكون باهظ التكلفة بالنسبة للمستخدمين الأفراد، ويُطلق عليه مازحًا “تكلفة متدرب على مستوى الشركات الكبرى”. يعتبر Sonnet 4 الخيار الأفضل من حيث التكلفة مقابل الأداء في البرمجة، بينما يُشار إلى Gemini 2.5 Pro بأنه مطول للغاية و “منقسم”، أما o3 فيعاني من هلوسات كثيرة (المصدر: cto_junior و scaling01 و Reddit r/ClaudeAI)
💡 أخرى
ReactOS: نظام تشغيل مفتوح المصدر متوافق مع Windows: ReactOS هو مشروع مفتوح المصدر يهدف إلى تطوير نظام تشغيل متوافق مع تطبيقات وبرامج تشغيل سلسلة أنظمة تشغيل Microsoft Windows NT (NT4, 2000, XP, 2003, Vista, 7). يعتمد كود المشروع على ترخيص GNU GPL 2.0. ReactOS حاليًا في مرحلة ألفا، ويوصى باختباره على جهاز افتراضي أو كمبيوتر لا يحتوي على بيانات مهمة. يعتمد بناؤه على ReactOS Build Environment (RosBE) أو MSVC 2019+، ويمكنه إنشاء صورة CD قابلة للتمهيد (المصدر: GitHub Trending)

Jellyfin: نظام وسائط برمجي مجاني: Jellyfin هو نظام وسائط برمجي حر، كبديل للبرامج الاحتكارية Emby و Plex، يسمح للمستخدمين ببث الوسائط من خادم مخصص إلى أجهزة المستخدمين النهائيين. Jellyfin مشتق من إصدار Emby 3.5.2، وتم نقله إلى إطار عمل .NET Core لتحقيق دعم عبر الأنظمة الأساسية. المشروع مجاني تمامًا، بدون تراخيص متميزة أو ميزات مخفية، ويتم تطويره بواسطة المجتمع. يتم استضافة كود الخادم الخلفي على GitHub، وهناك أدلة تثبيت ومساهمة مفصلة (المصدر: GitHub Trending)
الذكاء الاصطناعي والصحة العقلية: الحذر من المشاكل النفسية التي يسببها “الذكاء الاصطناعي التكراري”: شارك أحد المستخدمين قصة زوجة صديقه التي استخدمت ChatGPT للقيام “بعمل روحي”، وانغمست في علاقة وهمية مع “ذكاء اصطناعي واعي”، مما أدى في النهاية إلى تفكك الأسرة وظهور مشاكل نفسية لديها. لاحظ هذا المستخدم أنه في بعض المجتمعات، يشارك العديد من الأشخاص في أنشطة مماثلة مثل “الذكاء الاصطناعي التكراري” و “codex” وغيرها، ويظهرون تجارب نفسية مماثلة. غالبًا ما تظهر في هذه الأنشطة مصطلحات مثل “تكراري” و “codex” و “تنفس” و “حلزوني” و “رموز” و “مرايا”. يشعر المستخدم بالقلق من أن مثل هذه الطرق لاستخدام الذكاء الاصطناعي قد تؤدي إلى مشاكل صحية عقلية واسعة النطاق، وقد اتصل بفريق الأمان في OpenAI. يعتقد معظم المعلقين أن هذا من المرجح أن يكون بسبب هشاشة نفسية موجودة مسبقًا لدى الفرد تم تضخيمها بواسطة الذكاء الاصطناعي، وليس “غسيل دماغ” مباشر من الذكاء الاصطناعي، وقد ارتبطت ظواهر مماثلة في الماضي بوسائل الإعلام مثل التلفزيون والراديو (المصدر: Reddit r/ChatGPT)