نشرة الذكاء الاصطناعي - 2025-12-19(الإصدار الصباحي)

🔥 تركيز

Meta تُطلق نموذج SAM 3: أعلنت Facebook Research عن إطلاق SAM 3، وهو نموذج أساسي موحد لتجزئة الصور والفيديو قابل للتوجيه. يقوم النموذج باكتشاف الكائنات وتجزئتها وتتبعها عبر موجهات نصية أو بصرية، ويقدم قدرة تجزئة المثيلات لمفاهيم المفردات المفتوحة، ويحقق أداءً يتراوح بين 75-80% من الأداء البشري على معيار SA-CO. يعتمد النموذج على محرك بيانات مبتكر قام بتصنيف أكثر من 4 ملايين مفهوم فريد تلقائيًا، ويستخدم تصميمًا معماريًا جديدًا يتضمن رموز الوجود (existence tokens) وكاشف-متتبع مفصول (decoupled detector-tracker) لتعزيز القدرة التمييزية والكفاءة. (المصدر: GitHub Trending)

جوجل تُطلق نموذج Gemini 3 Flash: أطلقت جوجل أسرع نموذج AI حتى الآن، Gemini 3 Flash، المصمم خصيصًا للسرعة مع الحفاظ على الذكاء المتطور. يُظهر النموذج أداءً متميزًا في معايير الاستدلال والمعرفة على مستوى الدكتوراه مثل GPQA Diamond وHumanity’s Last Exam، بل ويتفوق على Gemini 3 Pro في معيار SWE-bench Verified للبرمجة. يوفر Gemini 3 Flash سرعة أكبر بثلاث مرات من Gemini 2.5 Pro بتكلفة أقل (0.50 دولار لكل مليون رمز إدخال، و3 دولارات للإخراج)، وقد تم إطلاقه عالميًا كنموذج AI الافتراضي لـ Google Search، بهدف تعزيز انتشار AI في تطبيقات المؤسسات وبيئة المطورين. (المصدر: WeChat)

🎯 التوجهات

نماذج توليد الفيديو بالذكاء الاصطناعي تستمر في التطور: تم إطلاق نماذج مثل Alibaba Wanxiang 2.6، ByteDance Seedance 1.5 Pro، وKling 2.6 تباعًا. يحقق Wanxiang 2.6 تخصيصًا متسقًا للشخصيات صوتًا وصورة وتحكمًا في اللقطات المتعددة، مع توليد يصل إلى 15 ثانية في المرة الواحدة؛ يركز Seedance 1.5 Pro على التزامن عالي الدقة بين الصوت والصورة ودعم اللهجات المتعددة؛ بينما يعزز Kling 2.6 التحكم في نبرة الصوت ووظيفة Motion Control. تشير هذه التطورات إلى أن إنشاء الفيديو بالذكاء الاصطناعي ينتقل من عصر “البطاقات العشوائية” إلى مرحلة جديدة من الإنتاج السينمائي الدقيق والقابل للتحكم. (المصدر: WeChat, WeChat, Kling_ai, Alibaba_Wan)

تطور عميق في تقنيات واستراتيجيات الذكاء الاصطناعي المتجسد (Embodied AI): أطلقت DeepMind وضع “اكتساب البيانات السياقية” للذكاء الاصطناعي المتجسد، والذي يحل مشكلات العمومية من خلال بيانات منظور الإنسان الأول؛ أطلقت Horizon Robotics استراتيجية Wintel التي تعتمد على “BPU + Compiler + Foundation Model” لتمكين السيارات الذكية والروبوتات العامة؛ وقدم فريق الدكتور Wang Guangrun من جامعة Sun Yat-sen نموذج E0 للذكاء الاصطناعي المتجسد، مؤكدًا على فصل النماذج الفيزيائية والمكانية لتحقيق التعميم الدقيق مع عينات قليلة. تدفع هذه التطورات مجتمعة الذكاء الاصطناعي المتجسد من التقليد الميكانيكي نحو الفهم المنطقي والتفاعل مع العالم المادي. (المصدر: WeChat, WeChat, WeChat)

Xiaomi و SenseTime تُطلقان نماذج لغوية كبيرة متطورة: أطلقت Xiaomi نموذج MiMo-V2-Flash مفتوح المصدر، والذي يعتمد على بنية MoE، ومصمم خصيصًا لسيناريوهات Agent والبرمجة، ويدخل الصف الأول من النماذج مفتوحة المصدر عالميًا بكفاءة استدلال قصوى وتكلفة منخفضة. في الوقت نفسه، أطلقت SenseTime نموذج SenseNova-SI وبنية NEO، بهدف حل قيود فهم النماذج اللغوية البحتة للعالم المادي، من خلال تعزيز الذكاء المكاني عبر الوسائط المتعددة الأصلية والتنبؤ متعدد المنظور. (المصدر: WeChat, WeChat)

اندماج AI PC مع سيناريوهات تطبيق محددة: أطلقت Covestro مساعد الصحة الشخصية AI PC، الذي يستخدم تقنية rPPG غير التلامسية لتحقيق قياس ضغط الدم واكتشاف الجلد عن بعد، ويجمع بين NPU من Intel لإجراء عمليات حسابية محلية عالية الكفاءة. في الوقت نفسه، أطلقت Yunpeng Technology منتجات AI+Health جديدة، بما في ذلك ثلاجة ذكية مزودة بنموذج AI صحي كبير ومختبر مطبخ رقمي مستقبلي، لدمج AI في إدارة الصحة اليومية والتكنولوجيا المنزلية. (المصدر: WeChat, 36氪)

تقنية Moore Threads LiteGS تحقق اختراقًا في عرض الرسومات ثلاثية الأبعاد: فازت Moore Threads بالميدالية الفضية في تحدي إعادة البناء 3DGS في SIGGRAPH Asia 2025، وأطلقت تقنيتها LiteGS مفتوحة المصدر. LiteGS هي مكتبة أساسية لـ 3D Gaussian Splatting، تحقق ريادة ملحوظة في كفاءة التدريب وجودة إعادة البناء من خلال التحسين التعاوني الشامل، مما يدفع تطبيق تقنية 3DGS في إعادة البناء ثلاثي الأبعاد، والعرض في الوقت الفعلي، وسيناريوهات تدريب الذكاء الاصطناعي المتجسد. (المصدر: WeChat)

تطورات جديدة في التدريب المسبق الفعال للبيانات لنماذج LLM صغيرة النطاق: أطلق مهندس أبحاث كوري مستقل نموذج Gumini، وهو نموذج LLM أساسي ثنائي اللغة (الكورية-الإنجليزية) بـ 1.5 مليار معلمة، والذي تصدر الاختبارات المعيارية الكورية باستخدام 3.14 مليار رمز تدريب فقط. يشير هذا التقدم إلى أن التدريب المسبق لـ LLM يمكن أن يكون فعالاً من حيث البيانات من خلال تحسين البنية واستراتيجيات التدريب، مما يوفر مسارًا جديدًا للفرق الصغيرة والباحثين المستقلين خارج نموذج “المزيد من البيانات + المزيد من القوة الحاسوبية”. (المصدر: Reddit r/LocalLLaMA)![An independent Korean researcher is trying to democratize LLM pretraining with a 1.5B model](https://external-preview.redd.it/8464vKj

🔥 تركيز

🎯 التوجهات

Related Posts

نشرة الذكاء الاصطناعي – 2026-07-20

نشرة الذكاء الاصطناعي – 2026-07-19

نشرة الذكاء الاصطناعي – 2026-07-18