نشرة الذكاء الاصطناعي – 2025-12-19(الإصدار الصباحي)

🔥 تركيز

Meta تُطلق نموذج SAM 3: أعلنت Facebook Research عن إطلاق SAM 3، وهو نموذج أساسي موحد لتجزئة الصور والفيديو قابل للتوجيه. يقوم النموذج باكتشاف الكائنات وتجزئتها وتتبعها عبر موجهات نصية أو بصرية، ويقدم قدرة تجزئة المثيلات لمفاهيم المفردات المفتوحة، ويحقق أداءً يتراوح بين 75-80% من الأداء البشري على معيار SA-CO. يعتمد النموذج على محرك بيانات مبتكر قام بتصنيف أكثر من 4 ملايين مفهوم فريد تلقائيًا، ويستخدم تصميمًا معماريًا جديدًا يتضمن رموز الوجود (existence tokens) وكاشف-متتبع مفصول (decoupled detector-tracker) لتعزيز القدرة التمييزية والكفاءة. (المصدر: GitHub Trending)

SAM 3 architecture

جوجل تُطلق نموذج Gemini 3 Flash: أطلقت جوجل أسرع نموذج AI حتى الآن، Gemini 3 Flash، المصمم خصيصًا للسرعة مع الحفاظ على الذكاء المتطور. يُظهر النموذج أداءً متميزًا في معايير الاستدلال والمعرفة على مستوى الدكتوراه مثل GPQA Diamond وHumanity’s Last Exam، بل ويتفوق على Gemini 3 Pro في معيار SWE-bench Verified للبرمجة. يوفر Gemini 3 Flash سرعة أكبر بثلاث مرات من Gemini 2.5 Pro بتكلفة أقل (0.50 دولار لكل مليون رمز إدخال، و3 دولارات للإخراج)، وقد تم إطلاقه عالميًا كنموذج AI الافتراضي لـ Google Search، بهدف تعزيز انتشار AI في تطبيقات المؤسسات وبيئة المطورين. (المصدر: WeChat)

刚刚,谷歌祭出迄今最前沿模型 Gemini 3 Flash!编程能力上反超 Gemini 3 Pro,且更快更便宜

🎯 التوجهات

نماذج توليد الفيديو بالذكاء الاصطناعي تستمر في التطور: تم إطلاق نماذج مثل Alibaba Wanxiang 2.6، ByteDance Seedance 1.5 Pro، وKling 2.6 تباعًا. يحقق Wanxiang 2.6 تخصيصًا متسقًا للشخصيات صوتًا وصورة وتحكمًا في اللقطات المتعددة، مع توليد يصل إلى 15 ثانية في المرة الواحدة؛ يركز Seedance 1.5 Pro على التزامن عالي الدقة بين الصوت والصورة ودعم اللهجات المتعددة؛ بينما يعزز Kling 2.6 التحكم في نبرة الصوت ووظيفة Motion Control. تشير هذه التطورات إلى أن إنشاء الفيديو بالذكاء الاصطناعي ينتقل من عصر “البطاقات العشوائية” إلى مرحلة جديدة من الإنتاج السينمائي الدقيق والقابل للتحكم. (المصدر: WeChat, WeChat, Kling_ai, Alibaba_Wan)

硬刚Sora2,万相2.6轻松定制角色、控制分镜,普通人也能当导演

تطور عميق في تقنيات واستراتيجيات الذكاء الاصطناعي المتجسد (Embodied AI): أطلقت DeepMind وضع “اكتساب البيانات السياقية” للذكاء الاصطناعي المتجسد، والذي يحل مشكلات العمومية من خلال بيانات منظور الإنسان الأول؛ أطلقت Horizon Robotics استراتيجية Wintel التي تعتمد على “BPU + Compiler + Foundation Model” لتمكين السيارات الذكية والروبوتات العامة؛ وقدم فريق الدكتور Wang Guangrun من جامعة Sun Yat-sen نموذج E0 للذكاء الاصطناعي المتجسد، مؤكدًا على فصل النماذج الفيزيائية والمكانية لتحقيق التعميم الدقيق مع عينات قليلة. تدفع هذه التطورات مجتمعة الذكاء الاصطناعي المتجسد من التقليد الميكانيكي نحو الفهم المنطقي والتفاعل مع العالم المادي. (المصدر: WeChat, WeChat, WeChat)

与Physical Intelligence同日发声:深度机智亮出「情境数采」杀手锏,具身智能的通用性天花板要被捅破了?

Xiaomi و SenseTime تُطلقان نماذج لغوية كبيرة متطورة: أطلقت Xiaomi نموذج MiMo-V2-Flash مفتوح المصدر، والذي يعتمد على بنية MoE، ومصمم خصيصًا لسيناريوهات Agent والبرمجة، ويدخل الصف الأول من النماذج مفتوحة المصدر عالميًا بكفاءة استدلال قصوى وتكلفة منخفضة. في الوقت نفسه، أطلقت SenseTime نموذج SenseNova-SI وبنية NEO، بهدف حل قيود فهم النماذج اللغوية البحتة للعالم المادي، من خلال تعزيز الذكاء المكاني عبر الوسائط المتعددة الأصلية والتنبؤ متعدد المنظور. (المصدر: WeChat, WeChat)

罗福莉执掌小米大模型首秀!定调下一代模型,全新MiMo-V2开源还横扫Agent第一梯队

اندماج AI PC مع سيناريوهات تطبيق محددة: أطلقت Covestro مساعد الصحة الشخصية AI PC، الذي يستخدم تقنية rPPG غير التلامسية لتحقيق قياس ضغط الدم واكتشاف الجلد عن بعد، ويجمع بين NPU من Intel لإجراء عمليات حسابية محلية عالية الكفاءة. في الوقت نفسه، أطلقت Yunpeng Technology منتجات AI+Health جديدة، بما في ذلك ثلاجة ذكية مزودة بنموذج AI صحي كبير ومختبر مطبخ رقمي مستقبلي، لدمج AI في إدارة الصحة اليومية والتكنولوجيا المنزلية. (المصدر: WeChat, 36氪)

行啊AI PC!现在都能隔空测血压、检测皮肤了

تقنية Moore Threads LiteGS تحقق اختراقًا في عرض الرسومات ثلاثية الأبعاد: فازت Moore Threads بالميدالية الفضية في تحدي إعادة البناء 3DGS في SIGGRAPH Asia 2025، وأطلقت تقنيتها LiteGS مفتوحة المصدر. LiteGS هي مكتبة أساسية لـ 3D Gaussian Splatting، تحقق ريادة ملحوظة في كفاءة التدريب وجودة إعادة البناء من خلال التحسين التعاوني الشامل، مما يدفع تطبيق تقنية 3DGS في إعادة البناء ثلاثي الأبعاد، والعرض في الوقت الفعلي، وسيناريوهات تدريب الذكاء الاصطناعي المتجسد. (المصدر: WeChat)

摩尔线程算法一鸣惊人,图形学顶会夺银!已开源

تطورات جديدة في التدريب المسبق الفعال للبيانات لنماذج LLM صغيرة النطاق: أطلق مهندس أبحاث كوري مستقل نموذج Gumini، وهو نموذج LLM أساسي ثنائي اللغة (الكورية-الإنجليزية) بـ 1.5 مليار معلمة، والذي تصدر الاختبارات المعيارية الكورية باستخدام 3.14 مليار رمز تدريب فقط. يشير هذا التقدم إلى أن التدريب المسبق لـ LLM يمكن أن يكون فعالاً من حيث البيانات من خلال تحسين البنية واستراتيجيات التدريب، مما يوفر مسارًا جديدًا للفرق الصغيرة والباحثين المستقلين خارج نموذج “المزيد من البيانات + المزيد من القوة الحاسوبية”. (المصدر: Reddit r/LocalLLaMA)![An independent Korean researcher is trying to democratize LLM pretraining with a 1.5B model](https://external-preview.redd.it/8464vKj