Buletin AI Harian Berita AI – 2026-01-09(Edisi malam) DeepSeek R1Model Hadiah Proses PRMPelatihan AIPembelajaran Penguatan RL