Дневник ИИ AI Ежедневник — 2026-01-09(Вечерний выпуск) DeepSeek R1Модель вознаграждения процесса (PRM)Обучение ИИОбучение с подкреплением (RL)