[태그:] LLM에서의 강화 학습 적용