اللعنة، Prime-RL يمكنه تدريب GLM-5 باستخدام EP وPD Disag