Den etterlengtede hostede RL-treningen fra @PrimeIntellect er ute, den siste måneden /med beta har jeg trent 50+ modeller på både community envs og min pmpp, som alle er tilgjengelige på env hub. Å gå e2e fra signal til modell, alt inne i laboratoriet, var den smidigste treningsopplevelsen jeg noen gang har hatt