Il tanto atteso training RL ospitato da @PrimeIntellect è disponibile, nell'ultimo mese con la beta ho addestrato oltre 50 modelli sia su ambienti della community che sul mio pmpp, tutti disponibili su env hub. Passare da segnale a modello tutto all'interno del Lab è stata l'esperienza di training più fluida che abbia mai avuto.