Saltar al contenido principal

Hugging Face library for fine-tuning LLMs with RLHF, DPO, PPO, and SFT.extraído del sitio web oficial o Wikipedia.

Aprender TRL

Recursos recomendados para empezar

Conectemos

¿Te interesa esta tecnología?

No dudes en contactarme si querés discutir esta tecnología o explorar cómo puede aplicarse a tus proyectos.