Fast LLM serving framework with RadixAttention for prefix caching and flexible frontend. — extraído del sitio web oficial o Wikipedia.
Aprender SGLang
Recursos recomendados para empezar
Conectemos
¿Te interesa esta tecnología?
No dudes en contactarme si querés discutir esta tecnología o explorar cómo puede aplicarse a tus proyectos.
