Saltar al contenido principal

High-throughput open-source LLM serving engine with PagedAttention and continuous batching.extraído del sitio web oficial o Wikipedia.

Aprender vLLM

Recursos recomendados para empezar

Conectemos

¿Te interesa esta tecnología?

No dudes en contactarme si querés discutir esta tecnología o explorar cómo puede aplicarse a tus proyectos.