Scaling Llms with Nvidia Triton and Tensorrt-LLM
The Complete Guide to Production Inference, Kubernetes Deployment, and Multi-Node GPU Optimization
(Autor) Jacob Quinlan
Formato:
Paperback
£26,21
Precio: £26,21
(0% off)
Generally dispatched in 1 to 2 days
Information
Editorial:
Independently Published
Formato:
Paperback
Número de páginas:
None
Idioma:
en
ISBN:
9798277387214
Año de publicación:
2025
Fecha publicación:
4 de Diciembre de 2025