vLLM-gcu(v0.8.0)用户使用手册¶
vLLM-gcu是适配于燧原S60 gcu的vLLM,用于支持在Enflame gcu上运行各LLM的推理。
目录
- 1. 版权声明
- 2. 总体介绍
- 3. 安装
- 4. 使用指南
- 5. 模型推理及性能评估指南
- 5.1. 已支持的大语言模型列表
- 5.2. DeepSeek
- 5.3. GLM4
- 5.4. InternLM
- 5.5. Llama
- 5.6. Mistral
- 5.7. Qwen
- 5.8. Jina
- 5.9. Alibaba-NLP
- 6. 多模态模型