Enflame Documents

Version: TopsRider v3.3

开发概览

燧原软件栈白皮书

环境安装

TopsRider 软件栈安装手册

模型开发

综合框架使用指南
模型推理库使用指南

基础开发平台

基础开发平台
- TopsPlatform 用户使用指南

通用计算库

通用计算库

合规声明

文档法律声明

燧原软件栈文档中心

»
综合框架使用指南 »
vLLM-GCU 用户使用手册

vLLM-GCU 用户使用手册¶

vLLM-GCU 是适配于燧原S60 GCU 的 vLLM，用于支持在 Enflame GCU 上运行各 LLM 的推理。

目录

1. 前言
- 1.1. 版本信息
2. 安装
- 2.1. 安装
  - 软硬件需求
  - 安装内容
    - vllm安装
3. 模型推理及性能评估指南
4. 数据集精度验证
5. 高阶特性
6. 多模态模型

Previous Next

Copyright © 2024 上海燧原科技股份有限公司 | 备案/许可证编号：沪ICP备18023946号-1 沪公网安备 31011502008689号.

Built with Sphinx using a theme provided by Read the Docs.