2.1. 安装¶
软硬件需求¶
OS:ubuntu 20.04
Python:3.8 - 3.10
加速卡:燧原S60
安装内容¶
以下步骤基于 Python3.8
, 请先安装所需依赖,需要在docker内安装:
安装环境:安装过程请参考《TopsRider软件栈安装手册》,请根据手册完成TopsRider软件栈安装;
vllm安装¶
首先通过如下命令检查vllm及相关依赖是否已经安装:
python3.8 -m pip list | grep vllm
python3.8 -m pip list | grep xformers
python3.8 -m pip list | grep tops-extension
如果已经正常安装,可以显示如下内容:
vllm <version>+gcu
xformers <version>
tops-extension <version>
如果未安装,可以通过以下2种安装方式完成vllm安装:
通过TopsRider安装:
./Topsrider_xxx.run -y -C vllm
通过whl包安装:
# 安装vllm库
python3.8 -m pip install vllm-<version>+gcu-*-none-any.whl
# 安装vllm的依赖库
python3.8 -m pip install xformers-<version>*.whl
python3.8 -m pip install tops_extension-<version>*.whl