1. 简介
TopsRider v3.0.10.1 版本适用于 i20、T20、T21 设备。
2. 功能优化
2.1 新增/修改特性
2.1.1 基础特性
1、 移除 paddlepaddle 在 T20 设备的应用
2、 移除 i20 训练模型
3、 移除对 python3.6 的支持
4、 安装包统一化
2.1.2 TopsCloud
1、 全栈正式支持 k8s >=1.24
2、 全栈正式开启 containerd 支持
3、 新增支持 podman 镜像构建,新增各子组件版本号查看命令
4、 enflame-container-toolkit 新增 run 包支持
5、 gcu-exporter 新增非特权模式支持
6、 gcu-operator 新增 command 字段,支持用户自定义替换容器镜像默认启动命令
7、 gcu-upgrade-manager 以及对应文档已被 deprecated
2.1.3 BigModel
1、 llm_scripts 基于 T20 新增 Llama-2-13b seq_len=2048/4096 全量微调用例支持,新增 Llama-2-70b seq_len=4096 全量微调用例支持,新增 Llama-2-70b Lora 微调用例支持
2.1.4 Torch_GCU
1、 Torch_GCU 支持 PyTorch 1.10 all_to_all_single 接口
2.1.5 TopsInference
1、 TopsInference 支持 ConvTransposeQuant 算子
2.1.6 ECCL
1、 ECCL 安装包名称从 tops_eccl 变更为 eccl
2、 在 i2X 设备,eccl 在本次版本上切换到基于 topscc 和 kernel runtime 的实现方案
2.1.7 Topsprofiler
1、 支持 topsinference 多进程 Profiling
2.2 i2x 模型支持
2.2.1 Topstransfomer 模型
CodeGeex2-6B,PyTorch,2 卡
2.3 T2x 支持模型
2.3.1 ARM 模型支持
模型名称 | 框架 | 数据类型 | 卡数 |
Resnet50 v1.5 | PyTorch | EFP | 2 |
BERT Large | PyTorch | EFP | 2 |
BERT Base | PyTorch | EFP | 2 |
YOLO v3 | PyTorch | EFP | 2 |
YOLO v5s | PyTorch | EFP | 2 |
Unet | PyTorch | EFP | 2 |
SSD | PyTorch | EFP | 2 |
3. 增加文档
《stable_diffusion_gcu 测试用户手册》
4. 使用限制
RHEL 9.2 不支持虚拟化功能
5. 操作系统和 Python 支持
5.1 适配说明
- Host 环境:仅 Enflame Driver 对此 OS 环境做兼容适配,Docker 运行 Ubuntu
- Docker 环境:软件栈功能已做适配测试,需使用相同 OS 的 Host
5.2 操作系统支持列表
所有 OS 支持列表
操作系统名称 | 架构 | 内核版本 | GCC | GLIBC | 说明 |
Ubuntu 18.04.z(z<=6) | x86 | 4.15.0 & 5.4 | 7.5 | 2.27 | Host & Docker |
Ubuntu 18.04.6 | aarch64 | 5.4 | 7.5 | 2.27 | Host & Docker |
Ubuntu20.04.z(z<=5) | x86 | 5.4 & 5.11 & 5.13 & 5.15 | 9.3 | 2.31 | Host & Docker |
Ubuntu 22.04.z(z<=1) | x86 | 5.15 | 11.2 | 2.35 | 仅 kmd 在Host 上已适配,Docker中请使用其他OS |
CentOS 7.9 | x86 | 3.1 | 5.5 | 2.17 | Host & Docker |
Kylin v10 | x86 | 4.19.0 | 7.3 | 2.28 | 仅 kmd 在Host 上已适配,Docker中请使用其他OS |
UOS 20 Server | x86 | 4.19.0 | 7.3 | 2.28 | 仅 Host 适配,Docker 使用 Ubuntu |
OpenEular | X86 | 5.10.0 | 10.3.1 | 2.34 | Host & Docker |
龙蜥 8.2 QU2 | X86 | 4.18.0 | 8.3.1 | 2.28 | Host & Docker |
龙蜥 8.6 | X86 | 4.19.90 | 7.3.0 | 2.28 | Host & Docker |
5.3 Python 支持
Python 3.8,Python 3.10(推理模型支持)