1. 简介
TopsRider v2.2发布说明,2.2.41版本适用于i20、T20、T21设备。
2. 功能和优化
2.1 文档格式
文档离线 html 格式,方便查看使用。
2.2 新增组件
新增 TopsIdeas 组件,详见TopsIdeas用户使用手册。
2.3 API变更
- torch-gcu:由 torch-dtu更名为 torch-gcu,api 中涉及 dtu关键字都更名为 gcu
- tensorflow:api中涉及到 dtu的关键字都更名为 gcu
2.4 i20设备模型支持
2.4.1 推理模型支持
模型名称 | 精度 | 说明 |
3D-Unet | FP16 混精 | 新增支持 |
Swin Transformer | FP16 混精 | 新增支持 |
PPYOLO | FP16 混精 | 新增支持 |
Ssdlite_mobilenet v1 | FP16 混精 | 新增支持 |
Resnet-50 v1.5 | FP16 混精,FP32,INT8 | |
Mobilenet v2 | FP16混精 | |
ShuffleNet | FP16混精 | |
GoogleNet | FP16混精 | |
EfficientNet | FP16混精 | |
Mask R-CNN | FP16混精 | |
SSD + MobileNet V2 | FP16混精 | |
YOLO v2 | FP16混精 | |
YOLO v3 | FP16混精 | |
YOLO v5 | FP16混精 | |
Faster RCNN | FP16混精 | |
Deeplab v3 | FP16混精 | |
Transformer | FP16混精 | |
Bert-large | FP16混精 | |
Swin Transformer | FP16混精 |
2.5 T20设备模型支持
2.5.1 PaddlePaddle框架新增模型
模型名称 | 框架 | 说明 |
ResNet50 | PaddlePaddle | 8卡,TF32 & FP32 |
BERT Large | PaddlePaddle | 8卡,TF32 & FP32 运行需要使用 python 3.8 及以上 |
GoogLeNet | PaddlePaddle | 8卡,TF32 |
MobileNet v2 | PaddlePaddle | 8卡,TF32 |
ShuffleNet | PaddlePaddle | 8卡,TF32 |
EfficientNet | PaddlePaddle | 8卡,TF32 |
2.5.2 PyTorch 新增模型
模型名称 | 框架 | 说明 |
ShuffleNet | PyTorch | 8卡,TF32 |
EfficientNet | PyTorch | 8卡,TF32 |
SSD_MobileNet v2 | PyTorch | 8卡,TF32 |
2.5.3 ARM模型支持(此次无新增)
模型名称 | 框架 | 数据类型 | 卡数 |
Resnet50 v1.5 | PyTorch | TF32 | 2 |
BERT Large | PyTorch | TF32 | 2 |
BERT Base | PyTorch | TF32 | 2 |
YOLO v3 | PyTorch | TF32 | 2 |
YOLO v5s | PyTorch | TF32 | 2 |
Unet | PyTorch | TF32 | 2 |
SSD | PyTorch | TF32 | 2 |
2.6 新增功能支持
- KMD:KMD支持第三方设备PCIe P2P,浪潮解码卡与GCU卡直接p2p显存读写拷贝
- TopsProf:默认使能收集和分析ECCL domain 的信息
- ECCL:支持灵活设置进程与卡绑定关系
- TensorFlow:Tensorflow版本信息包含关键字已区别社区公开版本
- 日志优化:清晰分辨训练运行阶段的log
- Runtime:peer-to-peer memory 卡间数据直接拷贝
3. 使用限制
- PaddlePaddle 框架下 Bert Large 需要使用 Python 3.8 及以上
- T20/T21 不支持多进程,不支持多人同时使用同一张卡
4 GCU 设备 Firmware 版本、EFSMI 版本
4.1 GCU 设备Firmware 版本
GCU设备 | Firmware | |
T20 | 10.19.3 | |
T21 | 11.2.5 | |
i20 | 21.6.5 |
4.2 EFSMI 版本
1.15.0
5. 操作系统和 Python 支持
5.1 适配说明
- Host 环境:仅 Enflame Driver 对此 OS 环境做兼容适配,Docker 运行 Ubuntu
- Docker 环境:软件栈功能已做适配测试,需使用相同 OS 的 Host
5.2 操作系统支持列表
操作系统名称 | 架构 | 内核版本 | GCC | GLIBC | 说明 |
Ubuntu 18.04.z(z<=6) | x86 | 4.15.0 & 5.4 | 7.5 | 2.27 | Host & Docker |
Ubuntu 18.04.6 | aarch64 | 5.4 | 7.5 | 2.27 | Host & Docker |
Ubuntu 20.04.z(z<=5) | x86 | 5.4 & 5.11 & 5.13 & 5.15 | 9.3 | 2.31 | Host & Docker |
Ubuntu 22.04.z (z<=1) | x86 | 5.15 | 11.2 | 2.35 | 仅 kmd 在 Host 上已适配,Docker 中请使用其他OS |
CentOS 7.9 | x86 | 3.1 | 5.5 | 2.17 | Host & Docker |
Redhat linux 8.y(y=0,3,4,6) | x86 | 4.18 | 8.5 | 2.28 | Host GCC 4.8.5 Docker GCC 5.5 |
RedHat 9.y (y=0) | X86 & aarch64 | 5.14.0 | 11.2.1 | 2.34 | 仅 kmd 在 Host 上已适配,Docker 中请使用其他 OS |
Kylin v10 | x86 | 4.19.0 | 7.3 | 2.28 | 仅 kmd 在Host上已适配,Docker 使用 Ubuntu |
UOS 20 Server | x86 | 4.19.0 | 7.3 | 2.28 | 仅 Host 适配,Docker 使用 Ubuntu |
OpenEular | X86 | 5.10.0 | 10.3.1 | 2.34 | Host & Docker |
龙蜥 8.2 QU2 | X86 | 4.18.0 | 8.3.1 | 2.28 | Host & Docker |
龙蜥 8.6 | X86 | 4.19.90 | 7.3.0 | 2.28 | Host & Docker |
5.3 Python 支持
Python 3.6,Python 3.8