1. 简介

TopsRider v3.0.10.1 版本适用于 i20、T20、T21 设备。

2. 功能优化

2.1 新增/修改特性

2.1.1 基础特性

1、 移除 paddlepaddle 在 T20 设备的应用
2、 移除 i20 训练模型
3、 移除对 python3.6 的支持
4、 安装包统一化

2.1.2 TopsCloud

1、 全栈正式支持 k8s >=1.24
2、 全栈正式开启 containerd 支持
3、 新增支持 podman 镜像构建,新增各子组件版本号查看命令
4、 enflame-container-toolkit 新增 run 包支持
5、 gcu-exporter 新增非特权模式支持
6、 gcu-operator 新增 command 字段,支持用户自定义替换容器镜像默认启动命令
7、 gcu-upgrade-manager 以及对应文档已被 deprecated

2.1.3 BigModel

1、 llm_scripts 基于 T20 新增 Llama-2-13b seq_len=2048/4096 全量微调用例支持,新增 Llama-2-70b seq_len=4096 全量微调用例支持,新增 Llama-2-70b Lora 微调用例支持

2.1.4 Torch_GCU

1、 Torch_GCU 支持 PyTorch 1.10 all_to_all_single 接口

2.1.5 TopsInference

1、 TopsInference 支持 ConvTransposeQuant 算子

2.1.6 ECCL

1、 ECCL 安装包名称从 tops_eccl 变更为 eccl
2、 在 i2X 设备,eccl 在本次版本上切换到基于 topscc 和 kernel runtime 的实现方案

2.1.7 Topsprofiler

1、 支持 topsinference 多进程 Profiling

2.2 i2x 模型支持

2.2.1 Topstransfomer 模型

CodeGeex2-6B,PyTorch,2 卡

2.3 T2x 支持模型

2.3.1 ARM 模型支持
模型名称框架数据类型卡数
Resnet50 v1.5PyTorchEFP2
BERT LargePyTorchEFP2
BERT BasePyTorchEFP2
YOLO v3PyTorchEFP2
YOLO v5sPyTorchEFP2
UnetPyTorchEFP2
SSDPyTorchEFP2

3. 增加文档

《stable_diffusion_gcu 测试用户手册》

4. 使用限制

RHEL 9.2 不支持虚拟化功能

5. 操作系统和 Python 支持

5.1 适配说明

  • Host 环境:仅 Enflame Driver 对此 OS 环境做兼容适配,Docker 运行 Ubuntu
  • Docker 环境:软件栈功能已做适配测试,需使用相同 OS 的 Host

5.2 操作系统支持列表

所有 OS 支持列表

操作系统名称架构内核版本GCCGLIBC说明
Ubuntu 18.04.z(z<=6)x864.15.0 & 5.47.52.27Host & Docker
Ubuntu 18.04.6aarch645.47.52.27Host & Docker
Ubuntu20.04.z(z<=5)x865.4 & 5.11 & 5.13 & 5.159.32.31Host & Docker
Ubuntu 22.04.z(z<=1)x865.1511.22.35仅 kmd 在Host 上已适配,Docker中请使用其他OS
CentOS 7.9x863.15.52.17Host & Docker
Kylin v10x864.19.07.32.28仅 kmd 在Host 上已适配,Docker中请使用其他OS
UOS 20 Serverx864.19.07.32.28仅 Host 适配,Docker 使用 Ubuntu
OpenEularX865.10.010.3.12.34Host & Docker
龙蜥 8.2 QU2X864.18.08.3.12.28Host & Docker
龙蜥 8.6X864.19.907.3.02.28Host & Docker

5.3 Python 支持

Python 3.8,Python 3.10(推理模型支持)

Categories:

Tags: