1. 简介

TopsRider v3.1 发布说明,TopsRider v3.1.8 版本适用于 S60 系列设备。下述新增/修改特性和问题修复部分是相对于上一次公版发布 TopsRider v3.0.10 的变更。

2. 功能优化

2.1 新增/修改特性

2.1.1 基础特性

1、 支持 S60 系列设备
2、 新增 TGI 组件支持
3、 移除 2 代产品支持
4、 移除 TopsGDB

2.1.2 驱动

1、 S60 系列产品虚拟化加载
2、 低功耗模式支持
3、 多媒体 Video 进程强杀
4、 EFSMI 优化(显示虚拟化工作模式/显示 GCU 拓扑关系等功能)

2.1.3 TopsCloud

1、 新增 k8s-device-plugin_2.0.0.beta1, enflame-container-toolkit_2.0.0.beta1, node-exporter 支持
2、 kubeone 升级为 k8s-installer,支持 k8s>=1.24 镜像构建

2.1.4 BigModel

1、 新增 deepspeed + deepspeed-mii + S60 系列支持

2.1.5 ECCL

1、 新增 API: ecclCommAbort/ecclCommGetAsyncError/ecclGetLastError/ecclGetVersion
2、 支持机内共享内存的传输通道,适应 VM 场景(非 proxy 方案)
3、 基于 proxy 支持 RDMA 的传输通道
4、 基于 proxy 支持 TCP 的传输通道
5、 通过环境变量 ECCL_IB_HCA 支持 RDMA 端口选择
6、 支持 average 的 reduce op type
7、 通过环境变量支持用户选择和关闭传输通道

2.1.6 Topsprofiler

1、 支持 show timeline by stream
2、 支持 highlight dte partical write

2.2 新支持模型

2.2.1 LLM 大模型
模型名称框架数据类型卡数
Mixtral 8x7B 32kPyTorch+vLLMfp164
Mistral-7B-v0.1PyTorch+vLLMfp161
Qwen1.0-1.8BPyTorch+vLLMbf161
Qwen1.0-7BPyTorch+vLLMbf161
Qwen1.0-14BPyTorch+vLLMbf161
Qwen1.0-72BPyTorch+vLLMbf164
Qwen1.5-14B-chatPyTorch+vLLMfp161
Qwen1.5-32BPyTorch+vLLMfp162
Qwen1.5-72B-chatPyTorch+vLLMfp164
Qwen-14B-chatPyTorch+vLLMfp161
internLM2-7BPyTorch+vLLMfp161
internLM2-20BPyTorch+vLLMfp162
internLM-7BPyTorch+vLLMfp161
deepseek-llm-67BPyTorch+vLLMfp164
vicuna-v1.3-33BPyTorch+vLLMfp162
vicuna-v1.5-13B-16kPyTorch+vLLMfp161
vicuna-v1.5-13BPyTorch+vLLMfp161
XuanYuan-70BPyTorch+vLLMfp164
XuanYuan2-70BPyTorch+vLLMfp164
XuanYuan-6BPyTorch+vLLMfp161
XuanYuan-13BPyTorch+vLLMfp162
Aquila2-34BPyTorch+vLLMfp162
AquilaChat2-34B-16KPyTorch+vLLMfp164
llama-65BPyTorch+vLLMfp164
llama3-8BPyTorch+vLLMfp161
llama3-70BPyTorch+vLLMfp164
chinese-llama2PyTorch+vLLMfp161
Yi-34BPyTorch+vLLMfp162
Yi-6BPyTorch+vLLMfp161
bloomz-7B1PyTorch+vLLMfp161
OPT-13BPyTorch+vLLMfp161
GPT-J-6BPyTorch+vLLMfp161
orion-14b-basePyTorch+vLLMfp161
wizardcoder-15BPyTorch+vLLMfp161
WizardCoder-33BPyTorch+vLLMfp162
ziya-coding-34BPyTorch+vLLMfp162
starcoder2-15BPyTorch+vLLMfp161
starcoder2-7BPyTorch+vLLMfp161
starcodebasePyTorch+vLLMfp161
codellama-34B/instruct/pythonPyTorch+vLLMfp162
codellama-13BPyTorch+vLLMfp161
codellama-70B/instruct/pythonPyTorch+vLLMfp164
Yi-1.5-34BPyTorch+vLLMfp162
Yi-1.5-6BPyTorch+vLLMfp161
baichuan2-7BTGIfp161
baichuan2-13BTGIfp161
chatGLM3-6B-32KTGIfp161
chatGLM3-6B-8kTGIfp161
llama2-70BTGIfp164
2.2.2 AIGC w8a16 量化模型
模型名称框架数据类型卡数
LLama2-13BvLLMw8a161
LLama2-7BvLLMw8a161
LLama2-70BvLLMw8a162
LLama3 8BvLLMw8a161
LLama3 70BvLLMw8a162
QWen1.0-14BvLLMw8a161
QWen1.0-72BvLLMw8a162
Qwen1.5-14B-chatvLLMw8a161
ChatGLM3-6B-32kvLLMw8a161
ChatGLM3-6B-8kvLLMw8a161
chatGLM2 6B-8kvLLMw8a161
chatGLM2 6B-32kvLLMw8a161
Baichuan2-13BvLLMw8a161
Baichuan2-7BvLLMw8a161
Mixtral-8x7BvLLMw8a161
InternLM-7BvLLMw8a161
ziya-coder-34BvLLMw8a161
Bloomz 176BvLLMw8a168
2.2.3 AIGC 图像生成
模型名称框架数据类型卡数
sd1.5 img2imgPyTorch 2.1 + Atenfp161
sd1.5_controlnet 推理:canny、mlsd 模式PyTorch 2.1 + Atenfp161
sd1.5_controlnet 推理:openpose、scribble 模式PyTorch 2.1 + Atenfp161
sd1.5_controlnet 推理:lineart、lineart_anime 模式PyTorch 2.1 + Atenfp161
sd1.5_controlnet 推理:depth、normalbae 模式PyTorch 2.1 + Atenfp161
sd1.5_controlnet 推理:inpaint、softedge 模式PyTorch 2.1 + Atenfp161
sd1.5_controlnet 推理:Shuffle、Seg 模式PyTorch 2.1 + Atenfp161
sd1.5_controlnet 推理:Tile,instructpix2pix 模式PyTorch 2.1 + Atenfp161
sd1.5 Hires fixPyTorch 2.1 + Atenfp161
sdv1.5 text2imagePyTorch 2.1 + Atenfp161
sdxl img2img 45 分辨率PyTorch 2.1 + Atenfp161
sdxl-base 新增采样器4 个PyTorch 2.1 + Atenfp161
sdxl-base inpainting,mask 修复PyTorch 2.1 + Atenfp161
sdxl refiner txt2img 45分辨率PyTorch 2.1 + Atenfp161
sdxl 上的 lora、 mulLora, 动态 refitPyTorch 2.1 + Atenfp161
sdxl controlnetopenpose、cannyPyTorch 2.1 + Atenfp161
sdxl controlnet hedPyTorch 2.1 + Atenfp161
sdxl + LCM LoRAPyTorch 2.1 + Atenfp161
sdxl-turboPyTorch 2.1 + Atenfp161
sd2.1PyTorch 2.1 + Atenfp161
InstantIDPyTorch 2.1 + Atenfp161
PlaygroundPyTorch 2.1 + Atenfp161
DiTPyTorch 2.1 + Atenfp161
IP-Adapter-FaceIDPyTorch 2.1 + Atenfp161
BLIP v1PyTorch 2.1 + Atenfp161
deepdanbooruPyTorch 2.1 + Atenfp161
2.2.4 AIGC 视频生成
模型名称框架数据类型卡数
ViTPyTorch 2.1 + Atenfp161
AnimateDiffPyTorch 2.1 + Atenfp161
Magic-AnimatePyTorch 2.1 + Atenfp161
2.2.5 AIGC 多模态
模型名称框架数据类型卡数
llava-1.5-7bPyTorch 2.1 + Atenfp161
CogvlmPyTorch 2.1 + Atenfp161
Qwen-VLPyTorch 2.1 + Atenfp161
2.2.6 传统模型
模型名称框架数据类型卡数
bert-vitsPyTorch 2.1 + Atenfp161
bge-large-zh-v1.5Pytorch+Sentence-Transformersfp161
bge-large-zhPytorch+Sentence-Transformersfp161
m3e-basePytorch+Sentence-Transformersfp161
gte-large-zhPytorch+Sentence-Transformersfp161
bge-m3Pytorch+Sentence-Transformersfp161
yolov8TopsInferencefp161
yolov9TopsInferencefp161
dlrm-dcnPyTorch 2.1 + Atenfp161

3. FW信息

FW版本号
S60 SSM FWBoot FW 33.6.4,Runtime FW 33.6.5.0
AP1.1.1
SP2.7.10
VPU3.1.1

4. 问题修复

  • S60 推理模型 sdxl_text2image 2048x2048_bs1 oom
  • ssd_resnet34_1200x1200_wo_nms-pt-op13-int8-N.onnx 测试真实样本mismatch

5. 文档更新

5.1 增加文档

《torch_gcu2.1 算子支持列表》
《tensorflow_gcu用户使用手册》
《tensorflow_gcu 算子支持列表》
《TopsGraph 用户使用手册》
《多模态模型用户手册》
《torch 模型用户手册(推理)》
《TGI 用户使用手册》
《TopsCodec API Reference》
《TopsCodec 用户使用手册》

5.2 更名文档

《kubeone用户使用手册》更名为《k8s-installer用户使用手册》

5.3 删除文档

《大模型运行示例用户使用手册》
《stable_diffusion_gcu用户手册》
《loadgen用户使用手册》
《onnx 算子支持列表》
《TopsDistInfer用户使用手册》
《horovod_gcu用户使用手册》
《TopsGraph API参考 Python版本》
《PyTorch1.10 用户使用手册》
《模型推理精度验证手册》

6. 使用限制

  • RHEL 9.2 不支持虚拟化功能
  • 不支持 ARM 平台

7. 操作系统和 Python 支持

7.1 适配说明

  • Host 环境:仅 Enflame Driver 对此 OS 环境做兼容适配,Docker 运行 Ubuntu
  • Docker 环境:软件栈功能已做适配测试,需使用相同 OS 的 Host

7.2 操作系统支持列表

操作系统名称架构内核版本GCCGLIBC说明
Ubuntu20.04.z(z<=5)x865.4 & 5.11 & 5.13 & 5.159.32.31Host & Docker
Ubuntu 22.04.z(z<=1)x865.1511.22.35Host & Docker
Kylin v10x864.19.07.32.28仅驱动在 Host 上已适配
UOS 20 Serverx864.19.07.32.28
OpenEularX865.10.010.3.12.34
龙蜥 8.2 QU2X864.18.08.3.12.28
龙蜥 8.6X864.19.907.3.02.28

7.3 Python 支持版本

Python 3.8,Python 3.10(部分推理模型支持)

Categories:

Tags: