1. 简介

TopsRider v3.2.204版本适用于S60系列设备。下述新增/修改特性和问题修复部分是相对于上一次发布Topsrider v3.2.109的变更。

2. 功能优化

2.1 新增/修改基本特性

  • TopsRider run包中增加paddle GCU 3.0和TGI 2.2组件
  • Topsinference推理bert base类/bert large类/mtcnn类等模型混精度性能优化
  • pytorch原生推理bert-vits2/roberta-textcnn性能优化
  • Paddle GCU新增功能如下:
    • 利用topscc进行自定义算子编译注册的机制
    • 对PaddleOCR V4的cls网络(MobilenetV2)的性能调优
    • DFX功能增强,新增Kernel Tensor的打印输出功能
    • 对RTDETR网络系列模型的支持
    • 对PPYOLOE网络系列模型的支持

2.2 新支持模型

2.2.1 LLM-W16A16

模型名称框架数据类型卡数
Qwen2-1.5B-InstructvLLMFP161

2.2.2 LLM-W8A8C8

模型名称框架数据类型卡数
llama2-7b-chatvLLMW8A8C81
Qwen2-72BvLLMW8A8C84
LLama2-70BvLLMW8A8C84

2.2.3 LLM-W4A16

模型名称框架数据类型卡数
deepseek-moe-16b-base-gptqvLLMvLLMW4A161
internLM-2.5-7B-chatvLLMW4A161
mixtral-8x7b-gptqvLLMW4A164
Llama-3.1-70B-Instruct-awqvLLMW4A164
Baichuan2-13B-awqvLLMW4A161

2.2.4 多模态

模型名称框架数据类型卡数
internvl-chat-1.5vLLMFP161

2.2.5 视频生成/文生图

模型名称框架数据类型卡数
CogVideox-5bPyTorch2.3+TopsAtenBP161
xdit+lattePyTorch2.3+TopsAtenFP161 / 2 /4
flux.1-schnellPyTorch2.3+TopsAtenBP161
open-sora-1.2PyTorch2.3+TopsAtenBP161

3. FW信息

FW版本号
S60 SSM FWBoot FW 33.6.5,Runtime FW 33.6.5.28
AP1.1.4
SP2.10.4
VPU3.1.4

5. 操作系统和Python支持

5.1 适配说明

  • Host 环境:仅Enflame Driver 对此 OS 环境做兼容适配,Docker 运行 Ubuntu
  • Docker 环境:软件栈功能已做适配测试,需使用相同OS 的 Host

5.2 操作系统支持列表

操作系统名称架构内核版本GCCGLIBC说明
Ubuntu 20.04.z(z<=5)x865.4 & 5.11 & 5.13 & 5.159.32.31Host & Docker
Ubuntu 22.04.z (z<=1)x865.1511.22.35Host & Docker
Kylin v10x864.19.07.32.28仅驱动在 Host 上已适配
UOS 20 Serverx864.19.07.32.28
OpenEularX865.10.010.3.12.34
龙蜥 8.2 QU2X864.18.08.3.12.28
龙蜥 8.6X864.19.907.3.02.28

5.3 Python 支持版本

Python 3.8(支持传统模型),Python 3.10

6 文档更新

6.1 增加文档

《torch_gcu2.1用户使用手册》

7. 使用限制

ARM 平台由于资源限制,只覆盖了单卡环境,覆盖模型如下:
vllm llama2 7b、llama2 13b、典型传统模型 resnet50 v1.5、yolov5m、vit_b vit_l

Categories:

Tags: