5.1. 已支持的大语言模型列表

表 5.1.4 已支持的大语言模型(注:.表示尚未测试)

模型 FP16

BF16

W4A16 GPTQ

W8A16 GPTQ

W4A16 AWQ

W8A16

W8A8 FP8

Qwen3-32B

.

Y

.

.

.

.

.

QWen3-30B-A3B

.

Y

.

.

.

.

.

QwQ-32B

.

Y

.

.

.

.

.

GLM-Z1-32B-0414

.

.

Y

.

.

.

.

Llama-3.1-8B

.

Y

.

.

.

.

.

DeepSeek-R1-Distill-Qwen-7B

.

Y

.

.

.

.

.