4.1. 已支持的大语言模型列表

表 4.1.1 已支持的大语言模型(注:.表示尚未测试)

模型

FP16

BF16

W4A16 GPTQ

W8A16 GPTQ

W4A16 AWQ

W8A16

W8A8 INT8

INT8 KV

DeepSeek-R1-Distill-Qwen-14B

Y

Y

.

.

.

.

.

.

DeepSeek-R1-Distill-Llama-8B

Y

Y

.

.

.

.

.

.

DeepSeek-R1-awq

.

.

.

.

Y

.

.

.

Qwen2.5-vl-3b

Y

Y

.

.

.

.

.

.