5.1. 已支持的大语言模型列表

表 5.1.2 已支持的大语言模型(注:.表示尚未测试)

模型

FP16

BF16

W4A16 GPTQ

W8A16 GPTQ

W4A16 AWQ

W8A16

W8A8 INT8

INT8 KV

ChatGLM3

Y

.

.

Y

.

.

.

.

LLaMA2

Y

.

Y

.

.

.

Y

.

LLaMA3.1

Y

.

.

.

.

.

Y

.

Qwen2

Y

.

.

.

.

.

Y

.

Yi

Y

.

.

Y

.

.

.

.