5.1. 已支持的大语言模型列表¶
模型 |
FP16 |
BF16 |
W4A16 GPTQ |
W8A16 GPTQ |
W4A16 AWQ |
W8A16 |
W8A8 INT8 |
INT8 KV |
---|---|---|---|---|---|---|---|---|
ChatGLM3 |
Y |
. |
. |
Y |
. |
. |
. |
. |
LLaMA2 |
Y |
. |
Y |
. |
. |
. |
Y |
. |
LLaMA3.1 |
Y |
. |
. |
. |
. |
. |
Y |
. |
Qwen2 |
Y |
. |
. |
. |
. |
. |
Y |
. |
Yi |
Y |
. |
. |
Y |
. |
. |
. |
. |