5.1. 已支持的大语言模型列表

表 5.1.2 已支持的大语言模型(注:.表示尚未测试)

模型

FP16

BF16

W4A16 GPTQ

W8A16 GPTQ

W4A16 AWQ

W8A16

W8A8 INT8

INT8 KV

Baichuan2

Y

.

.

Y

Y

.

Y

Y

ChatGLM2

Y

.

.

Y

.

.

.

.

ChatGLM3

Y

.

.

Y

.

.

.

.

CodeLlama

.

.

.

Y

.

.

.

.

DBRX

Y

.

.

Y

.

.

.

.

DeepSeek

Y

.

.

.

.

.

.

.

DeepSeek-MoE

Y

.

Y

.

.

.

Y

.

DeepSeek-Coder

Y

.

.

.

.

.

.

.

DeepSeek-V2-Lite

.

Y

.

.

.

.

.

.

Gemma

Y

.

.

.

.

.

.

.

codegemma

Y

.

.

.

.

.

.

.

iFlytekSpark

Y

.

.

.

.

.

.

.

InternLM2

Y

Y

Y

.

.

.

.

.

LLaMA2

Y

.

.

Y

Y

Y

Y

Y

LLaMA3

Y

.

Y

Y

.

.

.

.

LLaMA3.1

Y

.

Y

.

.

.

.

.

Mistral

Y

.

.

.

.

.

.

.

Mixtral

Y

Y

.

Y

.

.

.

.

Qwen1.5

Y

Y

Y

Y

.

.

Y

.

Qwen1.5-MoE

.

Y

.

.

.

.

.

.

Qwen2

Y

Y

Y

Y

Y

.

Y

Y

Qwen2.5

.

.

.

Y

.

.

.

.

StarCoder2

Y

.

.

Y

.

.

.

.

SUS-Chat

.

.

.

Y

.

.

.

.

WizardCoder

Y

.

.

.

.

.

.

.

Yi

Y

.

.

Y

.

.

.

.

Yi-1.5

.

.

Y

.

.

.

.

.

Ziya-Coding

Y

.

.

Y

.

.

.

.