1. 前言¶
本文档介绍vLLM-gcu的功能和使用方法,包括模型批量离线推理示例、性能评估及在特定数据集上的精度验证。
1.1. 版本信息¶
日期 |
版本 |
作者 |
原始vllm版本 |
新增功能 |
---|---|---|---|---|
2023-11-09 |
v0.2.1 |
Enflame |
0.2.1 |
|
2024-01-25 |
v0.2.6 |
Enflame |
0.2.6 |
2.添加了性能测试; 3.添加了数据集精度验证,支持ceval/mmlu/adgen数据集; |
2024-01-30 |
v0.2.7 |
Enflame |
0.2.7 |
2.添加了cmmlu数据集的精度验证; |
2024-03-07 |
v0.2.7 |
Enflame |
0.2.7 |
2.添加了humaneval数据集的精度验证; |
2024-03-14 |
v0.2.7 |
Enflame |
0.2.7 |
|
2024-03-29 |
v0.2.7 |
Enflame |
0.3.3 |
1.升级至0.3.3 |
2024-04-07 |
v0.3.3 |
Enflame |
0.3.3 |
|
2024-04-16 |
v0.2.7 |
Enflame |
0.3.3 |
|
2024-04-28 |
v0.3.3 |
Enflame |
0.3.3 |
|
2024-06-05 |
v0.3.3 |
Enflame |
0.3.3 |
|
2024-06-18 |
v0.3.3 |
Enflame |
0.3.3 |
|