5.8. Jina

Jina-reranker-v2-base-multilingual

模型下载

将上述 url 路径下的内容全部下载到 jina-reranker-v2-base-multilingual 文件夹中。

requirement

python3 -m pip install transformers==4.52.4 beir==2.1.0

在线推理

# 启动服务端
python3 -m vllm.entrypoints.openai.api_server  \
    --model [path of jina-reranker-v2-base-multilingual] \
    --served-model-name jina-reranker-v2-base-multilingual  \
    --task embed \
    --trust-remote-code \
    --max-model-len 1024 \
    --port 6343

# 启动客户端
curl -X POST \
http://localhost:6343/rerank \
  -H "Content-Type: application/json" \
  -d '{
        "model": "jina-reranker-v2-base-multilingual",
        "query": "人工智能在医疗领域的应用现状",
        "documents": [
            "AI医学影像识别可辅助医生诊断肺癌、乳腺癌等疾病,准确率超95%",
            "自然语言处理技术用于电子病历分析,提升病历检索效率300%",
            "深度学习是人工智能的一个分支,基于神经网络"
        ],
        "normalize": false
      }'

性能测试

# 启动服务端
python3 -m vllm.entrypoints.openai.api_server  \
    --model [path of jina-reranker-v2-base-multilingual] \
    --served-model-name jina-reranker-v2-base-multilingual  \
    --task embed \
    --trust-remote-code \
    --max-model-len 1024 \
    --port 6343

# 启动客户端
python3 -m vllm_utils.benchmark_embedding_rerank \
    --tokenizer [path of jina-reranker-v2-base-multilingual] \
    --trust-remote-code \
    --test-type rerank \
    --api-url http://localhost:6343/rerank \
    --model jina-reranker-v2-base-multilingual \
    --input-len 100 \
    --total-requests 1000 \
    --query-len 20 \
    --num-docs 100