Bert
你们中的许多人一定听说过“Bert”或“transformers”。 你可能还知道huggingface。
在本教程中,让我们使用它的 pytorch 转换器模型并通过 REST API 为它提供服务
模型是如何工作的?¶
输入一个不完整的句子,模型将给出它的预测:
Paris is the [MASK] of France.
Paris is the capital of France.
现在就来试试吧
先决条件¶
请访问 依赖项
服务模型¶
安装 Pinferencia¶
首先,让我们安装 Pinferencia。
pip install "pinferencia[uvicorn]"
创建app.py¶
让我们将我们的预测函数保存到一个文件 app.py 中并添加一些行来注册它。
| app.py | |
|---|---|
| 1 2 3 4 5 6 7 8 9 |  | 
运行服务,等待它加载模型并启动服务器:
$ uvicorn app:service --reload
INFO:     Started server process [xxxxx]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://127.0.0.1:8000 (Press CTRL+C to quit)
测试服务¶
请求
curl --location --request POST \
    'http://127.0.0.1:8000/v1/models/bert/predict' \
    --header 'Content-Type: application/json' \
    --data-raw '{
        "data": "Paris is the [MASK] of France."
    }'
响应
{
    "model_name":"bert",
    "data":"Paris is the capital of France."
}
创建test.py。
| test.py | |
|---|---|
| 1 2 3 4 5 6 7 8 |  | 
$ python test.py
{'model_name': 'bert', 'data': 'Paris is the capital of France.'}