1 篇博文含有标签「gradio」

快速部署深度学习模型：gradio初体验

2023年7月6日 · 阅读需 6 分钟

Jason Lee

前言

需求：将机器学习的模型变成网页应用，并部署到公网上用于访问。

前几个月，当时也有类似的需求，想将自己毕业论文中的一个图像处理模型部署到公网。当时考虑的是，用 django 或者 flask 结合 pytorch 在本地搭一个应用，实现图片进出预训练模型的逻辑，然后用内网穿透的工具，使得外部可以访问到我的主机。但是这就带来许多问题，比如当时找了好几个内网穿透工具，要么收费，要么不好用。而且，主机总会有关机的时候，那么关机后服务也就停止了。一时间迟迟无法入手，当时就暂时放弃了。前阵子听说了 gradio 这个好东西，一个 python 包，通过几行代码，就可以在本地起一个应用，不仅带有简洁的 UI，而且内置了内网穿透。当时觉得很困难的问题，竟然一下迎刃而解了。感叹现在深度学习社区发展的速度。

gradio 本地运行

下面以知乎上的 rgb2gray 为例，讲解 gradio 库的使用。新建一个虚拟环境，安装上 gradio 包：

pip install -Uq gradio ## -U表示安装最新版本的包，-q表示静默安装，避免命令行污染

新建一个 app.py：

import gradio as gr
import cv2

def to_black(image):
    output = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    return output

interface = gr.Interface(fn=to_black, inputs="image", outputs="image")
interface.launch(share=True)

运行 py 文件，gradio 在本地启动一个 HTTP 服务器，并通过内网穿透将该服务器暴露给公共互联网。局域网和公网链接都会输出在命令行终端。但是生成的公网链接会在 72 小时后过期，因此它是一个临时链接。如果要实现永久访问，需要将代码以及预训练模型（如有）上传到 huggingface space 上。

huggingface space

huggingface space 是一个类似 github 的地方，可以用来存 py 文件和预训练模型，并且在和 gradio 绑定后，可以实现免费的部署。如果是新电脑，运行gradio deploy，按指示添加 write token，绑定 huggingface 账号。也可以通过 git clone 命令，下载空间到本地再修改。新建 space 时的信息：

除了一个基础的 cpu 是免费的，其他都是按小时收费的。说实话还是蛮贵的，比如 T4 gpu，colab 和 kaggle 都是免费提供的，这里收 0.6 美刀/小时。当代码每次有更改时，空间会自动刷新并运行一次，可通过点击红框内的按钮查看进度：

成功之后，可以通过分享这个 space 的链接，来实现在线演示。

ps: 如何找到自己创建过的 space。要通过点击头像，进入个人主页。

访问速度对比

这里做一个简单的测试，本例的 rgb2gray 是一个非常简单的函数，cpu 都能瞬间完成，下面分别测试 gradio 在代码存在本地时通过 localhost 和内网穿透以及代码在 hf space 下的处理速度。图片尺寸为 1280*853，浏览器为 firefox。

方式	时间（估计）	使用场景
localhost	0.4s	本地演示给自己或者旁边的人看
内网穿透	24s	有外部访问的需求，且本地有 gpu，能覆盖网速带来的负面影响
hf space	4s	有外部访问或者长时间保持服务的需求，可以购买 gpu 时长

可以看出，内网穿透最慢，localhost 最快。也可以理解，内网穿透的网络传输方式最复杂，受网速波动影响大。

api

除了 gradio 提供的 UI，也可以自己设计 UI，并利用 gradio 提供的 api 接口，实现模型推理。但是，当我按照文档的代码运行时，遇到了报错：

ConnectionResetError: [WinError 10054] 远程主机强迫关闭了一个现有的连接。

现在暂时未解决。

结语

记录了 gradio 的初级用法，并给出了不同场景下的使用方案。有了 gradio，深度学习模型部署变得省事多了。

前言​

gradio 本地运行​

huggingface space​

访问速度对比​

api​

结语​

前言

gradio 本地运行

huggingface space

访问速度对比

api

结语