老友们一般选择什么框架封装大模型并提供API服务?

FastAPI 、Flask还是Java环境?目前接触的很多开源项目都使用的Gradio ,但是生产上好像还得选型。

2 Likes

试试我写的 uni-api:

3 Likes

都行啊,熟悉什么用什么;反正底层也是调用大模型的 API

较为成熟, 我二开 new-api 的, 很听劝, 合理的需求肯定会做

1 Like

用的FastAPI

用来Auto调度

FastAPI,vLLM 和 SGLang 都选择了 FastAPI