先看优化效果!(测试模型:Gemini 2.0 Flash)
优化前的Gemini输出,大段大段吐字,观感很差:
优化后转为逐字符输出,观感非常流畅且丝滑:
界面美观、功能完善的Web管理页面:
Github项目仓库(求Star):
Cloudflare Workers代码:
变量:
PROXY_API_KEY
=代理APIKEY,同时也是Web管理页的登录密码
KV:创建新的KV,绑定名为
CONFIG_KV
请如图配置变量与KV绑定
功能:
API多合一
- 支持添加OpenAI、Anthropic、Google Gemini格式的API
- 支持添加多个OpenAI API
- 统一转为OpenAI格式API
- 可绑定域名实现免代理访问
智能流式输出优化
- 将大型响应块分解为逐字符输出
- 基于响应块大小和时间间隔智能调整字符间延迟
自适应延迟算法
- 检测响应数据块大小:块越大,字符延迟越小
- 监控响应时间间隔:间隔越长,字符延迟越大
- 确保输出平滑自然,没有明显停顿
剔除 Cloudflare 自带 fetch 的多余请求头
- 使用ShadowFetch替换Cloudflare的Fetch方式
- 确保请求上游API时不会带有Cloudflare添加的其他请求头
- 支持对单个API设置启用或关闭原生Fetch以适配更多使用情景
Web API管理页面
- 支持通过Web管理页面调整API设置
- 访问workers域名根目录即为Web管理页面
- Web管理页面登录密码为变量
PROXY_API_KEY
支持/v1/models
路径获取所有API的模型列表
欢迎佬友测试并给出修改建议!!!
注意:在2025/3/5
的大更新中对变量有较大调整,请务必在更新后重新进入Web管理页面进行重新设置!!!
注意:在2025/3/5
的大更新中对变量有较大调整,请务必在更新后重新进入Web管理页面进行重新设置!!!
注意:在2025/3/5
的大更新中对变量有较大调整,请务必在更新后重新进入Web管理页面进行重新设置!!!
希望大家能在评论分享自己觉得好用的流式优化配置哦