请问是哪里设置错了吗
可能是请求发的比较慢,可以观察下
- 你到 OWU 的请求耗时,重点是 /chat/completion 接口
- OWU 发起请求的耗时
这个是不是在hugging face日志里面可以看到
第一个看 Chrome 的日志哦,第二个没有很好的观察方式,如果有容器的话,可以进容器直接请求 OAI 得接口,或者接入 OpenTelemetry,当然这个成本就高了
这个先不管了,还有个问题,我在用cherry 调用站内公益gemini 2.5pro 模型时,发现上传的文件不可读,请问这是为什么呢?
我没用过 cherry 等其他佬友解答吧
好吧,感谢解答
我在国内服务器部署的也需要十秒左右才出首字,不理解原因。。。
卡的我不想用
此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。