在 Cherry 里使用 gemini-2.5-pro 测试 Jaeger 的 Fetcher MCP,Cherry 调用了三次 api,在第三次请求中当前 user 内容重复出现了三次,如果这条内容 token 多的话还是挺浪费的
1 个赞
mcp和function call类似,如果ai需要调用工具的话会告诉前端,再由前端调用function获得结果后再发送请求返回给ai,看似只是一次对话,实际这个过程中会产生多个请求。ai本身不会记录与你对话的上下文,中间请求保留上下文信息的方式就是靠重复发送已有的对话内容,也就是你看到的user内容被重复发了多次。不过大模型推理有命中缓存的说法,可能虽然重复了多次,但实际的消耗没想象的那么多?
1 个赞
可是已经自动调用了三次 api,是第三次请求中内容重复三次诶
佬友,请问你是用的什么软件抓的包
1 个赞
看着是 cloudflare ai gateway,可以免费用,把过程中的请求输入输出拦截记录下来,挺好用的。
2 个赞
感谢佬