调用gemini 2.5 pro的API出现524错误

请教各位佬,我用cherry studio调用 openrouter 的【gemini-2.5-pro-preview-03-25】和【gemini-2.5-pro-exp-03-25:free】,简单的问题都能回答,问数学题的时候容易出现524错误,网上查不到。

我的最大token已经设置成65536了:
image

遇到需要很长时间推理的问题,会出现这个错误

但是我在google aistudio里问同样的问题,不会出现错误,请问是什么原因?

7 Likes

换个简单的数学题试试

2 Likes

没遇到524,但是发现这个模型很慢并且很容易吐字到一半卡住

1 Like

+1 经常卡着卡着就断了

1 Like

max token不是64000吗?

1 Like

用官方 API 的话,可以试试我写的 uni-api,独有的 keepalive 心跳机制规避 cloudflare 524 报错。

如果 openrouter 可能没办法规避这个报错。

4 Likes

我试一下,谢谢佬!

1 Like

佬,max token最大是65536

1 Like

API太容易断了,长时间思考的时候

简单的应该没问题

没办法
要么就保活, 要么就等谷歌开放思考过程
但是第二种应该不可能

简单没问题那就是token超了吧,cot的token数也算进去

在ai studio里问能行,可能ai studio调高了token?

官方的从来没见过524这种报错。。你能不能把你的prompt发我看看

【长期更新Wiki】语言模型区分题库:主要用来区分语言模型,也能测试逻辑能力 - 文档共建 - LINUX DO

题库里的一道题:设有理数数列 (x_1, x_2, \dots) 定义如下:(x_1 = \frac{25}{11}),且对于所有 (k) 有 [ x_{k+1} = \frac{1}{3}\left(x_k + \frac{1}{x_k} - 1\right). ] 其中 (x_{2025}) 可以表示为互质正整数 (m) 和 (n) 的分数 (\frac{m}{n})。求 (m+n) 除以 (1000) 的余数。

我刚试了openrouter,也是截断了,然后我去看了AI studio里思维链的token,嗯。。猜测openrouter内设的prompt字数不会少

嗯嗯,可能是这样的

佬,我试了你的uni-api, keepalive保活似乎对cloudflare小黄云不起作用,还是会返回524错误

应该是配置文件有问题,可以发一下最小可复现配置文件。

providers:

  • provider: Cherry
    base_url: http://172.17.0.1:3100/v1/chat/completions #new-api的本机docker地址
    api: sk-XXX

    model:

    • o1
    • o1-pro
    • gemini-2.5-pro-preview-03-25:with_thoughts
    • claude-3-7-sonnet-20250219-thinking
    • o3-mini-low
    • o3-mini-high
    • sonar
    • grok-3-mini-beta
    • claude-3-7-sonnet-20250219
    • sonar-pro
    • sonar-deep-research
    • text-embedding-3-large
    • gemini-2.5-pro-exp-03-25
    • grok-3-mini-fast-beta
    • grok-3-beta
    • sonar-reasoning
    • deepseek-r1
    • dall-e-3
    • sonar-reasoning-pro
    • grok-3-fast-beta
    • gpt-4.1-nano
    • gemini-2.0-flash-thinking-exp-01-21
    • gpt-4.1
    • gpt-4-turbo
    • gpt-4o-mini-search-preview-2025-03-11
    • gpt-4o-search-preview-2025-03-11
    • text-embedding-004
    • deepseek-v3
    • chatgpt-4o-latest
    • gpt-4o
    • gemini-2.5-pro-preview-03-25
    • o3-mini
    • gpt-4.5-preview
    • gemini-2.0-flash-exp
    • gemini-2.0-flash
    • gpt-4.1-mini
    • gpt-4o-mini
    • o3-mini-medium
    • text-embedding-3-small
      api_keys:
  • api: sk-XXX

preferences:
model_timeout:
default: 3600
cooldown_period: 300
rate_limit: 999999/min
keepalive_interval:
gemini-2.5-pro: 30
gemini-2.5-pro-exp-03-25: 30
o1: 30
o3-mini: 30
o3-mini-high: 30
o3-mini-low: 30
o3-mini-medium: 30
o1-pro: 30
error_triggers:
- The bot’s usage is covered by the developer
- process this request due to overload or policy