一道衡量api价格的题,测试了几个网页版的LLM

题目

1.2元换一美元,价格为提示 $36 / 1M tokens,补全 $180 / 1M tokens
8元换一美元,价格为提示 $3 / 1M tokens,补全 $15 / 1M tokens
这两个价格相差多少

各方选手

刚刚忘了,补充了gpt的

省流

完全答对:海螺(纯纯的意外之喜,因为这个写的帖子)、GPT-4o(还得是GPT啊)
勉强算对:k0-math(只差一点)、DeepSeek-R1-Lite(是对的,但是只答了一半)
不对:Claude Haiku、Gemini Experimental 1121、GLM 4、GLM 4 Plus、通义千问、元宝、Kimi、DeepSeek

1. Claude Haiku

因为只是普号

2. Gemini Experimental 1121

来自AI Studio

3. GLM 4

4. GLM 4 Plus

5. 通义千问

6. 元宝

7. Kimi

8. k0-math

也是来自kimi

9. 海螺

10. DeepSeek

11. DeepSeek-R1-Lite

12. GPT-4o

3 Likes

gemini倒了??

看了这个贴,我搜了什么是海螺。第一次知道有这个。

所以谁算对了

6 Likes

忘了测试GPT的,也补上了

海螺和gpt-4o

不怎么看到,刚试了下感觉还行

Claude 3.5 Sonnet

没倒,gemini以为$是人民币

1 Like

提示后1114和1121能答对

1 Like

ai studio里没加 System Instructions,加上之后也能回答正确了,来自prompt的魔力太强了