Gemini 1.5 Pro击败GPT 4o,达到1300分


Chat with Open Large Language Models (lmsys.org)

7 个赞

代码能力怎么样

Gemini (0801) Category Rankings:

  • Overall: #1
  • Math: #1-3
  • Instruction-Following: #1-2
  • Coding: #3-5
  • Hard Prompts (English): #2-5

Gemini 1.5 Pro (Experimental 0801) #1 on Vision Leaderboard.

Gemini shows strong multilingual capability: #1 performance in Chinese, Japanese, German, Russian.

还不错编码不如Claude, GPT 和Llama3.1-405B

看了一下,在中文和德文单项狂拉分,特别是韩文,拉开了45分,下面是中文分数

Gemini-1.5-Pro-Exp-0801 1372

GPT-4o-2024-05-13 1338

Gemini-Advanced-0514 1332

2 个赞

比较奇怪的是,为什么他的测试数量比4o还多,好像4o是比他还要放出

Gemini 本来就很强,起码中文能力第一。你让他生成一个爆火的网络小说大纲,就能看出实力了。

感觉最近大模型更新好频繁,迭代好快

中文确实可以,写的小作文有官方的风格,排比对仗该有的都有

哎呦,能做对那道数学题了

1 个赞

深有体会,所以我个人也是用gemini多,就写材料而言,比GPT好用

感觉很牛逼

这个榜。。算了

虽然我觉得这个榜的数据不太靠谱,但是gemini1.5确实挺强

这个模型放给免费 API 了吗

卧槽,这个模型有点东西啊,我让他做了三道题,之前用gpt4o和claude3.5多多少少都会出错,但是我刚才试了一下这个模型,全部做对了, :scream: :scream: :scream:

给了,可以调用

gemini你们买多少钱一个月啊

API填啥?1.5pro一样的免费额度?


这是1.5pro exper自己和1.5pro的对比