【近全军覆没】你的模型能数清楚鸡蛋吗？

iwj · 2025 年1 月 1 日 09:50

如图所示，已知（搜集自评论区）
o1
Grok2
Claude3-5
GPT 4o
Gemini 2
超级小爱
腾讯混元
QWEN2

centaur

pixtral-large-2411

gpt-4o-2024-05-13
claude-3-5-sonnet-20241022 :
gremlin
chatgpt-4o-latest-20241120
nvila-internal-15b-v1
amazon-nova-lite-v1.0
Gemini 2.0 Flash Thinking1219 （不稳定）
Gemini 1206 （不稳定）
Gemini 1.5 PRO （不稳定）
kimi视觉版（不稳定）
豆包（不稳定）
deepseek-vl2
GLM-4

正确答案：15 个

handsome · 2025 年1 月 1 日 09:51

o1试过吗？感觉gemini会好一点？

SB_Fantast · 2025 年1 月 1 日 09:54

gemini不行

yrjjun · 2025 年1 月 1 日 10:01

超级小爱×

joegodwanggod · 2025 年1 月 1 日 10:02

九時之約已到

iwj · 2025 年1 月 1 日 10:03

强啊兄弟

yrjjun · 2025 年1 月 1 日 10:03

神奇，gemini2数不对，gemini1.5数的对

iwj · 2025 年1 月 1 日 10:03

2.0 是极速模型吧，为了快？

joegodwanggod · 2025 年1 月 1 日 10:04

因為那個是flash不是pro

myli · 2025 年1 月 1 日 10:06

kimi视觉版

joegodwanggod · 2025 年1 月 1 日 10:07

啊

maoliang · 2025 年1 月 1 日 10:09

gemini-2.0-flash-exp

iwj · 2025 年1 月 1 日 10:11

难道是 studio温度参数不一样？

yrjjun · 2025 年1 月 1 日 10:11

gemini1.5 pro不稳定示例+1

iwj · 2025 年1 月 1 日 10:11

有什么参数调过吗

yrjjun · 2025 年1 月 1 日 10:12

不知道的gemini几成功

joegodwanggod · 2025 年1 月 1 日 10:13

都是1.

Qiner · 2025 年1 月 1 日 10:15

Gemini 1206 毫无压力

wwow · 2025 年1 月 1 日 10:17

原来这就是AI啊。。。不对，这不是很久之前就有了吗，我记得，难道我时空错乱，记错了

Xcating · 2025 年1 月 1 日 10:17

o1

话题		回复	浏览量
一个非常有意思的AI测试，大家可以测试一下，豆包满分。搞七捻三人工智能	37	1632	2024 年12 月 28 日
大好消息：Gemini 2.0 Flash Exp已开放API调用！前沿快讯 API , Gemini , 人工智能	74	1854	2024 年12 月 12 日
谷歌推出Gemini-Exp-1114，免费开放使用前沿快讯 Google , Gemini , 人工智能	116	4862	2024 年12 月 20 日
一道题搞趴所有人工智能（4o除外）搞七捻三人工智能 , 快问快答 , 纯水	54	663	2025 年1 月 6 日
Flash模型识图能力PK:GLM vs Gemini 搞七捻三 Gemini , 人工智能 , 智谱清言 , 纯水	15	609	2024 年12 月 11 日

【近全军覆没】你的模型能数清楚鸡蛋吗？

相关话题