AI大比拼.究竟谁才是强者?

请忽略模型中的版本号

:brain: OpenAI / ChatGPT 系列

  • gpt-o3-2025-04-16
  • gpt-o4-mini-2025-04-16
  • chatgpt-4o-latest-20250326
  • gpt-4.1-2025-04-14
  • gpt-4.1-mini-2025-04-14
  • gpt-4.1-nano-2025-04-14
  • gpt-4o-mini-2024-07-18
  • gpt-4o-2024-11-20
  • gpt-4o-2024-08-06
  • gpt-4o-2024-05-13
  • gpt-3.5-turbo-0125

:yellow_circle: Anthropic / Claude 系列

  • claude-3-7-sonnet-20250219
  • claude-3-7-sonnet-20250219-thinking-32k
  • claude-3-5-sonnet-2024102203-mini
  • claude-3-5-sonnet-20240620
  • claude-3.5-haiku-20241022
  • claude-3-haiku-20240307
  • claude-3-sonnet-20240229
  • claude-3-opus-20240229

:blue_circle: Google DeepMind / Gemini 系列

  • gemini-2.5-flash-preview-04-17
  • gemini-2.5-pro-exp-03-25
  • gemini-2.0-flash-001
  • gemini-2.0-flash-lite-preview-02-05
  • gemini-1.5-pro-002
  • gemini-1.5-flash-002
  • gemini-1.5-flash-8b-001
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001

:horse: Meta / LLaMA 系列

  • llama-4-maverick-03-26-experimentalgrok-3-preview-02-24
  • llama-4-maverick-17b-128e-instruct
  • llama-4-scout-17b-16e-instruct
  • llama-3.3-70b-instruct
  • llama-3.1-405b-instruct-bf16
  • llama-3.3-nemotron-49b-super-v1
  • llama-3.1-nemotron-ultra-253b-v1
  • llama-3.1-nemotron-70b-instruct
  • llama-3.1-70b-instruct
  • llama-3.1-8b-instruct
  • llama-3.1-nemotron-51b-instructgranite-3.1-8b-instruct
  • llama-3-70b-instruct
  • llama-3-8b-instruct

:dna: Mistral / Mixtral / Pixtral

  • mistral-large-2411
  • mistral-large-2407
  • mistral-small-24b-instruct-2501
  • mixtral-8x22b-instruct-v0.1
  • mixtral-8x7b-instruct-v0.1
  • pixtral-large-2411
  • pixtral-12b-2409
  • ministral-8b-2410

:dragon_face: Qwen 系列(阿里)

  • qwen3-235b-a22b
  • qwen3-30b-a3b
  • qwen3-32b
  • qwen-max-2025-01-25
  • qwen-plus-0125-exp
  • qwen2.5-vl-32b-instruct
  • qwen2.5-vl-72b-instruct
  • qwen2.5-plus-1127
  • qwen2.5-coder-32b-instruct
  • qwen2.5-72b-instruct
  • qwen2.5-72b-instruct (重复)
  • qwen-max-0919
  • qwen-vl-max-1119
  • qwen-vl-max-0809

:gem_stone: Gemma 系列(Google 开源)

  • gemma-3-27b-it
  • gemma-3-12b-it
  • gemma-3-4b-it
  • gemma-2-27b-it
  • gemma-2-9b-it
  • gemma-2-2b-it

:robot: DeepSeek 系列

  • deepseek-v3-0324
  • deepseek-rl

:rocket: xAI / Grok 系列

  • llama-4-maverick-03-26-experimentalgrok-3-preview-02-24 (同上)

:brain: MosaicML / Command 系列

  • command-a-03-2025
  • command-r-plus-08-2024
  • command-r-08-2024

:puzzle_piece: Amazon / Titan / Nova 系列

  • amazon-nova-pro-v1.0
  • amazon-nova-lite-v1.0
  • amazon-nova-micro-v1.0

:japanese_castle: 百度 / 文心豆包(Doubao)系列

  • doubao-1.5-pro-32k-250115
  • doubao-1.5-vision-pro-32k-250115

:ringed_planet: Phi 系列(微软)

  • phi-4

:microscope: Step 系列

  • step-2-16k-exp-202412
  • step-2-16k-202502
  • step-10-vision-32k-highres

:light_bulb: Yi / GLM 系列(智谱)

  • yi-lightningglm-4-plusglm-4-plus-0111

:brick: Granite 系列(IBM)

  • granite-3.1-8b-instruct
  • granite-3.1-2b-instruct

:brain: Jamba 系列(AI21 Labs)

  • jamba-1.5-large
  • jamba-1.5-mini

:brain: Reka 系列

  • reka-core-20240904
  • reka-flash-20240904

:microscope: C4AI / Aya 系列

  • c4ai-aya-expanse-32b
  • c4ai-aya-expanse-8b
  • c4ai-aya-vision-32b

:dna: Olmo 系列(Databricks)

  • olmo-2-0325-32b-instruct

:brain: Eureka 系列

  • eureka-chatbot

:brain: Codestral(Mistral 代码模型)

  • codestral-2405

:package: 其他/未归类模型

  • qwq-32b
  • p2l-router-7b

如果按智力来分,谁最强?

27 Likes

不要直接打例如chatgpt这样的答案,要注明版本号.

5 Likes

40 → 4o

8 Likes

无法确切,无法究竟

6 Likes

需要细分到什么领域?什么标准?应用场景?
就算是综合能力也需要各部分评判标准组合吧
各家排行榜上模型排名都天差地别,没有参考直接说最强,那没法给出确切答案的

7 Likes

我来看看

7 Likes

llama先排除

5 Likes

这事有确切答案的话 那直接垄断就完事了 :bili_001:
有种看果宝特攻也要知道谁最强的既视感

2 Likes

太复杂了

2 Likes

三大合体,果元天尊最强

1 Like

按智力来排

gemini冲冲冲

1 Like

果宝机甲,归位!
乒乒乓乓与敌人较量~ :tieba_001:

1 Like

Gemini大王来了:face_savoring_food:

1 Like

我们文心一言是最强的,没有之一,也不接受反驳:dotted_line_face:

2 Likes

各有优缺点吧

1 Like

不降智的话,openai还是综合最强吧

3 Likes

收费的和免费的也要区分一下吧。建议楼主先分一下。

1 Like

现在AI模型已经很多。未来会更多。但会不会趋于同质化?各家的拿手本事是啥?按理神经网络,深度学习的框架大家是不是都一样?那就取决于谁的样本多?

1 Like

迷茫了,不知道用哪个了

1 Like