claude 3.5 sonnet (cursor 白嫖版) 依然是我用过最智能的LLM

在下是医學相關的.

有個病叫 moebius syndrome.

是第7面神經有問題, 但他又不是平常的形式(上神經元/下神經元).

直接問的話 chatgpt4, claude 3.5 sonnet, deepseek v3 都不知道.

可是我把 一份論文上傳后.

gpt4, deepseek v3 依然自己說自己的,
只有 claude 3.5 sonnet 有反省:

其他兩個在我把c3.5 的回答則上后,
他們才知道自己錯了.

貼論文后各LLM 第一個回答:
c3.5:

gpt4:


deepseekv3:

可是c3.5 一般reply 都很短. 唯有gpt4 配c3.5 用.

11 Likes

那必须啊!

2 Likes

试试gemini的thinking模型呢

1 Like

试试在提示里加入这句“use max tokens”,有时候有奇效。

镜像站这句话有用吗?

哇哦,好厉害⊙0⊙

gensark 的 o1-preview 也很不错, 能从上千行代码中找到一个小错并修正

2 Likes

大佬这个完全看不懂

试试看 :thinking:

Claude 在实用方面一直很强,专业性越强越厉害,早期的训练数据就是以专业性数据为主的。

1 Like

白嫖版?在哪里嫖

但早幾日說gpt4 是 17T token?

c3.5 sonnet 才 700billion?

他这个模型是真的。我测过

大佬,在哪白嫖的?生物狗也很需要

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。