几天用下来，大家感觉Claude 3.5 Sonnet和3 Opus相比如何？

ABcopilot · 2024 年6 月 25 日 00:00

除了响应速度确实快了，我个人测试的几个项目怎么感觉还不如之前的3 Opus？

个人案例包括几道逻辑测试题，一个几何题，一个文本总结任务。前面的测试题3.5 Sonnet有比3 Opus表现好的，但表现差一些的更多。几何题思路对了，但出现了一个以前不会出现的计算错误（乘除法算错了）。文本总结任务，3.5 Sonnet比3 Opus总结字数多了一些，但质量差一些，甚至出现了一个归类错误（ps. 论总结都远不如gemini 1.5 pro）

怎么感觉综合起来还没3 opus稳？3.5 Sonnet来自vertex的渠道，用大佬的项目转api出来用的。opus的测试结果则来自以前的you.com。

你们感觉呢？

handsome · 2024 年6 月 25 日 01:20

没有3.5sonnet

waffie · 2024 年6 月 25 日 02:08

文科明显不如opus了

Teda9 · 2024 年6 月 25 日 02:51

您是花钱接码搞帐号的吗，确实有必要去体验一下吗？
搞到帐号后续会不会容易被封？

bbb · 2024 年6 月 25 日 02:52

你正常使用封你干嘛…

ABcopilot · 2024 年6 月 25 日 02:56

你是问3.5 Sonnet？我是用的谷歌vertex ai那个试用的150美元赠金，然后用这个项目（链接）转api出来用的

nghon · 2024 年6 月 25 日 03:30

api和官网差距好像很大

Syferie · 2024 年6 月 25 日 03:34

感觉类似于4o和4的区别吧，4的智商个人感觉更高一些，但是4o快且便宜。

forrany · 2024 年6 月 25 日 04:33

同感

LanStarD · 2024 年6 月 25 日 04:36

来自官网TeamPro订阅/Aws Bedrock：3.5son逻辑完全高于3opus，还多了一个数据库更新的优势

Nec · 2024 年6 月 25 日 04:38

真感觉有点像买家秀卖家秀的区别一样，可能是官网的预置prompt更多，temperature或者其他参数有微调吧，而且还带了 Artifacts

mistpeak · 2024 年6 月 25 日 04:46

opus就是一个字，贵。在某些情况感觉网页版的Claude 3.5 Sonnet要比普号网页版的gpt4o要回答更好点，但是太抠了问几条就无了，gpt4o又是问多了可能会卡在某个bug上，刚好可以拿3.5Sonnet换个思路，结合一下刚好优势互补，话说要是这个能c就好了

errsa · 2024 年6 月 25 日 05:48

文科类的任务还得是Claude 3 Opus。

keung · 2024 年6 月 25 日 09:22

没错，写作还得用上opus

John-Wong · 2024 年6 月 25 日 09:36

我测试也感觉数学逻辑不如3 opus

kunte · 2024 年6 月 25 日 11:50

文科类任务，opus写得会更有创意一些，3.5输出非常稳定且重复

ABcopilot · 2024 年6 月 26 日 04:49

又试了了几个其他渠道，我现在是感觉vertex这个渠道的3.5 sonnet模型质量似乎有点问题，其他地方的表现都比它强，不论是官网还是其他api

Mikoto · 2024 年6 月 26 日 04:52

再3.5也是sonnet，建议等3.5opus出了再跟3opus比，模型大小差距没办法弥补吧。

ABcopilot · 2024 年6 月 26 日 05:48

主要是3.5sonnet便宜，要是能打opus的话就真香了

Thyself7816 · 2024 年6 月 26 日 05:56

我是官网付费的版本，我觉得3.5 Sonnet并不如 3 Opus

话题		回复	浏览量
claude官key支持3.5sonnet，但好像也就那样人工智能	19	580	2024 年6 月 24 日
再战挑战题！几乎只有3-Opus能做对的题，3.5-Sonnet能挑战成功吗？人工智能 Claude	7	428	2024 年6 月 21 日
Claude 3 系列还是有点太聪明了 - Sonnet + Opus + Haiku 智商评测 + 免费 Claude 3 API 全家桶人工智能 Claude3-opus , Claude-3-Sonnet , Claude-3-Haiku	61	2719	2024 年6 月 15 日
实测 Claude 3.5 Sonnet VS GPT-4o，最强大模型的宝座可能要易主了人工智能 chatgpt	26	1893	2024 年7 月 1 日
期盼claude opus的3.5版本！人工智能 chatgpt	2	290	2024 年6 月 24 日

几天用下来，大家感觉Claude 3.5 Sonnet和3 Opus相比如何？

相关话题