“晾衣难题”击败GPT4? 看看基于Q_S3.5的Claude怎么说

StellaFortuna · 2024 年8 月 1 日 01:49

先上图:

看看我们家的Q_S3.5怎么说

所以看起来3.5真的没有想象中那么差他只是提示词太冗杂了而又确实无法达到想要的效果但的确可以把问题看得更透彻
他的确可以通过分析找出其他模型没有发现的细微差别比如词的转换

StellaFortuna · 2024 年8 月 1 日 01:50

我们可以明确的发现题目中一共提到了三个动作晾干晒干以及烘干这三者都是存在细微差别的

L71151 · 2024 年8 月 1 日 01:51

ProxyCN · 2024 年8 月 1 日 01:56

你是不是不上班？

StellaFortuna · 2024 年8 月 1 日 01:56

不上

handsome · 2024 年8 月 1 日 01:58

太强了吧

Flail7127 · 2024 年8 月 1 日 01:58

可恶

StellaFortuna · 2024 年8 月 1 日 02:01

不要为财所困

pengzhile · 2024 年8 月 1 日 02:01

太阳底下晒干不能叫做“烘干”

barrylongface · 2024 年8 月 1 日 02:02

deepseek

claude

这东西充分说明了用户给提示词的时候应该准确没有歧义，减少ai出错的几率。

StellaFortuna · 2024 年8 月 1 日 02:14

深度求索最终没有给出可能的时间呢大致的估计对于用户把握是很重要的

Nec · 2024 年8 月 1 日 02:50

claude3.5不用任何提示词直接问不就是正确答案了…

StellaFortuna · 2024 年8 月 1 日 03:01

是吗

zyy · 2024 年8 月 1 日 03:03

9.11和9.8谁大好多模型都回答不准确

StellaFortuna · 2024 年8 月 1 日 03:04

Cot对的概率是50% 前面对后面错或者前面错后面对

StellaFortuna · 2024 年8 月 1 日 03:05

新的提问方法是将数字用汉字表示出来九点一一和九点九哪个大

StellaFortuna · 2024 年8 月 1 日 03:05

混元大模型可以答对

neo · 2024 年8 月 29 日 06:03

From #develop:ai to 资源荟萃

话题		回复	浏览量
技巧：如何用一个提问区分Claude-3和GPT-4？资源荟萃人工智能	20	1105	2024 年8 月 29 日
claude 3.5 sonnet 还是比不过 gpt4o 资源荟萃 ChatGPT , 人工智能	8	1245	2024 年8 月 29 日
之前一直用的是chatgpt，以后可能要倒向claude了资源荟萃人工智能	8	1252	2024 年8 月 29 日
说一下claude 3.5和gpt4o的真实智力资源荟萃 ChatGPT , 人工智能	15	538	2024 年8 月 29 日
当chatgpt的GPTs功能遇到Q_S3.5 资源荟萃 ChatGPT , 人工智能	24	408	2024 年8 月 29 日