大家体感deepseek对标chatgpt哪一个模型的水平?

感觉deepseek对中文文本的输出能力已经不差于gpt4o了

21 个赞

感觉中文(中华诗词方面的准确度)输出比4o要好

之前测试是低速版的4omini,yilighting感觉超过4o但是上下文短

1 个赞

中文环境日用感受对标很简单,一涉及到中英以外的文化的内容就能看出来为什么GPT,Gemini,Claude是御三家了。可能很多人觉得那些小众文化圈不重要,但我认为ai的一大意义就是让人破除文化和语言的隔阂更方便了解各种信息。

2 个赞

是能说国产比较厉害,和国外的还是差点意思

deepseek中文能力肯定不如claude跟gemini,至於4o不清楚可能差不多吧。
感覺最近deepseek2.5更新前後智商沒有區別啊,只能等幾個月後的deepseek3了

对不对标 4O 你就看这个问题

gemini 2.0 是 >= 4O 了

1 个赞

约等于4o

你这问题是用来分辨4o和4o-mini的 模型参数大点基本就能理解并回答 并不能作为实际的能力参考
你的例子 gemini 2 能回答也只是因为 2 的模型肯定是比 4o-mini 大的…

1 个赞

至于deepseek我只能说 就那样 唯一优点就是便宜 之前代码还行 但是 qwen 的 coder 出来后 就不行了 人家甚至还是开源的
至于题主的感觉 也没毛病 因为这些模型就是为了日常任务训练的 但如果稍微测一些比如数学 或者其他怪东西 就完全不行了
对标的话 怎么说呢 差不多就是没有同等创造力的 gpt-4o-2024-11-20 (注: gpt-4o-2024-11-20 是 4o 系列里最垃圾的 模型为了省钱 创意写作不错 其他都拉 毕竟小模型 体感是比 0806 模型还小 但日常任务调教更好了)

1 个赞

这么强啊!听说它好像挺便宜的,还没来得及探索呢

gemini也很强吗?还没用过呢