大家体感deepseek对标chatgpt哪一个模型的水平？

shannon1024 · 2024 年12 月 16 日 07:02

感觉deepseek对中文文本的输出能力已经不差于gpt4o了

ves · 2024 年12 月 16 日 07:06

感觉中文（中华诗词方面的准确度）输出比4o要好

eugeneL · 2024 年12 月 16 日 07:08

之前测试是低速版的4omini，yilighting感觉超过4o但是上下文短

Suzu · 2024 年12 月 16 日 07:09

中文环境日用感受对标很简单，一涉及到中英以外的文化的内容就能看出来为什么GPT，Gemini，Claude是御三家了。可能很多人觉得那些小众文化圈不重要，但我认为ai的一大意义就是让人破除文化和语言的隔阂更方便了解各种信息。

Autrum · 2024 年12 月 16 日 07:11

是能说国产比较厉害，和国外的还是差点意思

passerby064857 · 2024 年12 月 16 日 07:17

deepseek中文能力肯定不如claude跟gemini，至於4o不清楚可能差不多吧。
感覺最近deepseek2.5更新前後智商沒有區別啊，只能等幾個月後的deepseek3了

user135 · 2024 年12 月 16 日 07:42

对不对标 4O 你就看这个问题

gemini 2.0 是 >= 4O 了

handsome · 2024 年12 月 16 日 09:04

约等于4o

purr · 2024 年12 月 16 日 18:37

你这问题是用来分辨4o和4o-mini的模型参数大点基本就能理解并回答并不能作为实际的能力参考
你的例子 gemini 2 能回答也只是因为 2 的模型肯定是比 4o-mini 大的…

purr · 2024 年12 月 16 日 18:40

至于deepseek我只能说就那样唯一优点就是便宜之前代码还行但是 qwen 的 coder 出来后就不行了人家甚至还是开源的
至于题主的感觉也没毛病因为这些模型就是为了日常任务训练的但如果稍微测一些比如数学或者其他怪东西就完全不行了
对标的话怎么说呢差不多就是没有同等创造力的 gpt-4o-2024-11-20 (注: gpt-4o-2024-11-20 是 4o 系列里最垃圾的模型为了省钱创意写作不错其他都拉毕竟小模型体感是比 0806 模型还小但日常任务调教更好了)

Nosd · 2024 年12 月 16 日 18:43

这么强啊！听说它好像挺便宜的，还没来得及探索呢

Nosd · 2024 年12 月 16 日 18:45

gemini也很强吗？还没用过呢

话题		回复	浏览量
Gemini 2 Flash 出思考版了，Arena上并列第一前沿快讯人工智能	22	851	2024 年12 月 20 日
用了几天gemini，发现数学和代码能力远不如o1模型。Google还需加油啊搞七捻三人工智能	27	798	2024 年11 月 25 日
gpt-4o-latest、claude-3-5-sonnet-latest和gemini-exp-1206哪个在编程问题方面效果最好开发调优快问快答	14	590	2024 年12 月 11 日
claude openai 智谱 deepseek gemini这几家ai,最强的模型是哪个? 搞七捻三快问快答 , 纯水	32	846	2024 年11 月 20 日
现在写代码哪个AI最好用？开发调优快问快答	35	1378	2024 年12 月 13 日

大家体感deepseek对标chatgpt哪一个模型的水平？

相关话题