老友们觉得gpt4之后到目前为止有什么让你觉得很惊艳的模型吗?

感觉ds的惊艳也是在于低成本做到了gpt4差不多的水平,grok3跟Claude3.7也属于渐进式的发展,谈不上很惊艳

32 Likes

o1-preview,当时真是惊为天人

7 Likes

3.7 还不惊艳啊?

3 Likes

第一個思考模型o1

3 Likes

claude3.5Sonnet,当时从降智4o换过来,简直不要太好用

Claude 3.7(审美好)、O1(推理模型)、Deepseek R1(用小成本换来高质量)

1 Like

Deepseek-r1很惊艳,第一个把推理过程完整展现的模型

2 Likes

感觉比3.5进步很大,但没有那种跨代的感觉

1 Like

3.7 最大128k的输出,简直独步天下 :tieba_087:

r1,第一个成本降到了能爽用的推理模型

很惊艳

1 Like

R1,没想到一个中国做出来的思考模型,展示思考过程,网页端甚至是免费的

1 Like

gemini 1.5 pro
超长上下文,多模态音频视频输入
然而惊艳是一回事,实用是一回事,大模型最重要还是文字的解决问题的能力

r1,
不是说性能什么的,这些还是次要不然就说o1了
思考过程非常有趣,像人
大模型逐渐变得无趣而且工具化的一个例外

qwen2.5的7b/14b以及他们对应的视觉版本
真正能本地跑的模型
4omini的跑分,超越3.5t的综合水平
7b算是手机能跑的最大大小,同尺寸
只有qwen和其他

sakura 1.0 14b
基于qwen2.5 14b
唯一一个我有理由本地跑的模型
日语(主要是acg包括r18)的翻译水平依旧能和
目前的sota模型扳扳手腕

claude呀

除了Deepseek还有谁

那个天问max非常不错

1 Like

不降智的o1 pro,没有之一,ds只是把推理模型的成本打下来了

1 Like

OpenAI的DeepResearch (o3 agent) 太惊艳了
中华美食.pdf (878.7 KB)

2 Likes

这个是直接生成的?有点强

Qwen-Max:对对,你说的对 :tieba_087:

gemini 超长上下文第一次给我无限自由的感觉