感觉ds的惊艳也是在于低成本做到了gpt4差不多的水平,grok3跟Claude3.7也属于渐进式的发展,谈不上很惊艳
32 Likes
o1-preview,当时真是惊为天人
7 Likes
3.7 还不惊艳啊?
3 Likes
第一個思考模型o1
3 Likes
claude3.5Sonnet,当时从降智4o换过来,简直不要太好用
Claude 3.7(审美好)、O1(推理模型)、Deepseek R1(用小成本换来高质量)
1 Like
Deepseek-r1很惊艳,第一个把推理过程完整展现的模型
2 Likes
感觉比3.5进步很大,但没有那种跨代的感觉
1 Like
3.7 最大128k的输出,简直独步天下
r1,第一个成本降到了能爽用的推理模型
很惊艳
1 Like
R1,没想到一个中国做出来的思考模型,展示思考过程,网页端甚至是免费的
1 Like
gemini 1.5 pro
超长上下文,多模态音频视频输入
然而惊艳是一回事,实用是一回事,大模型最重要还是文字的解决问题的能力
r1,
不是说性能什么的,这些还是次要不然就说o1了
思考过程非常有趣,像人
大模型逐渐变得无趣而且工具化的一个例外
qwen2.5的7b/14b以及他们对应的视觉版本
真正能本地跑的模型
4omini的跑分,超越3.5t的综合水平
7b算是手机能跑的最大大小,同尺寸
只有qwen和其他
sakura 1.0 14b
基于qwen2.5 14b
唯一一个我有理由本地跑的模型
日语(主要是acg包括r18)的翻译水平依旧能和
目前的sota模型扳扳手腕
claude呀
除了Deepseek还有谁
那个天问max非常不错
1 Like
不降智的o1 pro,没有之一,ds只是把推理模型的成本打下来了
1 Like
OpenAI的DeepResearch (o3 agent) 太惊艳了
中华美食.pdf (878.7 KB)
2 Likes
这个是直接生成的?有点强
Qwen-Max:对对,你说的对
gemini 超长上下文第一次给我无限自由的感觉