选择 ChatGPT(GPT-4o、o3……)还是 Gemini(Gemini 2.5 Pro Preview)?一些个人看法及体验

前言

本文仅为个人及一些朋友的观点,不代表所有人的使用体验。


C 端体验

ChatGPT 提供的各种工具和使用体验会比 Gemini 那边好(这里指的都是官网这种 C 端)。

比如 ChatGPT 搜索会有每一句话的引用来源,网页和客户端还有 GPT-4o 驱动的高级语音模式(Gemini 那边所谓的 Gemini 2.0 Flash 驱动的Gemini Live感觉完全就是 TTS,中文还很唐)

o3 驱动的深度研究也比 Gemini Advance 里 Gemini 2.5 Pro Preview 驱动的更加客观、多角度、深度,但 Gemini 2.5 Pro Preview 的深度研究可读性更好。看个人喜好吧。

主要还是 Gemini 2.5 Pro Preview 可以在 Google AI Studio 无限白嫖(只是对话用作训练数据),而且 Google One 里其他权益对国内用户没啥用(NoteBookLM 除外,这个是真有用!免费的只是比付费的额度少,你可以自己去试试)。

以上原因就导致 Google One 的价值几乎只剩下了 NoteBookLM Plus…… 我现在每天都忍不住往里面传点东西听疑似 Gemini 2.0 Flash 真正原生输出的相声播客。太好玩了!不过效果也确实挺好!


只看模型本身

编码

我们只谈模型的话,Gemini 2.5 Pro Preview 总体性能理论上是更好的,但它还是 不适合编码,因为它过于喜欢破坏性更改,啥都想推倒重来,特么我填好的环境变量它都给我删掉了!!!

如果你在使用 Windsurf 或者 Cursor 这种 AI IDE,平时可以用 GPT-4.1 处理绝大多数杂活,靠谱、省钱。

聊天、日常、通用

chatgpt-4o-latest(也就是 ChatGPT 里用的模型)是仅次于 GPT-4.5-Preview 这个马上就要下架的实验性超大参数模型的,对齐最好的模型。和它聊天很舒服,最有 “人情味儿”。

同时 GPT-4o 本身性能也还不错,非常适合完成各类日常任务。

而 Gemini 2.5 Pro Preview 作为一个推理模型,日常对话起来还是有点难等了!

长文本处理

Gemini 2.5 Pro Preview 是当之无愧的 No.1 !

  • 最能装东西:你甚至可以丢进《三体》三部曲,共 702k token,才占到它 1M 上下文的 70.2%
  • 最勤劳:只有它是真的会啥都干,毫不省略,超长文本说写就写
  • 最准确:丢进《三体》三部曲后随机抽查细节问题基本上都回答准确无误,比如水滴的发射时间、谁阻止了反物质子弹投入使用。这些问题只有投入小说原文才能作答,直接问是不能回答的,所以它确实是靠它的上下文关联能力作答的

中文输出表现、知识广度、指令遵循

Gemini 2.5 Pro Preview 在我看来是海外模型里最懂中文的模型,要语感有语感,要低幻觉有低幻觉。指令遵循能力也很强大(毕竟是推理模型),指哪打哪。

它的世界知识非常非常非常非常非常广泛,中文热梗,甚至是米家游戏剧情内容(知识截止日期之前的基本90%以上都能说对,只有它能做到)都不在话下!就算遇到不懂的,也可以给它提供 Grounding with Google Search 工具来进行谷歌搜索辅助输出。

相比之下,GPT-4o 在这方面的表现就一般般,到现在说的中文还是带点儿味儿,知识截止日期也没有Gemini系列更新快。(好吧,虽说 OpenAI 确实也比不过谷歌这个全球最大的搜索引擎能爬就是了……)

音视频理解

Gemini 2.5 Pro Preview 展现出了惊人的音视频理解能力:它可以像正常人类(甚至比绝大多数普通人好得多)一样理解并赏析音乐,它甚至理解哪里是 “抓耳的”!

这是我觉得这模型最酷的地方!

下方展示了 Gemini 2.5 Pro Preview 对三首歌/曲的理解效果,文件名是歌/曲,名:

视频方面,它可以理解视频内容、输出视频字幕、翻译、总结。好吧,这个大家可以自己去 Google AI Studio 试试,很有趣,也非常有用!

图像识别

绝大部分时候 Gemini 2.5 Pro Preview 有最强大的图像识别能力(无论是OCR还是语义理解)

小部分时候 GPT-4o 会更好。

翻译

Gemini 2.5 Pro Preview 拥有我个人认为的最强大的翻译性能(得益于谷歌作为全球最大搜索引擎,为它爬来了超超超超级广泛的世界知识,同时它还是个推理模型,所以效果会更好)。

但有时候可能在短文本翻译的情况下输给拥有更多地道中文语料的 DeepSeek V3(不过,它在长文本下很容易出现漏翻、选择性翻译、不遵循指令的情况……)


总结

所以…… 如果你更注重模型性能,那完全可以在 Google AI Studio/API 里无脑使用 Gemini 2.5 Pro Preview。

但毕竟它是一个推理模型,日常对话还是有点难等,这时候就轮到均衡而通人性的 GPT-4o 大展身手了!

你要问我哪家 C 端套餐更值得订阅,那我肯定推荐 ChatGPT Plus,理由见开头!


居然忘了说 o3 了!

它在 ChatGPT 里毕竟有全套工具可以调用,如果你要进行数据分析或结合网络内容,那它还是要比 Gemini 2.5 Pro Preview 更方便的(API 的话就没有优势了)

可惜 o3 和 R1 等一样,幻觉率还是有点高了,要注意向它提供数据/网络搜索结果进行辅助。

o3 也不太适合编码,效果和无敌破坏王 Gemini 2.5 Pro Preview 不好说哪个更抽象。

141 Likes

gemini经常性的把各种变量自己修改,很恶心

57 Likes

爱了,Oscar的总结总是很实用。

编码基于个人经验我可以补充个点,新项目的话,用2.5pro生成规划会很好,是非常合格的planner。初稿也可以用它完成,一次性给出长输出多文件,这种哐的一下完成多个代码文件,体验很不错的。后续代码更新,性价比上4.1,极致追求上3.7,在有2.5pro规划的指导下,完成的都很棒。

64 Likes

planner是什么,类似于改动时间表吗,规划在哪里改动,怎么改?

52 Likes

w,Gemini能免费

55 Likes

Hummm……代码agent是可以分成多个不同角色的,我个人常用的是 Plan and solve 模式。一个负责项目初期根据需求搭建项目框架,一个根据框架填写代码。

有点类似提纲和文章的关系。

这个模式是比较简单的,适合小项目。复杂一点可能会涉及到 replanner 等更多角色。如果感兴趣可以找找相关资料,分角色能发挥不同 LLM 的优势。我个人觉得还是蛮有用的。

47 Likes

懂了,两个都要,看场景分别翻盘子

5 Likes

gemini和gpt貌似破坏性都很强,太坑了

1 Like

佬总结的太好啦,简直AI届的影视飓风啊:heart::heart::heart:

4 Likes

不降智的ChatGPT体验是绝对最棒的。日常话题聊天也远胜Gemini和Claude的体验。图片内嵌、引用标注等等,反正就是很棒,去年5月份刚出4o的时候,觉得很辣鸡,迭代了快1整年了,确实体验无敌。

7 Likes

gemini有个奇怪的问题,从1.5到2.5都有,就是不会mermaid语法
我说的不是graph LR 或者 graph TD 那种非常简单的mermaid脑图(当然这种图gemini也经常画错),我说的是能体现各个节点之间联系的脑图,类似于Obsidian的local graph和cmap。
我的工作流需要gemini每次画5-6个简单的mermaid脑图加1个复杂的mermaid脑图,然后gemini每次都是全军覆没。我目前的解决方法是把gemini画完的扔给sonnet 3.7修复。
那为啥gemini画mermaid有问题,还要让他画呢?因为其他模型画的都不行,gemini姿势语法有问题,内容是没有问题,真正能体现各种概念之间互联互通的只有gemini

2 Likes

GPT 的 C 端确实是非常值的,然而就是降智比较恶心。

5 Likes

佬,想问一下,这两个模型哪个算法比较强啊?如果是gpt的话,怎么才能使用到不降智的,自己单开一个太贵了,之前使用其他人的合租,体验一言难尽,非常差,基本的算法都讲不明白,而且对话框里面还有日语等等其他人 :sweat_smile: :smiling_face_with_tear:还浪费了我的35大洋。

昨天第一次使用Gemini,讲基础算法非常好,特别详细而且很容易理解

我全都要.jpg

1 Like

必须是gemini

1 Like

cursor里面的4.1读代码太慢了

Gemini世界知识比较广泛,还是用它吧

好的,也问过deepseek,使用的api,结果字非常多,核心可能就几十个字,非要输出几百个字,把人都整懵

1 Like

收到,感谢佬友