前言
本文仅为个人及一些朋友的观点,不代表所有人的使用体验。
C 端体验
ChatGPT 提供的各种工具和使用体验会比 Gemini 那边好(这里指的都是官网这种 C 端)。
比如 ChatGPT 搜索会有每一句话的引用来源,网页和客户端还有 GPT-4o 驱动的高级语音模式(Gemini 那边所谓的 Gemini 2.0 Flash 驱动的Gemini Live感觉完全就是 TTS,中文还很唐)
o3 驱动的深度研究也比 Gemini Advance 里 Gemini 2.5 Pro Preview 驱动的更加客观、多角度、深度,但 Gemini 2.5 Pro Preview 的深度研究可读性更好。看个人喜好吧。
主要还是 Gemini 2.5 Pro Preview 可以在 Google AI Studio 无限白嫖(只是对话用作训练数据),而且 Google One 里其他权益对国内用户没啥用(NoteBookLM 除外,这个是真有用!免费的只是比付费的额度少,你可以自己去试试)。
以上原因就导致 Google One 的价值几乎只剩下了 NoteBookLM Plus…… 我现在每天都忍不住往里面传点东西听疑似 Gemini 2.0 Flash 真正原生输出的相声播客。太好玩了!不过效果也确实挺好!
只看模型本身
编码
我们只谈模型的话,Gemini 2.5 Pro Preview 总体性能理论上是更好的,但它还是 不适合编码,因为它过于喜欢破坏性更改,啥都想推倒重来,特么我填好的环境变量它都给我删掉了!!!
如果你在使用 Windsurf 或者 Cursor 这种 AI IDE,平时可以用 GPT-4.1 处理绝大多数杂活,靠谱、省钱。
聊天、日常、通用
chatgpt-4o-latest(也就是 ChatGPT 里用的模型)是仅次于 GPT-4.5-Preview 这个马上就要下架的实验性超大参数模型的,对齐最好的模型。和它聊天很舒服,最有 “人情味儿”。
同时 GPT-4o 本身性能也还不错,非常适合完成各类日常任务。
而 Gemini 2.5 Pro Preview 作为一个推理模型,日常对话起来还是有点难等了!
长文本处理
Gemini 2.5 Pro Preview 是当之无愧的 No.1 !
- 最能装东西:你甚至可以丢进《三体》三部曲,共 702k token,才占到它 1M 上下文的 70.2%
- 最勤劳:只有它是真的会啥都干,毫不省略,超长文本说写就写
- 最准确:丢进《三体》三部曲后随机抽查细节问题基本上都回答准确无误,比如水滴的发射时间、谁阻止了反物质子弹投入使用。这些问题只有投入小说原文才能作答,直接问是不能回答的,所以它确实是靠它的上下文关联能力作答的
中文输出表现、知识广度、指令遵循
Gemini 2.5 Pro Preview 在我看来是海外模型里最懂中文的模型,要语感有语感,要低幻觉有低幻觉。指令遵循能力也很强大(毕竟是推理模型),指哪打哪。
它的世界知识非常非常非常非常非常广泛,中文热梗,甚至是米家游戏剧情内容(知识截止日期之前的基本90%以上都能说对,只有它能做到)都不在话下!就算遇到不懂的,也可以给它提供 Grounding with Google Search 工具来进行谷歌搜索辅助输出。
相比之下,GPT-4o 在这方面的表现就一般般,到现在说的中文还是带点儿味儿,知识截止日期也没有Gemini系列更新快。(好吧,虽说 OpenAI 确实也比不过谷歌这个全球最大的搜索引擎能爬就是了……)
音视频理解
Gemini 2.5 Pro Preview 展现出了惊人的音视频理解能力:它可以像正常人类(甚至比绝大多数普通人好得多)一样理解并赏析音乐,它甚至理解哪里是 “抓耳的”!
这是我觉得这模型最酷的地方!
下方展示了 Gemini 2.5 Pro Preview 对三首歌/曲的理解效果,文件名是歌/曲,名:
视频方面,它可以理解视频内容、输出视频字幕、翻译、总结。好吧,这个大家可以自己去 Google AI Studio 试试,很有趣,也非常有用!
图像识别
绝大部分时候 Gemini 2.5 Pro Preview 有最强大的图像识别能力(无论是OCR还是语义理解)
小部分时候 GPT-4o 会更好。
翻译
Gemini 2.5 Pro Preview 拥有我个人认为的最强大的翻译性能(得益于谷歌作为全球最大搜索引擎,为它爬来了超超超超级广泛的世界知识,同时它还是个推理模型,所以效果会更好)。
但有时候可能在短文本翻译的情况下输给拥有更多地道中文语料的 DeepSeek V3(不过,它在长文本下很容易出现漏翻、选择性翻译、不遵循指令的情况……)
总结
所以…… 如果你更注重模型性能,那完全可以在 Google AI Studio/API 里无脑使用 Gemini 2.5 Pro Preview。
但毕竟它是一个推理模型,日常对话还是有点难等,这时候就轮到均衡而通人性的 GPT-4o 大展身手了!
你要问我哪家 C 端套餐更值得订阅,那我肯定推荐 ChatGPT Plus,理由见开头!
居然忘了说 o3 了!
它在 ChatGPT 里毕竟有全套工具可以调用,如果你要进行数据分析或结合网络内容,那它还是要比 Gemini 2.5 Pro Preview 更方便的(API 的话就没有优势了)
可惜 o3 和 R1 等一样,幻觉率还是有点高了,要注意向它提供数据/网络搜索结果进行辅助。
o3 也不太适合编码,效果和无敌破坏王 Gemini 2.5 Pro Preview 不好说哪个更抽象。