4o mini 图文对话的 token 消耗为什么那么大

zhong_little · 2024 年12 月 10 日 12:30

首先搬一个自己的解答帖，关于 4o mini 图文对话的 token 消耗为什么那么大

相同的图片和提问，输入 token 相差却大得惊人：

尽管看着很离谱，但这确实是按照官网的计费规则来的，因为 4o mini 的图片 token 计数 base 特别高，导致相同的图片，（输入）消耗的实际 money 甚至比 4o 还要贵一倍

很多前端都有标题生成、历史总结的默认功能，并且多数把 4o-mini 作为默认模型。在多模态模型越来越普遍的情况下，如果 4o mini 的图片计费没有下降，那 4o mini 用来总结上下文的性价比就会变低。

那不如就把这个基础任务模型换成一些更实惠的多模态模型吧，比如这两天刚放出来的 glm-4v-flash 免费 api。当然还有各家大善人们提供的免费 api 也可以考虑进来：gemini 的 flash 模型、groq 的 llama 3.2-90b-vision、mistral 的 pixtral-large、…

欢迎大家补充更多免费的多模态 api

WyInnovate · 2024 年12 月 10 日 12:46

感谢分享！！！

handsome · 2024 年12 月 10 日 13:34

glm那个你试过了吗？

iberxilong · 2024 年12 月 10 日 13:59

又学到一个新知识！！

Undefined_Lee · 2024 年12 月 10 日 14:08

确实离谱。。

hanka · 2024 年12 月 10 日 14:19

4o-mini 作为默认模型

我一般是glm-4-flash做默认的（openwebui），速度快，免费
并发自己也够了

zhong_little · 2024 年12 月 12 日 07:50

4v-flash 不好用，参数有限制，图片数量有限制，还是 gemini 大方爽快

handsome · 2024 年12 月 12 日 07:55

是哇？那gemini走起了

话题		回复	浏览量
智普大善人又开始搞事了前沿快讯	22	1012	2024 年12 月 11 日
GLM-4v-Flash官方视觉模态API开放免费调用福利羊毛	21	616	2024 年12 月 16 日
Gemini-2.0-flash-exp：最适合日常使用的视觉识别大模型，包含实际测试结果资源荟萃	47	2398	2024 年12 月 18 日
gemini-2.0-flash-exp免费额度这么多，能做什么开发调优人工智能 , 快问快答	72	2419	2024 年12 月 24 日
智谱 AI 获得 30 亿元融资，2024 年商业化收入翻倍前沿快讯	30	583	2024 年12 月 17 日

4o mini 图文对话的 token 消耗为什么那么大

相关话题