原创长文,首发于L站
欢迎转载,请保留作者和原文链接
因为各模型包月限量经常变动,如有不符,感谢留言更正
什么是限量?
大模型是生意
毛利 = 包月价格 - 减渠道抽成 - 用户月总消耗token×API成本
月总消耗token = ①单位时间次数限制 × 时间 × ②上下文窗口 × 平均浪费率(重置时间越短浪费率越高)
上面公式一共7个变量,其中5个变量是基本固定的,因此控制你的总用量,尽量增加毛利,主要取决于对下面两个变量进行限量
①单位时间次数限制
②上下文窗口=最大输入+最大思考长度+最大最终输出。这个限量是很多人都没意识到的
尤其是最大思考长度,直接影响智力水平
限量重置时间是怎样计算的?
Ⓐ从最后一次重置之后,第一次用的时间起××小时:常见,GPT等
这有个小技巧,比如gpt高级语音是24小时重置,你如果打算晚上20点用来练口语,就要第二天20点重置,但如果你早上8点一下语音然后退出,就可以第二天早上8点重置,相当于提前了12个小时。
其他模型同理
Ⓑ每天固定时间重置:常见,例如某中转站是每天早上8点重置
Ⓒ从第一次用起××小时内最后一个整点:比较少见,例如Claude是4~5小时整点
Ⓓ每月付款日重置
为什么很多模型的限量不透明?
OpenAI带头,各大公司故意搞限量不透明,就是对限量不做任何官方说明
Ⓐ因为加入新模型,老模型可能缩减或下架,如果明示限量就是一种商业承诺,不明示就是不承诺,增减限量官方说的算
Ⓑ应对竞争对手的政策,随时可能调整限量
Ⓒ服务器紧张时,官方有权利降低限量,但一般不会这样做
Ⓓ以后可能用缩减限量作为降智的一种手段(现在并没有用到)
为什么Chat的上下文窗口和最大输出通常远少于API?
因为Chat是包月的,上下文越多,官方越亏。API是你自己花钱,上下文越多,官方赚的越多
在商言商,包月这种收费方式就决定了,绝大部分的Chat版,不管免费还是收费,上下文,最大思考,最大输出都不太可能是满血版,只有$200这种会员或者Enterprise版本,才会给与API一样的满血版上下文长度。
如果你的工作特别在乎上下文长度和最大输出,比
如整本书翻译,要么用API,要么用$200会员,或者来自$200会员的逆向
限量的浪费率问题
所有包月都存在严重浪费,
实际上这些包月服务,可能80%的限量,都是被浪费掉的,官方赚的就是这个浪费沉淀的钱。
如果你能每天把限量基本都用光了,按照API计价,价值肯定是包月月费的好几倍,官方铁定是亏的。
①重置时间间隔短,很容易造成浪费。间隔越短,浪费率越高
浪费率:2小时重置(grok) > 3小时(4o@$20) > 5小时(claude) > 1天(Chat01/高级语音@$20,多数Chat@$0) > 1周(o1@$20) > 一个月(Deep research)
②节省心理,造成"劣币驱逐良币"
比如gpt $20会员里,一般的问题尽量用4o,不舍得用有限量的推理模型。对话优先用标准语音,不舍得用高级语音。结果重置时间到了,攒了一堆推理模型,高级语音没用掉,在deadline前胡乱问一些问题都来不及消耗掉
有跟我一样的人吗?
模型官网的限量
GPT限量
250304更新
OpenAI的限量是最复杂,最不透明的,而且经常调整
免费会员:4o每三小时10次,o3-mini每天10次,4omini不限量
未来计划deep research每月2次
$20plus会员:见下图
$200pro会员:见下图
另外有佬友说,$200的o1pro并不是真的无限,大概每天能用100多次,再多就容易触发降智
佬友LostMyHead说,$20plus和$30team会员,4.5限量是每周50次
ChatGPT剩余次数查询插件:https://chromewebstore.google.com/detail/chatgpt-degrade-checker-降/inidgeckbobnafenlmlgfbeoijiamepm
不同的会员,上下文和最大输出也不同
大多数人可能不知道,官方也很少提及(有故意误导嫌疑),ChatGPT相同模型不同会员的上下文窗口,最大思维链,最大输出都是差距巨大的
$200会员:官方说所有模型都是128kt上下文,最大输出根据各模型
我实测Deep research最终输出最大66k+,一般20k左右(不含思维链)
金主说4o实测上下文30k
金主说4.5实测输入25k,我实测输出2k(可能是preview版特意控制了输出,正式版应该16k)
$20会员:所有模型都是32k上下文,最大输出不确定
免费会员:所有模型都是8k上下文,最大输出4k
API:4o/4omini/4.5是128k上下文,16k输出。但4.5-preview实测2k输出
o1/o3-mini是200k上下文,100k总输出(含推理),16k最终输出
Grok3限量
250303更新
免费会员:给的限量挺多的,而且深度搜索和推理都有
x.com/i/grok 与 Grok.com 的限量是分开计算的,就是一个google账号可以同时登录两个网站
现在grok ios也有语音功能,限量不确定
安卓没上架,网页版和x app里没有语音功能
x.com的premium$8会员:一般如果想买会员,$8就足够了
现在也有语音功能,限量不确定
grok.com的SuperGrok会员$30,x.com的premium+会员$40:限量相同,只比$8多一点,而$8限量都很少能用光,$30性价比低
买会员网页买就行,不要在appstore里买,贵很多($11和$50),因为有苹果税
普通搜索:上下文16k(另一说128k),思考4k,最终输出4k,20来源
深度搜索:50来源
推理:上下文100k,思考+最终输出26k
API版:还未上线,上下文1m(现在开放128k),最大输出不确定
显示剩余限量插件:https://chromewebstore.google.com/detail/grok-rate-limits/alfhaokdckjioipagadidpbldgfabgjp
Claude限量
免费会员:3.7每4~5小时整点重置,10条左右,取决于长度
取消了3.5和haiku,没有thinking
上下文32k,最大输出8k。
$20会员:每4~5小时整点重置,有30~50次,有3.7和thinking
除了次数,也考虑token消耗
所以经常重开新提问,把上下文清零,可以显著减少token消耗
上下文,最大输出暂不清楚
thinking不能调,推测是16~32k(不确定)
API:上下文200k,最大输出(含思维链)128k,思维链和最大输出可以自己用参数设置
显示剩余限量插件https://chromewebstore.google.com/detail/claude-usage-tracker/knemcdpkggnbhpoaaagmjiigenifejfo
Claude的限量计算很复杂,根据佬友花白的留言,可以装这个Chrome扩展
Gemini限量
Gemini免费会员:无限量,有2.0flash,2.0flash thinking,App版有语音
上下文32kt
有一个月$20会员试用,佬友巧克力雷轰说到期再给两个月的$9.9订阅优惠
不过aistudio免费模型齐全,一般没必要买会员
250313更新,gemini免费会员现在每月有五次deep research,以前没有
gemini的deep research引擎从1.5pro换成了2.0flash-thinking,性能有一定提升
Gemini$20会员:2.0pro不限量,上下文1mt,输出8k
deep research每天20次,上下文,最大输出不确定
AIStudio免费:2.0flash-thinking-exp/2.0flash/lite:1500次/天
2.0pro-exp:50次/天
1.5pro:50次/天,32k/分
embedding-03-07:100次/天,新的嵌入模型,3072维
有语音+屏幕识别,只能听中文不能讲中文,貌似不限量
上下文:同API
AIStudio Tier1:要设置结算卡,填写税务信息等
NotebookLM免费会员:限量多
NotebookLM $20会员:限量是免费5倍,可以与播客男女主播对话
API:flash上下文1m,输出8k
pro上下文2m,输出8k
flash thinking上下文1m,思考40k,最终输出26k
Microsoft Copilot(不是Github Copilot)
免费会员:貌似无限语音,非推理是4o,无限o3-mini-high
o3mini在 copilot.microsoft.com 里有,在edge浏览器右上角点copilot里面没有
有一个月$20会员试用
$20会员:
Deepseek限量
免费会员:没有次数限制
貌似邮件注册用户限制联网,手机注册用户可以联网
上下文不确定,最终输出4k
没有收费会员
API:官方上下文64k思考24k,最终输出8k
佬友巧克力雷轰说部分第三方(together.ai等)128k,
豆包
免费会员:没有次数限制,没有语音限制
普通上下文不确定,最大输出4k
推理:上下文/最大输出4不确定
豆包PC版:提问/沉浸式翻译等,用的doubao-1.5-pro或lite,不限量
Cici的PC版:自称用的是gpt,估计是4o-mini,不限量
要用新加坡/日本等IP,不能用中国/香港/美国IP
Cici搜索可以搜索被墙网站,豆包不能
没有收费会员
API:上下文256k,最大输出12k
第三方应用的限量
Perplexity限量
免费会员:无限普通搜索(10来源)
每天3次高级搜索(20来源),推理或深度研究(几分钟)
$20会员:每天300次高级搜索,10次4.5
秘塔限量
免费会员:每天100次普通搜索(20来源),研究次数不确定(100来源)
¥39会员:每天500次普通搜索,50次研究
Genspark限量
免费会员:无限普通搜索
每天5次高级模型:4o/o1/o3mh/3.7t/3.7/r1
每天1次深度研究:266+来源,10~20分钟
没有深度搜索功能
$25会员:无限高级模型(o1/4o/3.7/flux/ideogram/recraft/dalle)
感谢佬友PSP说:
$25限制是免费的5倍。
所以PLUS也就是
每天25次以上高级模型对话(如果上下文较短,则可以使用更多次数)
每天5次深度研究
更早一步体验新功能
Felo限量
免费会员:无限普通搜索
每天5次专业搜索(80+来源,r1/o3m/4o/3.7)
每天3次文件分析
2k输出
佬友巧克力雷轰说:felo订阅用户有一个felo chat,那个每天于search共享300次数,上下文、输出等可以自由控制(跳转到一个自建的nextchat界面)
$20会员:每天300次专业搜索(加o3m-high)
深度研究(即将上线)
Poe限量
免费会员:每天送3000积分
$10会员:每天1w积分
$20会员:每月100w积分
还有$50和$100会员,每积分价格同$20没有额外优惠
积分消耗根据不同模型有两种方式,一种是按次消耗,另一种是按次+xx积分/kt
You限量
免费会员:3次高级模型或研究(4o/1.5pro/2.0flash/4omini)
$20会员:佬友xinxinzi说每周500次高级模型,4.5/o3mh/o1/3.7/3.7thinking/r1,64k上下文
有深度研究
$30会员:200k上下文
minimax.io限量
是海螺的海外版,很少有人提到,但确是比较少见的,完全免费不限量,又支持搜索被墙网站的r1第三方
免费会员:只有r1和minimax-text-01,貌似不限量
没有收费版
abacus限量
佬友巧克力雷轰说,上下文全系16k
绑卡支付才能使用,其中首月免费,但首次支付必须订阅两个月来扣除$10(即每个月$10)
每个月默认250w积分,允许额外购买积分,$10可购买100w
Lmarena direct chat限量
不需要注册,只有免费版,没有收费版,买API的资金来自于个人,大学和公司捐赠
有大多数模型,有3.7,3.7thinking-32k,o3m,3opus,grok3,但没有4.5,o3mh,o1
上下文限制严重,以3.7为例,输入限8k,输出默认2k,最大设置4k
有时会有一些未上市的模型,以代号的形式出现
OpenRouter Chat room或API限量
免费会员:可以用里面免费模型,例如r1:free,2.0pro-exp,2.0flash-thinking等,免费模型一般有单位时间限量
但是不管收费还是免费模型,联网都要单独收费,$0.004/次
方法:在Chat room勾选联网图标,或API手动填模型名后加:online,例如anthropic/claude-3.7-sonnet:online
因为使用API,官方API上下文和最大输出是多少,OpenRouter的就是多少,不会截断
编程IDE的限量
Cursor限量
免费会员:14天会员试用,以前可以无限注销再重新开始试用,现在加入了机器码审核机制,要用软件更改机器码
试用期后每月2000次自动补完(Cursor Tab)
自己添加API Key不收钱,但API Key不能用于自动补完
$20会员:每月500次高级快速提问(包括3.7/r1/ds3/4o)
3.7thinking算两次快速提问
慢速提问次数不限(排队长度取决于系统繁忙程度)
最近慢速貌似不让用3.7
特级模型4.5/o1/opus要额外单买积分兑换,而且价格不菲
低级模型不限量:4omini/2.0flash
241208:Cursor Chat/Composer上下文限制40k,Ctrl+k限10k,Agent60~120k
参考3.7API上下文是200k,就是Cursor只用到了claude上下文上限的20%或5%
某种角度来说,上下文限制,限制了包月IDE的性能,导致对codebase的视野受限
这可能也是有些人不要用包月,而要用要用Cline/Roo code+API的原因之一,API可以尽量用满大模型API的上下文极限,反正花你自己的钱,Cline/Roo code没必要去限制你的上下文
来源:Cursor – Models
Windsurf限量
免费会员:无限自动补完
5次高级模型(4o/3.7/r1/o3m)
$15会员:每月500次高级模型
超出购买$10=300次
$50会员:不限次高级模型
Github copilot
免费会员:每月2000次不全,50次高级提问(3.7/2.0flash/o3mini)
30天会员试用
$10会员:1.5pro/o1
241206:4o是64k上下文,VSC Insider会员128k。
claude上下文不确定
来源:Copilot Chat now has a 64k context window with OpenAI GPT-4o - GitHub Changelog
学生可以免费
Trae
国际版免费会员:3.7/3.5/4o,不限量,3.7经常排队
国内板免费会员:r1/ds3,不限量
暂时没有收费会员
Tavily 联网API
CherryStudio联网用,每月1000次免费
如果不够,可以多注册几个Tavily账号,获得多个API Key,也就麻烦一次,以后只要保存好API Key就行,各账号可能永远也不用再登录Tavily了
中转站限量
以OpenAI的模型为例,不同中转站逆向,即便不被降智,中转站不参水,不故意截断上下文和输出的前提下,根据来源是ⒶCursor等第三方/Ⓑ官方免费/Ⓒ官方$20/Ⓓ官方$200会员,四种情况,上下文,思考长度,最终输出长度也是有差距的,首选只做$200会员的逆向
因为逆向是非官方的东西,并没有规范的命名,从逆向名字里并看不出来是哪种来源,通常站长也不会明说,甚至有的站长自己都不知道什么来源,因为是买的二手三手的api