文笔细腻,还是目前第二。仅次于4.5,tokens价格也是第二贵,4.5之前最贵的就是opus了
看有的佬说写论文的话o1 pro>4.5>o1>3.7 sonnet,好像已经很久没有见到有提过Opus的了,还以为已然没落矣
论文和推理能力,指令遵循能力直接挂钩。3.0 opus是老模型了,这方面都没有经过后训练的加强。
opus的特点是细腻的文笔(背后是超大杯的模型,目前只有gpt4.5规模大于opus,grok3估计和3.0-opus规模相当甚至还不如opus?)
grok3也能跟Opus分庭抗礼?
感觉3.0-opus是grok3,gpt4.5之前,规模最大的模型。
按照奥特曼的说法就是,几十倍的价格5%的提升(但是有文学+高品位)
o3-mini-high,大部分测试,都强于o1,但是底子应该是非常糟糕的4o-mini(基模可能是低于32B规模的小模型)
很多跑分测试都是STEM这些东西,理科方面的。
触及到我的知识盲区了
这个感觉还是得多用,目前为止我还真没觉得4.5能太多的减少gpt zero的检测风险
4.5就是高品位模型,根本不是写论文用的。
高品位比得是细腻的感觉,类似音乐hifi里的高保真,有人认为50元的耳机和5000元没太大区别,但是烧友就是喜欢烧钱听一点点微不足道的差别。
HiFi烧友以前还有梗,真正的HIFI烧友只用雅鲁藏布江的水电,用火电的力度大点,声音偏暖,用水电的声底偏冷,但解析力很高,水电中,以葛州坝的电音色最好,火电中以北仑电厂的电音质最好,因为烧的无烟煤的比例最高。
你可以理解那些就是高品位过头了。
另外规模越大的模型,如果加上推理,就能越强,推理类似超级赛亚人,常态越强,变身后的实力就越强
很有意思的比喻,佬这种说法我眼前一亮。请教一下佬那如果说4.5是高品味模型,3.7sonnet和Opus在写作方面是可以归为什么类别呢
o1-mini是4o mini的推理版
o1是4o的推理版
3.7sonnet听说是3.5sonnet的后训练版本,另外集成了推理能力(似乎自带思维链,不需要另外叠加思维链模型)
opus是3.0的超大杯,也就是高品位模型,类似GPT-4.5
关于高品位超大杯
2023年是GPT-4(非降智版)
2024年是Claude-3.0-opus
2025年是GPT-4.5
还有一个o1 pro和o1,我其实觉得更适合做一些推理类工作,但看有人说润色文章啥的也有意想不到的效果(似乎是推理类模型更不容易被判断为ai?),佬觉得这俩推理模型适合写文章吗
我个人感觉,有钱的话,o1的写文章最舒服(假设不考虑高品位的文学性)
不过考虑到性价比,肯定还是3.7 sonnet thinking最好
佬,如果是作商業分析,資料搜集方面,目前也是claude3.7綜合最好嗎?
Claude 3.7 sonnet thinking的推理能力、计算能力(不知道你论文是否用得上这两种能力)稍逊o1。文笔和知识量和o1差不多?
emmm我对于文科的写作要求比较高,理工类的能力用不上,有思想、人性化于我而言就再好不过了
有钱建议直接考虑,Deep Research。那个无敌,断档,超级厉害。
商業分析,資料搜集,都不要自己动手了。那个底子是o3,超越o1的怪物次时代模型
我想起贴吧里玩酒馆的佬,去年的5月吧。
写瑟瑟的东西,用opus无敌的强,那个佬瑟瑟开心了,不知不觉一个星期用掉两百块,好个高品位。
后来8月我也有幸尝试过羊毛opus,那感觉至今无人能比,后来羊毛车被焊死了。只能用gemini 1.5 pro exp了,再后来就是2.0 pro,现在首选是grok 3 beta