使用大模型的五大「暴论」

最近和一些不同领域的朋友聊大模型的产品和应用,渐渐有了一些「暴论」,一家之言,大家不妨先看看,欢迎分享您的看法。

第一,如果你到现在(2024 年 12月)还没有使用过大模型产品,大概率你是最不会被替代的一批人,这是你的幸运。

从 ChatGPT 为代表的大语言模型到 DALL·E 等图像模型,大模型产品所影响的范围一直是白领或知识从业者群体,大量体力劳动者或蓝领人士不会有明显感知。

但这并不意味着你可以不了解这类产品,大模型正在无处不在,特别是在中国,基于大模型技术的内容消费(新闻、短视频)、电商直播等正在逐步普及,由此带来的会是更丰富的内容消费场景以及更虚假的信息泡泡。

第二,没有所谓高级的大模型产品。使用 ChatGPT Plus 的你,并不意味着比免费薅豆包的他——或者另一个维度里的你——更高级,价格、逼格都不是选择或不选择一款产品的理由。

在消费者需求与大模型基础能力相差无异的当下,不同模型的日常体验正在趋同化,这或许也是因为训练数据重复率上升的原因。

想一下,包括中国在内,全球互联网用户,已经被 YouTube、TikTok、中国的小红书、抖音高度影响,用户的需求其实是高度一致的。如果你相信大模型是一种对互联网的压缩,那么早已千篇一律的互联网内容,也让大模型基础输出能力越发接近了。

第三,所有的大模型产品都有审查,并不存在「外国的月亮比较圆」的情况。

但需要明白一点,并不是所有审查都「平等」,比如政治内容审查更具地域性,而道德层面的内容审查则基于人类普世的价值取向,哪个更好,各位可自行判断。

第四,除了关注大模型,「小模型」更值得期待,这些「小模型」的参数基本在 70 亿/80 亿级别,这个领域既有 Google Gemini Nano、OpenAI 的 GPT-4o mini 等闭源模型,还有 llama 3.3 7B 或 Gemma 2 8B、Qwen 2.5 7B、Phi-3 等开源模型。

「小模型」由于体积小,可以广泛部署到笔记本甚至智能手机里。「小模型」在性能方面当然不如大模型,但只需想一下我们日常使用大模型的流程里,到底有多少场景需要 GPT-4o 或 Claude 3.5 Sonnet 的能力?是不是绝大多数场景完全可以通过「小模型」覆盖?

第五,即便我们在 2025 年迎来 GPT-5 或 Claude 3.5 Opus,大模型也不是「灵丹妙药」,它不会直接帮助我们解决哪怕是写一篇文章这样的所谓「简单需求」。

年龄稍大的朋友应该还记得十年前有个词叫「互联网+」,现在我们也处于「大模型+」的阶段。任何一个企业、个体,都需要站在自己的角度审视大模型带来的价值,从自己行业需求的角度提出问题,寻找大模型方案的可能性,从而继续发展或解决问题。

这意味着什么呢?你能提出什么样的问题,直接决定着你使用大模型产品的成果。换句话说,大模型带来的新竞争,赛场不在大模型产品上,而是取决于个体的认知。多读书、多思考、多和现实世界发生关系,这是我们高效使用大模型产品的不二法则

11 个赞

别的都可以说小模型,这个参数量都没公布可不能随便说小

有点意思,值得思考

1 个赞

真的是这样吗???

1 个赞

如果你手里有俩模型,一个正确率90%,一个正确率80%,都是正常使用达不到限速,你会问谁?

思辨总归是好事~

话说现在搞一堆api接到newapi,日常输入最多的还是你好(调测api的时候)…… :joy:

4 个赞

佬友的看法我挺认同的。
现在相比于大参数模型的能力,我更期待或者更想知道小参数(10b以下)模型的各方面能力谁更强,提升大不大。这些能部署运行在本地的端侧大模型也不能忽视。

不同意,因为我日常使用大模型最多的流程是写代码 :laughing:

还有一个问题是,除了隐私的考虑,绝大多数场景下部署到本地的“小模型”只是一种权宜之计。和调用远程大模型的api相比,本地的“小模型”在日常生活中并无优势。

这价格,不可能超过50B的吧

比 4o mini 价格低不遍地都是

这不好说吧?

确实挺暴论的

第一条我并不是特别认可,因为大模型已经渗透像网络一样渗透到生活中的各个角落里了。或许你不会直接使用大模型产品,但很难避免间接性接触到被大模型渲染过的信息。我认为最不会被代替的那些人应该是有能力辨别并拒绝接受被加料的信息、或者是大模型其本身从根源上无法支持其需求的那些人。
第二个我支持,大模型多少也有点同质化了,抛去参数的变化不谈,在日常需求且机师水平都一样的前提下,并不会因为使用工具的好坏而产生较大变化。
第三个我也支持,别人的东西始终是不能相信的,最多只能做到相对的中立,圣人都做不到普济众生,何况无机物呢。
同样第四个我也很期待,或许往大可以无限膨胀,但满足日常需求根本不需要这么多的资源。如何在有限的资源内实现最佳的解决方案往往是一个难题。别的不说我确实是小模型的受益者,尤其是在离线场景下的使用更是让我理解到小模型的美。
第五我保持中立,它确实不是灵丹妙药,滥用只会走火入魔。但如果真的是即简单又繁琐的需求就不一样了,特别是紧急不重要和不紧急不重要的事情。

可能逻辑有点混乱,我觉得大模型的受益者一定都是会自省、会思考的那些人,现在的风向更像是前几年的互联网一样,同样地解决方案我相信肯定也使用于大模型的,在此基础上我完全认同po主的最后一段。

1 个赞