最近和一些不同领域的朋友聊大模型的产品和应用,渐渐有了一些「暴论」,一家之言,大家不妨先看看,欢迎分享您的看法。
第一,如果你到现在(2024 年 12月)还没有使用过大模型产品,大概率你是最不会被替代的一批人,这是你的幸运。
从 ChatGPT 为代表的大语言模型到 DALL·E 等图像模型,大模型产品所影响的范围一直是白领或知识从业者群体,大量体力劳动者或蓝领人士不会有明显感知。
但这并不意味着你可以不了解这类产品,大模型正在无处不在,特别是在中国,基于大模型技术的内容消费(新闻、短视频)、电商直播等正在逐步普及,由此带来的会是更丰富的内容消费场景以及更虚假的信息泡泡。
第二,没有所谓高级的大模型产品。使用 ChatGPT Plus 的你,并不意味着比免费薅豆包的他——或者另一个维度里的你——更高级,价格、逼格都不是选择或不选择一款产品的理由。
在消费者需求与大模型基础能力相差无异的当下,不同模型的日常体验正在趋同化,这或许也是因为训练数据重复率上升的原因。
想一下,包括中国在内,全球互联网用户,已经被 YouTube、TikTok、中国的小红书、抖音高度影响,用户的需求其实是高度一致的。如果你相信大模型是一种对互联网的压缩,那么早已千篇一律的互联网内容,也让大模型基础输出能力越发接近了。
第三,所有的大模型产品都有审查,并不存在「外国的月亮比较圆」的情况。
但需要明白一点,并不是所有审查都「平等」,比如政治内容审查更具地域性,而道德层面的内容审查则基于人类普世的价值取向,哪个更好,各位可自行判断。
第四,除了关注大模型,「小模型」更值得期待,这些「小模型」的参数基本在 70 亿/80 亿级别,这个领域既有 Google Gemini Nano、OpenAI 的 GPT-4o mini 等闭源模型,还有 llama 3.3 7B 或 Gemma 2 8B、Qwen 2.5 7B、Phi-3 等开源模型。
「小模型」由于体积小,可以广泛部署到笔记本甚至智能手机里。「小模型」在性能方面当然不如大模型,但只需想一下我们日常使用大模型的流程里,到底有多少场景需要 GPT-4o 或 Claude 3.5 Sonnet 的能力?是不是绝大多数场景完全可以通过「小模型」覆盖?
第五,即便我们在 2025 年迎来 GPT-5 或 Claude 3.5 Opus,大模型也不是「灵丹妙药」,它不会直接帮助我们解决哪怕是写一篇文章这样的所谓「简单需求」。
年龄稍大的朋友应该还记得十年前有个词叫「互联网+」,现在我们也处于「大模型+」的阶段。任何一个企业、个体,都需要站在自己的角度审视大模型带来的价值,从自己行业需求的角度提出问题,寻找大模型方案的可能性,从而继续发展或解决问题。
这意味着什么呢?你能提出什么样的问题,直接决定着你使用大模型产品的成果。换句话说,大模型带来的新竞争,赛场不在大模型产品上,而是取决于个体的认知。多读书、多思考、多和现实世界发生关系,这是我们高效使用大模型产品的不二法则。