deepseek为什么这么热门?国内其他大模型不能够比吗?
因为他很优秀。
1 个赞
具体在哪里?
便宜好用
没法比,目前普通用户使用质量是全球第一,断崖式领先(排除掉目前挤爆的稳定性问题)
质量好的claude等没法推理。能推理的chatgpt o1收费巨贵,没法联网。
跟国内比是全方位胜出。
4 个赞
我的理解比较狭隘,即国内其它的大模型均属于抄袭性质,而deepseek更多属于创新并且水平很高。
1 个赞
打破三色图
因为deepseek新模型开拓了一条原本在LLM领域不受重视的路线(RL,强化学习,这是早期alphaZERO的路线),还做成功了,成本还极度低廉,极大的缓解了算力瓶颈,这点对很多ai业界从业者震撼很大,因为庞大算力需求牵扯到ai公司市值(你看美股这次就爆了),大船难调头,风险高。,然后他们嘴巴又特别大,在x上疯狂吵架,然后就溢出了,引得外媒争相报道,又被倒灌回国内,然后热度就爆了
RL路线除了免去了PRM路线中大量浪费掉的算力外,deepseek还意外发现只奖励结果不约束过程往往能让ai在cot过程中展现一些人类一时想不到的可能性。而且RL也能减少标注需求,像alphaGO后期都并不是研究人类的棋局材料,而是采取左右互搏自博弈迭代的方式。当然也不是没有缺点的,RL没有那么强的对齐可能造成更多的幻觉和一些奇怪的问题。只能说看后续发展了
11 个赞
上了热搜,说是和其他相比成本低。
被老外关注到了
以最少的研发费用领先万亿的AI
因为各项评测数据都很好
免费 效果还行
一个是它真的很优秀,第二个国民情绪
主要还是物美价廉吧,之前始皇的无限 4o 不也相当热门
这些是基于chatgpt模型研究的吗?还是