有关Deepseek的扫盲贴

yhp666 · 2025 年2 月 5 日 10:36

这几天看L站里N多人在各种问，转发内容也是八仙过海。本帖为了给一些不明真相的爱好者以启发，旨在帮助入门佬友们少走弯路少被忽悠。

1、Deepseek唯一官方网址
https://www.deepseek.com

2、Deepseek唯一官方账号
微信公众号： DeepSeek
小红书： @ DeepSeek(deepseek_ai)
X(Twitter)： DeepSeek (@deepseek_ai)

3、各种官方APP下载地址，优点是下载安装无门槛，缺点是目前官方服务几乎处于瘫痪状态
苹果App
华为电子市场
 vivo电子市场
 Deepseek官方安卓版
 DeepSeek | Google Play

4、官方Github，各种爱好者喜欢折腾代码的才可能需要去看
Deepseek-r1
Deepseek-v3

5、官方Hugging Face，需要下载非量化模型的才需要用到
Deepseek-r1
Deepseek-v3

6、魔搭modelscope，如果不给力HF下不动才需要考虑这个
Deepseek-r1
Deepseek-v3

7、Ollama部署，在以上两个非量化模型私有化部署时候遇到困难的，比如说显存太小ollama都是4bit量化模型，显存需求量只有原生非量化模型的1/4，比如说没有N卡，只有A卡、M系列的苹果电脑、甚至只有CPU
Deepseek-r1
Deepseek-v3

其他注意事项：
v3版本只有671b模型，如果自己N卡配置不够¥300万的就可以直接忽略了。按说能关注这个的佬也不惜的看这种扫盲贴了。
r1版本比较复杂，总体规则是参数量越大依赖硬件资源越多模型越聪明，详细见下表：

模型名称及基模来源	Huggingface	modelscope	Ollama
Deepseek-R1-671B	deepseek-ai/DeepSeek-R1 at main	魔搭社区	deepseek-r1
DeepSeek-R1-Zero	deepseek-ai/DeepSeek-R1-Zero at main	魔搭社区	/
DeepSeek-R1-Distill-Llama-70B 基于llama3.3-70b模型蒸馏	deepseek-ai/DeepSeek-R1-Distill-Llama-70B · Hugging Face	魔搭社区	deepseek-r1:70b
DeepSeek-R1-Distill-Qwen-32B 基于qwen32b模型蒸馏	deepseek-ai/DeepSeek-R1-Distill-Qwen-32B · Hugging Face	魔搭社区	deepseek-r1:32b
DeepSeek-R1-Distill-Qwen-14B 基于qwen14b模型蒸馏	deepseek-ai/DeepSeek-R1-Distill-Qwen-14B · Hugging Face	魔搭社区	deepseek-r1:14b
DeepSeek-R1-Distill-Llama-8B 基于llama3.1-8b模型蒸馏	deepseek-ai/DeepSeek-R1-Distill-Llama-8B · Hugging Face	魔搭社区	deepseek-r1:8b
DeepSeek-R1-Distill-Qwen-7B 基于qwen7b模型蒸馏	deepseek-ai/DeepSeek-R1-Distill-Qwen-7B · Hugging Face	魔搭社区	deepseek-r1:7b
DeepSeek-R1-Distill-Qwen-1.5B 基于qwen1.5b蒸馏	deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B · Hugging Face	https://www.modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B	deepseek-r1:1.5b

handsome · 2025 年2 月 5 日 10:44

感谢大佬教程

xiaoniangu · 2025 年2 月 5 日 10:44

感谢大佬教程

lenluo · 2025 年2 月 5 日 10:45

感谢佬友扫盲

woliubei · 2025 年2 月 5 日 10:46

清晰明了给力

DancingDuck · 2025 年2 月 5 日 10:48

不同的版本有什么区别？只是参数量不一样吗？比如 r1 和 v3

linuxso · 2025 年2 月 5 日 10:48

666啊

BigP · 2025 年2 月 5 日 10:48

感谢大佬分享

StellaFortuna · 2025 年2 月 5 日 10:49

感谢分享没注意看是共创帖，差点把内容清空了

slashkkk · 2025 年2 月 5 日 10:49

看着舒服~

wennan · 2025 年2 月 5 日 10:53

佬，直接用APP的深度思考，是R1多少参数量的？

yhp666 · 2025 年2 月 5 日 11:00

V3并没有think过程，还是用的传统scailing law训练方式，基本上就是大力出奇迹的打法。
R1的训练套路完全变了，推理的时候可以看到那个think…过程，效果更好。
我认为假如说v3足以让西方世界震惊的话，r1的出现那就彻底实现了“师夷长技以制夷”所以现在才被各种打压

yhp666 · 2025 年2 月 5 日 11:01

那官方app必须是671b满血参数量

yhp666 · 2025 年2 月 5 日 11:02

如果清空我就去始皇那告御状去

Bigbuoluo · 2025 年2 月 5 日 11:18

感谢分享，正好需要

sexual · 2025 年2 月 5 日 11:21

增加一下Deepseek的官方账号吧，360都没帮deepseek防御攻击，网上都已经出现deepseek感谢360和华为的消息了

yhp666 · 2025 年2 月 5 日 11:25

感谢佬，这个文章大家都可以补充的。

yhp666 · 2025 年2 月 5 日 11:47

感谢 @stevessr 帮忙补充了googleplay和Deepseek论文地址

YYYoung · 2025 年2 月 5 日 12:12

感谢大佬教程

air8373738 · 2025 年2 月 5 日 12:22

感谢佬友分享

话题		回复	浏览量
Deepseek 食用指南开发调优人工智能	62	6791	2025 年2 月 24 日
《DeepSeek入门到精通》PDF文档 -清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室资源荟萃 DeepSeek , 人工智能	94	9107	2025 年2 月 13 日
DeepSeek 新手上路文档共建人工智能	8	711	2025 年2 月 18 日
【DeepSeek 使用技巧】资源荟萃 AFF , DeepSeek , 百度网盘	20	926	2025 年2 月 17 日
[无需注册]DeepSeek R1完整版在线免费使用资源荟萃 DeepSeek , 人工智能	189	6745	2025 年2 月 10 日