Llama 3.1模型中，带Instruct和不带Instruct的有什么区别

happyZYM · 2024 年7 月 25 日 00:12

可以看到几乎每个模型都有个instruct版，这个instruct是什么？

wren · 2024 年7 月 25 日 00:15

监督学习，指令调试等。

Crixs · 2024 年7 月 25 日 00:17

带Instruct的模型经过指令微调，专注于多语言对话和特定任务，能够更好地理解和响应用户指令，输出多语言文本和代码。相较之下，不带Instruct的模型则更通用，适用于广泛的文本生成任务，但在特定指令响应上表现较弱

happyZYM · 2024 年7 月 25 日 00:17

OK，谢谢！

admini · 2024 年7 月 25 日 00:40

不就是可不可指令调试啊。

Schwifty · 2024 年7 月 25 日 00:43

我两个都下载了发现似乎是同一个

happyZYM · 2024 年7 月 25 日 01:07

佬请问这个模型在哪里下载，hugging face上我申请后被拒了

Zzzzzz · 2024 年7 月 25 日 01:21

可以去 ollama 上下载 llama3.1

happyZYM · 2024 年7 月 25 日 01:24

好的，谢谢

handsome · 2024 年7 月 25 日 01:25

instruct的调过了

CNPC · 2024 年7 月 25 日 01:27

instruct 在ollama上有很多版本，有佬友知道都是什么意思么？

neteroster · 2024 年7 月 25 日 01:28

不是一样的。一般对话 LLM 需要通过预训练、指令微调、强化学习（偏好对齐）这三个训练阶段，具体可以 Google 详细了解。这里非 Instruct 是只经过预训练的模型，Instruct 是经过完整三个阶段的模型，一般用户选择 Instruct 就好了。

提供 Base 模型主要是满足开发者根据具体下游任务微调等需求。

neteroster · 2024 年7 月 25 日 01:31

那是量化等级，量化可以降低模型的显存或存储占用，但激进的量化会损伤模型质量，一般情况建议选择 Q4 以上量化。至于 Q4KM IQ4XS 这些前后缀和具体量化算法有关，有兴趣可以阅读 llama.cpp 的 PR 了解，总的来说就是试图在显存和质量上取得平衡。

一般情况，选择的话选你的设备显存或者内存最大能装下的即可。

laelluo · 2024 年7 月 25 日 01:34

说明ollama默认下的就是微调的

laelluo · 2024 年7 月 25 日 01:36

没那么复杂理解成有instruct的是专门对话的其他的是文本生成的就行 chat同理后面那些都是量化优化的标签具体自己看这个 k-quants by ikawrakow · Pull Request #1684 · ggerganov/llama.cpp · GitHub

zhong_little · 2024 年7 月 25 日 01:36

Schwifty · 2024 年7 月 25 日 01:54

确实，这三个都是同一个hash

sandy05 · 2024 年7 月 25 日 05:55

一个带鸡蛋一个不带

neo · 2024 年8 月 29 日 06:04

From #develop:ai to 资源荟萃

话题		回复	浏览量
llama模型推荐资源荟萃人工智能	19	495	2024 年8 月 29 日
这几种模型的区别在哪儿？搞七捻三人工智能 , 快问快答 , 纯水	8	309	2024 年11 月 20 日
想探讨一下，大模型处理视觉问题，路线是不太正确吗？搞七捻三人工智能	6	700	2024 年11 月 4 日
求求模型推荐搞七捻三人工智能 , 快问快答	15	699	2024 年11 月 15 日
Meta今年的压轴人工智能（AI）大模型来了前沿快讯人工智能	13	1047	2024 年12 月 8 日