llama3:70b 本地部署我放弃了

Ferrari · 2024 年6 月 4 日 13:54

啥也不是，散会

cpu：

响应内容：

注：10分钟就蹦出来这几个字符串。

截止截图还在那卡着呐

本机：

neo · 2024 年6 月 4 日 13:57

EFL · 2024 年6 月 4 日 13:58

不是，我11代i5 16gb ram也没这么慢啊，用openwebui跑试试

finch · 2024 年6 月 4 日 13:59

M2 max，不至于吧，

Ferrari · 2024 年6 月 4 日 14:00

是哪里还需要设置吗？感觉cpu不干活

Ferrari · 2024 年6 月 4 日 14:01

第一次没经验哪里不对呀

handsome · 2024 年6 月 4 日 14:02

哈哈哈，这也太慢了

finch · 2024 年6 月 4 日 14:03

让我们回到8b

xinnn · 2024 年6 月 4 日 14:05

你可能使用的是cpu版的ollama

Ferrari · 2024 年6 月 4 日 14:05

8b 秒回复

Ferrari · 2024 年6 月 4 日 14:05

打开ollama官网默认安装的

xinnn · 2024 年6 月 4 日 14:06

你去换成gpu版的就可以了，默认使用的是cpu

Ferrari · 2024 年6 月 4 日 14:15

直接下Linux版本的嘛？没看到Mac GPU半在哪

OpenAI_Q-Star · 2024 年6 月 4 日 15:43

LMStudio?

user137 · 2024 年6 月 4 日 16:52

如果看到他70加载到cpu，百分之30加载到gpu，这个咋让他完全走cpu

mistpeak · 2024 年6 月 4 日 16:55

gemma:2b 1.7G
极致小模型，你值得拥有

Ferrari · 2024 年6 月 5 日 01:21

想压榨一下，看别人70B 也不至于像我这样慢，不懂

nnas · 2024 年6 月 5 日 01:31

感觉不知道是哪里有点问题

zzttyy · 2024 年6 月 5 日 02:26

内存显存小了，别人不卡都是能把模型完全载入内存的吧，

SCzfdf · 2024 年6 月 5 日 03:33

M1 max 64 2秒左右出来…确实比其他模型慢点不过也没那么夸张

话题		回复	浏览量
别投了，服务器炸了（Share 运营反馈 shared	25	794	2024 年6 月 7 日
哈哈又整了一台小鸡鸡搞七捻三	9	484	2024 年3 月 23 日
还有个2 cpu 2g 的香港服务器 3天到期。干点啥好快问快答	11	475	2024 年3 月 27 日
来个人告诉我,这个东西绝版了,值几个不锈钢脸盆搞七捻三	21	507	2024 年1 月 31 日