手机端侧大模型7b/3b分享

cmkq · 2024 年2 月 27 日 13:39

源项目

3b在8gen3上表现良好，能达到10+ tokens/s
为什么rwkv的3b在手机上表现比电脑上好很多，有佬知道么

这是上面的相关文章

neo · 2024 年2 月 27 日 13:46

手机上都能跑大模型了？

neo · 2024 年2 月 27 日 13:47

电脑是arm吗？

cmkq · 2024 年2 月 27 日 13:50

对啊现在手机性能足够了,mlc chat 苹果也有应用

cmkq · 2024 年2 月 27 日 13:55

电脑是x86 显卡多年前的1070
这是上面作者的图

xww · 2024 年2 月 27 日 14:55

皇上落后啦，哈哈哈

正好这几天兴趣来了在折腾，目前可用的小模型对中文都不太友好，而且参数太小，量化后不太够用，但是运行是没问题的，目前的旗舰手机都嘎嘎快

neo · 2024 年2 月 27 日 14:56

刚想弄一个玩，看你图片里的质量还是算了

roelauph · 2024 年2 月 27 日 15:01

fastllm这个项目倒是可以在手机上跑chatglm2-6b-int4

cmkq · 2024 年2 月 27 日 15:03

这是rwkv的3b，这个llama的7b咋这么傻……

xww · 2024 年2 月 27 日 15:03

有一个国内开源的看着效果不错，但是ios端还要最新xcode才能编译，我还没用上

你有环境的话可以试试，目前安卓端甚至还支持多模态

xww · 2024 年2 月 27 日 15:05

量化的多了，q3 q4还没测试，先下的最小的尝鲜

roelauph · 2024 年3 月 17 日 03:26

话题		回复	浏览量
他来了,他来了本地跑模型他来了资源荟萃 ChatGPT , 人工智能	34	3337	2024 年8 月 29 日
🚀 快来试试来自清华博士王慎执版Llama3 模型，表现不错！(已下线）资源荟萃 ChatGPT , Llama3 , 人工智能	60	2814	2024 年8 月 29 日
【分享】一个可以手机端部署本地大模型的项目资源荟萃	4	597	2024 年5 月 9 日
有佬玩过手机端的模型吗？资源荟萃人工智能	7	497	2024 年8 月 29 日
请教关于高通芯片部署Llama2 7B，或者Llama3 调用QNN运行加载资源荟萃 Llama3 , 人工智能	1	137	2024 年8 月 29 日