腾讯云GPU+Ollama+开源模型+搭配OpenWebUI

Yuccc · 2024 年11 月 19 日 03:11

在腾讯云搭建免费GPU环境运行Ollama教程

前言

这几天看佬友论坛里面发了白嫖腾讯云GPU的一些帖子,昨天摸鱼,捣鼓了一下,现在分享记录一下

使用须知

缺点

部分机器下载模型速度较慢
装了通义的qwen2.5-coder:32b,回答吐字很慢,应该还是性能不够
每天凌晨会强制自动关机
- ngrok临时穿透的地址会变
- 不过ngrok可以绑定自定义域名,这样就不会频繁更换了
- 但是每天手动点开机确实麻烦,后续可探索自动化脚本解决方案

优点

白嫖
小模型无压力,自带的llama3回复吐字很快
或许可以小模型配合沉浸式翻译,实现自由?

运行环境

Tencent Cloud Studio
Ollama
Ngrok (或其他内网穿透工具)
OpenWebUI (可选)

详细步骤

1. 安装Ollama环境

1.1 进入网站并登录

1.2 创建Ollama

1.3 新建终端

1.4 验证安装

输入以下命令:

ollama

ollama list

可以看到,已经预装好了，并且自带了Llama 3

1.5 启动服务

终端输入:

ollama serve

可以看到6399端口被占用了，现在就不用管了

1.6 基础使用测试

ollama list
ollama run llama3:latest

2. 安装ngrok

2.1 注册账号

2.2 进入配置页面

2.3 执行安装命令

按照页面提示执行相关命令:

2.4 完成安装

这个时候终端应该是这样的，请记住红框里面的地址:

3. 安装OpenWebUI(可选)

这个就不赘述了，佬友们应该都装过了的

4. 配置OpenWebUI

4.1 获取模型

4.2 测试运行

补充说明

5.1 其他开源模型

访问模型库: library

5.2 安装方法

使用 ollama pull 命令安装对应模型ID
例如:

ollama run qwen2.5-coder

会自动下载安装:

感谢佬友补充

嘿嘿,写完之后,让AI给这篇教程润色一下,好看多了

dlinuxo · 2024 年11 月 19 日 03:12

厉害了我的佬

sap · 2024 年11 月 19 日 03:16

ollama不错，刚好把openwebui上的补齐了，谢谢佬友的分享

handsome · 2024 年11 月 19 日 03:27

感谢大佬教程

Yuccc · 2024 年11 月 19 日 03:27

过奖了还是佬友们厉害

banlan · 2024 年11 月 19 日 03:27

大佬真强

Yuccc · 2024 年11 月 19 日 03:30

我也一直想把openwebui的ollama给用上后续准备部署在家里的机器上

Yuccc · 2024 年11 月 19 日 03:30

大帅哥每天高强度刷论坛

Yuccc · 2024 年11 月 19 日 03:31

哪里哪里自己瞎捣鼓

handsome · 2024 年11 月 19 日 03:32

我不是我没有

tuzh6 · 2024 年11 月 19 日 06:11

感谢分享~ollama能力稍微差点意思

tlyanyu · 2024 年11 月 19 日 06:15

ngrok可以申请一个免费的静态域名

huihuang · 2024 年11 月 20 日 01:36

32b是要多大的配置，才能流畅吞吐啊？

Cimix · 2024 年11 月 20 日 01:39

不修改ollama配置和模型配置文件的话，差不多占30G显存吧，开个高配付费的32G机器可以跑
不过超过7B的还是用vllm效果好一些

huihuang · 2024 年11 月 20 日 01:43

谢谢佬，我去研究研究vllm

bard · 2024 年11 月 20 日 05:07

没看到每秒多少tokens 的指标

qq727474430 · 2024 年11 月 21 日 14:46

感谢分享！！

drfy · 2024 年11 月 24 日 12:48

自动开机搞定了就开搞

Ava4399 · 2024 年11 月 25 日 02:27

在创建那一步有问题

没有任何操作，过一分钟左右就恢复成这样子

jiuyue · 2024 年11 月 25 日 02:37

为啥我的回复是英文（这该怎么改0.0

话题		回复	浏览量
抛弃Cursor，拥抱Aider 开发调优人工智能	59	1781	2025 年2 月 12 日
抱脸部署OpenWebUI教程资源荟萃人工智能 , OpenWebUI	240	14113	2025 年1 月 18 日
申请Gemini免费API搭配抱脸免费部署OpenWebUI系列教程资源荟萃 Gemini , HuggingFace , 人工智能 , OpenWebUI	72	2428	2025 年2 月 7 日
openwebui更新了搞七捻三 ChatGPT , OpenAI , 人工智能 , 纯水	83	2077	2025 年2 月 7 日
LobeChat 新年第一弹：数据库版一键部署脚本重磅上线！开发调优人工智能	215	3076	2025 年2 月 13 日