【求助】老板让我搭建一个本地AI大模型

Easton1209 · 2024 年12 月 9 日 02:14

佬友们知道用什么样的本地大模型比较能符合需求吗？
要求就是本地电脑上装一个本地的大语言模型，然后给它灌Spec，Story这些，以及我们写过的test case，让它写出和我们相似的手工测试Case，或者对它说一些项目内的东西，让它能解答出来，然后其它人可以通过局域网使用到这个模型。

zhong_little · 2024 年12 月 9 日 02:15

ollama，qwen，deepseek

User_9527 · 2024 年12 月 9 日 02:16

这个需求应该算是个RAG的应用，可以用fastgpt来做知识库，ollama和qwen做本地的模型

ODXUNI1 · 2024 年12 月 9 日 02:31

蹲一个后续，这类需求实用。

bolobao · 2024 年12 月 9 日 02:44

找个开源项目部署一下就好了

Cimix · 2024 年12 月 9 日 02:50

服务器弄个环境，两种通用方式
1、llama.cpp直接启动
2、vllm加速

然后装dify、maxkb、fastgpt这类，配置agent，把模型接进去

写代码的话模型推荐Qwen-Coder-32B（32G+显存），Deepseek-coder-33b（40G显存）
显存估算是基于你不做量化的标准给你的，如果没那么多预算购入显卡，那么就选14b、7b的，只是准确度会大幅下降，这可以通过RAG应用来适当补全一些，不过无法完全弥补模型量级上的差距

Easton1209 · 2024 年12 月 9 日 02:59

没有代码需求，单出就是输出test case以及一些项目上的问答

Easton1209 · 2024 年12 月 9 日 02:59

开源项目找了好几个，不知道哪个更符合需求一些

Cimix · 2024 年12 月 9 日 03:00

那Qwen一般的都可以，我司用7b做了个数字人，回答点简单问题没难度

wwtwwt5 · 2024 年12 月 9 日 03:02

用dify,fastgpt做一个前端，然后olloma本地跑一个大模型即可。非常容易上手

pigracing · 2024 年12 月 9 日 03:04

可以看看我写的

ginkgo · 2024 年12 月 9 日 03:11

从搞七捻三到开发调优

BBCoder · 2024 年12 月 9 日 07:23

写的不错，催更催更

ohayo · 2024 年12 月 9 日 07:28

先看看显卡配置

NullUser · 2024 年12 月 9 日 07:31

为下一步降本增效工作打下了坚实的基础。

进一步保证了开发队伍精干高效。

DROP_TABLE.user_info · 2024 年12 月 9 日 08:09

fastgpt应该可以满足了

kkevin · 2024 年12 月 9 日 08:48

ollama+ChatGPT-Next-Web

这两个都有Windows版，直接无脑安装，ollama用命令行还可以直接下模型，更是省心

kkevin · 2024 年12 月 9 日 08:49

而且装了ollama还可以做服务端，客户端只用装ChatGPT-Next-Web就行，地址填ollama的地址，整个局域网都可以使用

Easton1209 · 2024 年12 月 9 日 09:38

RTX3500 ADA 12GB
内存64GB

thmu · 2024 年12 月 9 日 09:52

学习样例，仿写 test case 这个功能应该要微调。

github.com

QwenLM/Qwen/blob/main/finetune.py

# This code is based on the revised code from fastchat based on tatsu-lab/stanford_alpaca.


from dataclasses import dataclass, field
import json
import math
import logging
import os
from typing import Dict, Optional, List
import torch
from torch.utils.data import Dataset
from deepspeed import zero
from deepspeed.runtime.zero.partition_parameters import ZeroParamStatus
import transformers
from transformers import Trainer, GPTQConfig, deepspeed
from transformers.trainer_pt_utils import LabelSmoother
from peft import LoraConfig, get_peft_model, prepare_model_for_kbit_training
from accelerate.utils import DistributedType

This file has been truncated. show original

这个就可以用RAG。qwen上这个文档把RAG原理写的蛮透：使用Qwen-Agent将上下文记忆扩展到百万量级 | Qwen

没有量化模型的话，你的这个配置可以用qwen2.5-14b

话题		回复	浏览量
DeepSeek 新手上路 (二) 模型自部署文档共建人工智能	53	2763	2025 年3 月 5 日
急！！！🥲请问有没有局域网内的可供多人使用的知识库项目开发调优人工智能 , 职场 , 快问快答	114	2839	2025 年4 月 3 日
5GB左右企业私有pdf文档，想要基于大模型进行自建私有知识库，有请大佬们进来交流资源荟萃人工智能	51	3086	2025 年2 月 13 日
声称自己比llama.cpp快的ktransformers 资源荟萃人工智能 , 转载	21	895	2025 年3 月 5 日
如何快速搭建自己的简单的RAG大模型网站（附上资源）资源荟萃 ChatGPT , OpenAI , 人工智能 , 纯水	26	1032	2025 年3 月 5 日

【求助】老板让我搭建一个本地AI大模型

相关话题