【入门】大模型是什么？如何学习？

XiaoHuang · 2025 年2 月 21 日 07:11

前情提要

前言

是的，没错，我已经拿到Offer了，下周一入职（这个具体以后再说，我现在得忙着学习）
PS：我现在慌得很…啥也不会

唠嗑几句

写这篇帖子的原因，就是想和大家一起来好好学习大模型，虽然我每天都看L站，但是了解的基本都是资讯，根本还没深刻扎入到AI应用开发当中，虽然是周一入职，但是昨天去了公司，了解到了我大概需要了解的一些技术。

于是，我就搜集资料开始入门，虽然这篇帖子目前很少，没什么内容，但是我想发出来和佬友们讨论交流学习，一能帮我少走弯路，二可以让感兴趣的佬友知道怎么开始，总之就是想促进正确的学习方向！

所以！欢迎佬友们相互交流！！！！

（接下来，我还要去了解Dify和FastGPT，目前先把这些吃透，这两个看到时候掌握的怎么样另外开帖交流吧）

大模型是什么？

大模型（LLM）狭义上指基于深度学习算法进行训练的自然语言处理（NLP）模型，主要应用于自然语言理解和生成等领域，广义上还包括机器视觉（CV）大模型、多模态大模型和科学计算大模型等。（来自下面的GIthub项目）

github项目：GitHub - datawhalechina/self-llm: 《开源大模型食用指南》针对中国宝宝量身打造的基于Linux环境快速微调（全参数/Lora）、部署国内外开源大模型（LLM）/多模态大模型（MLLM）教程

项目介绍：本项目是一个围绕开源大模型、针对国内初学者、基于 Linux 平台的中国宝宝专属大模型教程，针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导，简化开源大模型的部署、使用和应用流程，让更多的普通学生、研究者更好地使用开源大模型，帮助开源、自由的大模型更快融入到普通学习者的生活中。

什么是LLMOps？

LLMOps介绍

LLMOps全称为”Large Language Model Operations“的缩写，即大语言模型运营，它是一套管理和部署大语言模型（如GPT）的实践方法和工具，简单来说，就是帮助我们更好地使用和管理AI语言模型的一套管理，且它是一套完整的生命周期管理体系。

graph TD
    A[数据管理] -->|收集处理| B[模型管理]
    B -->|优化部署| C[部署运维]
    C -->|服务监控| D[监控评估]
    D -->|反馈优化| A

LLMOps主要组成部分有哪些？

graph TB
    classDef header fill:#2c3e50,color:white,stroke-width:0;
    classDef data fill:#3498db,color:white,stroke:#2980b9;
    classDef model fill:#27ae60,color:white,stroke:#219a52;
    classDef deploy fill:#e67e22,color:white,stroke:#d35400;
    classDef monitor fill:#e74c3c,color:white,stroke:#c0392b;
    classDef app fill:#9b59b6,color:white,stroke:#8e44ad;

    A[LLMOps]:::header --> B[数据层]
    A --> C[模型层]
    A --> D[部署层]
    A --> E[监控层]
    A --> F[应用层]

    class B data; class C model; class D deploy;
    class E monitor; class F app;

    B --> B1[📥 数据收集]:::data
    B --> B2[🔧 数据处理]:::data
    B --> B3[💾 数据存储]:::data

    C --> C1[🤖 模型选择]:::model
    C --> C2[🎛️ 模型微调]:::model
    C --> C3[🔖 版本管理]:::model

    D --> D1[🛠️ 环境准备]:::deploy
    D --> D2[🚀 服务部署]:::deploy
    D --> D3[📈 扩展管理]:::deploy

    E --> E1[📊 性能监控]:::monitor
    E --> E2[✅ 质量监控]:::monitor
    E --> E3[🔄 反馈收集]:::monitor

    F --> F1[💻 应用开发]:::app
    F --> F2[🔌 接口管理]:::app
    F --> F3[😊 用户体验]:::app

    style A stroke:#1a252f,stroke-width:3px
    linkStyle 0,1,2,3,4 stroke:#95a5a6,stroke-width:2px

LLMOps的核心组成部分

graph TB
    classDef root fill:#2E4053,color:white
    classDef data fill:#2980B9,color:white
    classDef model fill:#27AE60,color:white
    classDef deploy fill:#E67E22,color:white
    classDef monitor fill:#E74C3C,color:white

    A[LLMOps]:::root

    A --> 1[数据管理]:::data
    A --> 2[模型管理]:::model
    A --> 3[部署运维]:::deploy
    A --> 4[监控评估]:::monitor

    1 --> 1a["▸ 数据收集<br> ▪ 业务数据采集<br> ▪ 用户交互数据<br> ▪ 外部整合"]
    1 --> 1b["▸ 数据处理<br> ▪ 清洗标准化<br> ▪ 数据增强<br> ▪ 质量控制"]
    1 --> 1c["▸ 数据存储<br> ▪ 向量数据库<br> ▪ 文档存储<br> ▪ 版本控制"]

    2 --> 2a["▸ 生命周期<br> ▪ 选型评估<br> ▪ 微调优化<br> ▪ 版本迭代"]
    2 --> 2b["▸ 性能优化<br> ▪ 参数调优<br> ▪ 提示词优化<br> ▪ 上下文管理"]
    2 --> 2c["▸ 安全合规<br> ▪ 访问控制<br> ▪ 数据隐私<br> ▪ 输出审查"]

    3 --> 3a["▸ 部署管理<br> ▪ 环境配置<br> ▪ 服务编排<br> ▪ 负载均衡"]
    3 --> 3b["▸ 扩展性<br> ▪ 水平扩展<br> ▪ 垂直扩展<br> ▪ 资源优化"]
    3 --> 3c["▸ 服务治理<br> ▪ 接口管理<br> ▪ 服务监控<br> ▪ 故障恢复"]

    4 --> 4a["▸ 实时监控<br> ▪ 性能指标<br> ▪ 资源使用<br> ▪ 响应时间"]
    4 --> 4b["▸ 质量评估<br> ▪ 输出质量<br> ▪ 准确性<br> ▪ 一致性"]
    4 --> 4c["▸ 反馈循环<br> ▪ 用户反馈<br> ▪ 自动评估<br> ▪ 持续优化"]

    style A stroke-width:0
    linkStyle default stroke:#7F8C8D,stroke-width:2px

参考文章：What Is LLMOps? Guide to Large Language Model Operations - ML Journey

RAG是什么？

RAG介绍

检索增强生成（Retrieval Augmented Generation）的过程，简称 RAG，检索增强生成是用从其他地方检索到的附加信息来补充用户输入到聊天 GPT 等大型语言模型（LLM）的过程。然后，LLM 可以使用该信息来增强其生成的响应。（图片和介绍均来自下方文章）

下面的译文是来自微信的直接图片翻译…我不知道有啥好的截图翻译…所以LLM它翻译错了我就划掉了

文章解读：【译】私域聊天机器人如何工作？检索增强的内容生成（RAG）概述 · 语雀

原文：How do domain-specific chatbots work? An Overview of Retrieval Augmented Generation (RAG) —— scriv.ai. Aug 23, 2023.

视频讲解：一文解读 RAG（Retrieval Augmented Generation）_哔哩哔哩_bilibili

PS：感谢沧海九粟老师！

TDOO待更新…

keron · 2025 年2 月 21 日 07:12

小黄太强了，感谢分享知识

XiaoHuang · 2025 年2 月 21 日 07:16

欢迎佬友交流呀！

yqyan · 2025 年2 月 21 日 07:20

首先恭喜入职。
其次，赞一个

handsome · 2025 年2 月 21 日 07:21

太强了，小黄！

XiaoHuang · 2025 年2 月 21 日 07:21

我去学习了！

XiaoHuang · 2025 年2 月 21 日 07:21

学起来呀！

handsome · 2025 年2 月 21 日 07:22

工作已经很累了，为什么知识不能主动钻进我的脑子里

Luis · 2025 年2 月 21 日 07:28

感谢黄佬分享知识！

leohoo · 2025 年2 月 21 日 07:38

太强了一直想要了解希望大佬持续更新呀

xqc · 2025 年2 月 21 日 07:41

流程图看着像mermaid又比那个好看是怎么做的呀佬

XiaoHuang · 2025 年2 月 21 日 07:45

XiaoHuang · 2025 年2 月 21 日 07:46

希望会吧！（我有点菜）

wwow · 2025 年2 月 21 日 07:48

小黄你这么优秀我压力好大

joeywang · 2025 年2 月 21 日 07:50

感谢，想学没头绪

sd8089730 · 2025 年2 月 21 日 07:53

恭喜入职，去那个AI 公司了？

XiaoHuang · 2025 年2 月 21 日 07:58

没事你也可以的

XiaoHuang · 2025 年2 月 21 日 07:58

这个先不说，我还担心我能力不足呢

sd8089730 · 2025 年2 月 21 日 07:58

死也要死里面，哈哈

XiaoHuang · 2025 年2 月 21 日 07:59

看完这篇文章后，真的是理解了RAG，写的太好啦！！！强烈建议各位一定要看看！

话题		回复	浏览量
AIGC时代！技术小白路线图+技术水帖！转码农！资源荟萃 ChatGPT , GPTs , API , Prompt , AIGC , 人工智能 , Python , GraphRAG	70	3921	2025 年1 月 4 日
TOL在线工具网站架构资源荟萃	99	4798	2025 年2 月 22 日
我们能在L站享受到什么资源？长期更新文档共建	382	14677	2025 年2 月 26 日
〖⭐️Linux DO二级及以上用户尊享阅览室〗盘点那些评论量多的帖子(目前评论量合计已超30000条,升3级和3级保级必备神器) 搞七捻三 LINUX-DO-Connect , 纯水	67	3008	2025 年2 月 18 日
【私有化AI部署教程】0基础小白，部署专属于你自己的高度私密AI聊天助手资源荟萃 ChatGPT , OpenAI , 教程 , 人工智能	25	719	2025 年2 月 27 日