硅基笑传——凡人修仙传南宫婉变元瑶？

Extre · 2025 年3 月 11 日 07:28

如图用的硅基的嵌入模型，上传了本文当作参考来源，不得不说，目前效果还是很一般

01allthings · 2025 年3 月 11 日 07:31

请教一下，中文的嵌入模型，有比这个bge-m3更好的模型吗？
英文的话，是不是openAI的最好？

Extre · 2025 年3 月 11 日 07:34

这个没怎么玩过，想梳理一下时间线才想着玩玩的，还是和以前一样效果不太好，站内有其他佬的方案，可以去看看，这边单纯发出来看看

leowyzhang · 2025 年3 月 11 日 07:47

南宫婉已经被遗忘了

weakchen · 2025 年3 月 11 日 07:51

BGE-M3就是最好的嵌入模型，术业有专攻，它就是专家

01allthings · 2025 年3 月 11 日 08:24

英文的嵌入模型有什么推荐吗？我用cherry，调用硅基的BGE-M3建立一些英文文档作为知识库，感觉搜索不是特别准确。

weakchen · 2025 年3 月 11 日 08:28

BGE的最佳拍档是Dify中的知识库

passerby064857 · 2025 年3 月 11 日 08:33

目前最好的可能是gemini-embedding-exp-03-07吧，不過這東西額度太少根本用不了，RPM只有5，max_tokens是8192，8192*5也只有40960tokens，這個額度連一個網頁都讀不了

ati9527 · 2025 年3 月 11 日 08:38

我就说这玩意咋半天不动呢

01allthings · 2025 年3 月 11 日 08:41

我现在英文文档就丢google的notebooklm，感觉也挺好用。就是公司网络是澳门出口的，用不了notebooklm，只能在家看，不太方便

01allthings · 2025 年3 月 11 日 08:42

好的，我回头试试Dify

WyInnovate · 2025 年3 月 11 日 12:38

fastgpt 也可以试试

YougLin · 2025 年3 月 11 日 12:56

cherry studio的rag就只是简简单单的向量搜索罢了，没有整体性的理解能力。

Extre · 2025 年3 月 11 日 13:44

纯文本信息，结构看起来也挺规整的，还是说文本的结构他都解析不出来，不应该把人名也能检索错吧。

01allthings · 2025 年3 月 12 日 01:15

感谢，我也看看这个

01allthings · 2025 年3 月 12 日 02:01

graphrag
看到这句话有点害怕的样子，大佬有部署过吗？请问是非常消耗本地算力，还是需要耗费大量token。

YougLin · 2025 年3 月 12 日 02:36

用 ds v3，你可以用火山免费，也可以找找其它便宜的渠道，找不到便宜的渠道可以看看我自己的站。

整体耗费的tokens主要是在准备上，后续使用的时候耗费的tokens差不多。
根据你的数据量，再怎么多也不会过几百，再多就不是你个人玩得转的了。

话题		回复	浏览量
谷歌大善人发布新embedding模型，排名第一！搞七捻三人工智能	37	2997	2025 年4 月 7 日
硅基流动何去何从？搞七捻三人工智能	33	1637	2025 年4 月 1 日
Open WebUI + RAG 基础资源荟萃人工智能	25	2419	2025 年2 月 19 日
Cherry Studio+知识库+谷歌API小白问题，求指教文档共建人工智能	8	817	2025 年3 月 16 日
Deepseek-V3 + CoT思维链 + RAG知识库！我的AI现在强的可怕搞七捻三 DeepSeek , 人工智能 , 作品集	586	28780	2025 年4 月 10 日