佬友的需求应该是RAG,这个大模型包括两部份
一个是批量处理文档时用的嵌入模型,这个关系到引用指定段落的准确性
硅基流动的 Pro/BAAI/bge-m3
还不错,不过没试过量大的情况
另一个是聊天模型,把找到的段落当作上下文进行最终思考,这个就看佬友需求了,最近deepseek v3挺便宜的
另外,这是论坛里关于RAG的科普和用例
佬友的需求应该是RAG,这个大模型包括两部份
一个是批量处理文档时用的嵌入模型,这个关系到引用指定段落的准确性
硅基流动的 Pro/BAAI/bge-m3
还不错,不过没试过量大的情况
另一个是聊天模型,把找到的段落当作上下文进行最终思考,这个就看佬友需求了,最近deepseek v3挺便宜的
另外,这是论坛里关于RAG的科普和用例