前两天在论坛进行的模型对比实验，公布结果辣

bbznop · 2024 年4 月 4 日 04:09

之前论坛讨论的帖子

一共有 34 个提交结果，其中选择开源模型（Qwen-7b-Chat）的佬友有 18 个，选择 gpt-3.5-turbo-0125 的用户有 34 - 18 = 16 个

原始数据集（仅允许上传 zip）：

对之前的一些设定没有很好的考虑到，比如：

我想的是找个时间再做一次实验，加入更多选项（都好，都差），模型事先不透露，时间上也延长到七天，也可能会加入更多模型进行对比。

不过目前我手头只有 gpt-3.5-turbo 可以使用，有佬友有这方面比较便宜质量高的资源可以推荐下，感谢！

neo · 2024 年4 月 4 日 04:51

好东西。

Carl · 2024 年4 月 4 日 11:06

马克

whot20 · 2024 年4 月 4 日 20:53

感觉俩个都差不多，甚至 7b 的回答还仔细些

westflyyeah · 2024 年4 月 5 日 09:47

支持研究精神！

话题		回复	浏览量
国内这些开源大模型，哪个效果更好一些？机器学习	6	533	2024 年5 月 29 日
大家都用什么大模型？人工智能	15	515	2024 年3 月 1 日
❀免费API【GPT3.5+Kimi+跃问+零一万物+通义千问+智谱清言+秘塔+Groq+讯飞星火+聆听智能模型】拿去享用✿ 人工智能 chatgpt , openai	69	3379	2024 年5 月 22 日
Gemini 1.5 Pro 模型即将可用人工智能 chatgpt	8	920	2024 年3 月 24 日
一夜之间，最强开源模型易主了？人工智能	34	1544	2024 年7 月 26 日