看到佬友对 GPT3.5 的猜测,刚好之前做了个在线模型对比

原帖地址:

正巧,最近训练模型的时候,想着做模型的对比,于是写了一个模型对比页面,左侧是国产 7b 开源模型,右侧是 GPT-3.5-Turbo

https://0da14ffbd8764f16c0.gradio.live/

佬友们可以对模型的输出结果进行对比,并选择你更看好的结果,两天后公布对比结果。

注:选择的结果数据会本地保存后用于模型训练、研究使用,近两日数据最终会跟随本帖开源

引用佬友提出的一个问题:

这边建议临时就直接清空答案,后续再有模型对比时候,我再加入这个功能

3 个赞

有可能。。

1 个赞

不学一下 lmsys,多给两个选项吗,都好,都差,毕竟有时候回复内容差别不大

1 个赞

有道理,一开始没想到

那我知道左侧是谁了。。。好像真大差不差

是的,基本上差距不大,而且刚看了下后台的用户反馈,选择 7b 模型的佬友数量更多。

不过目前还只是一些基本问题,没有涉及到逻辑推理、数据总结、角色扮演等其他问题,等近两日实验结束后,我再将完整数据公开。

嗯嗯,不过你事前应该不明说哪边是哪个模型的,盲测下 :joy:

有道理,等这次实验结束吧,我再整一个盲盒实验,时间上也长一点

子:GPT3.5真会编。。
这个内容能复制出来看下嘛。。


这个帖子主要就是这个图片,gpt-3.5一本正经地解释一个骂人的话。