原帖地址:
正巧,最近训练模型的时候,想着做模型的对比,于是写了一个模型对比页面,左侧是国产 7b 开源模型,右侧是 GPT-3.5-Turbo
https://0da14ffbd8764f16c0.gradio.live/
佬友们可以对模型的输出结果进行对比,并选择你更看好的结果,两天后公布对比结果。
注:选择的结果数据会本地保存后用于模型训练、研究使用,近两日数据最终会跟随本帖开源
引用佬友提出的一个问题:
这边建议临时就直接清空答案,后续再有模型对比时候,我再加入这个功能
原帖地址:
正巧,最近训练模型的时候,想着做模型的对比,于是写了一个模型对比页面,左侧是国产 7b 开源模型,右侧是 GPT-3.5-Turbo
https://0da14ffbd8764f16c0.gradio.live/
佬友们可以对模型的输出结果进行对比,并选择你更看好的结果,两天后公布对比结果。
注:选择的结果数据会本地保存后用于模型训练、研究使用,近两日数据最终会跟随本帖开源
引用佬友提出的一个问题:
这边建议临时就直接清空答案,后续再有模型对比时候,我再加入这个功能
有可能。。
有道理,一开始没想到
那我知道左侧是谁了。。。好像真大差不差
是的,基本上差距不大,而且刚看了下后台的用户反馈,选择 7b 模型的佬友数量更多。
不过目前还只是一些基本问题,没有涉及到逻辑推理、数据总结、角色扮演等其他问题,等近两日实验结束后,我再将完整数据公开。
有道理,等这次实验结束吧,我再整一个盲盒实验,时间上也长一点