中文大模型基准测评2024年10月报告

lezishen · 2024 年11 月 8 日 02:07

Qiner · 2024 年11 月 8 日 02:13

o1-preview 份量和速度都没法日用。Claude 3.5 Sonnet 和 GLM-4-Plus 这俩很强而且也不贵。

lezishen · 2024 年11 月 8 日 02:13

哈哈哈哈哈哈哈啊哈哈哈哈

QAWS12g · 2024 年11 月 8 日 02:14

GLM-4-Plus强在哪里。代码强吗

bbb · 2024 年11 月 8 日 02:16

第一个榜怎么gpt-4o都没有

Qiner · 2024 年11 月 8 日 02:16

强在得分.jpg 国区第一了。目前我的日用模型，在中文母语的场景下体验比 4o/gemini 那些好些，还有因为是国内的响应速度比境外的快。

榜单有 Qwen-72B，但感觉 Qwen 技能全点在专攻得分上了，实用体验并不好经常输出乱码那些。或者无限 \n\n\n\n\n\n\n\n\n\n\n

lezishen · 2024 年11 月 8 日 02:18

估计默认测的是LEAST版本了

QAWS12g · 2024 年11 月 8 日 02:32

对大参数的模型有好感

话题		回复	浏览量
求求模型推荐搞七捻三人工智能 , 快问快答	15	707	2024 年11 月 15 日
目前哪个模型综合能力强呢，或者说哪个模型在某一领域很突出？搞七捻三人工智能 , 快问快答	5	263	2024 年11 月 6 日
最新排行榜 01万物超过 4o Last updated: 2024-10-27. 搞七捻三人工智能	4	247	2024 年11 月 5 日
大模型排行榜看花了眼啊资源荟萃人工智能	9	937	2024 年12 月 4 日
本地大模型效果还是比较差搞七捻三人工智能	20	346	2024 年11 月 18 日