版本:2024-12-10
deepseek-chat
deepseek-chat 模型升级为 DeepSeek-V2.5-1210,模型各项能力提升,相关基准测试:
- 数学能力:在 MATH-500 基准测试中的表现从 74.8% 提升至 82.8%
- 代码能力:在 LiveCodebench (08.01 - 12.01) 基准测试中的准确率从 29.2% 提升至 34.38%
- 中文写作与推理能力:在内部测试集中表现也有相应提升
与此同时,全新版本的模型对文件上传和网页总结功能的用户体验进行了优化。
12 个赞
model
(model)
12
年末了 卷起来。话说deekseek似乎没有多模态?
所以一直很好奇代码准确度连一半都没达到的AI(无针对)为什么敢有人用它写代码 为什么他又确实能写好代码呢
2 个赞
AlphaCat
(AlphaCat)
15
可能因为,程序莫名其妙的不能运行,但是重新运行一下就发现莫名其妙的能运行了吧。
1 个赞
SuperLee
(SuperLee)
16
佬也不能不写bug吧,有问题扔回去重写让它改去呗。
1 个赞
jedixu
20
真良心啊,期待各家AI一起努努力,干死CloseAI先