简单测试了一下天工的o1——————宣传太多研发太少





看上去上下文非常糟糕,单次回答问题能力也不强
:cold_sweat:

4 Likes

这么差吗有

天工确实不太行,之前只有agent火了很短的一阵。

哎,自研路漫漫

:joy:感觉除了deepspeek是宣传少但出结果,其他的只有“对标o1”:joy:

4 Likes

就蹭名字。。

1 Like

基本放弃了

只有名字对标了 :clown_face:

2 Likes

:bili_040: 2024年3月的评测。不用管某个文心一言。

1 Like

这太拉了吧 :rofl:

蚌埠住了肯定是百度发的哈哈哈哈

天工一直不怎么样,还把chatgpt.cn这个域名给抢了,实际很一般

2 Likes

“文心一言遥遥领先”

文心一言排第一,那这场考试、这张图还有参考的意义吗?

都快一年了,没啥参考意义了,大模型发展得超快