Gemini Exp 1114太强了!会之前只有O1才会的题目

期待Gemini2啊,感觉会很不错

4 个赞

永久免费就要爽死了

4 个赞

这个老版本的Gemini不会,只有最新版的会:tieba_087:

2 个赞

问的就是官网studio1114阿,不然我发出来干嘛

5 个赞

我再问了一遍,它还是对的:tieba_087:

2 个赞

AIGC内容不能直接复制,只能发截图,不要到时被哪个小鬼举报了怪我没提醒

4 个赞

考公的时候这种题我都做了无数遍了,一看就知道题目没出完整。

2 个赞

是漏了一个条件,已知只有一个人说真话吧!我已经重新生成了一张,把截图给换了。

2 个赞


自己看,这题不告诉你说谎的人数 是无法得出结论的。能做出这种题的AI,并不能给正分好吧。

1 个赞

1114可以是可以,就是不能识图 :tieba_087:

7 个赞

可以识图呀!



1 个赞

加上你这个已知条件,4o也能做出来

如果不加,还做出来结果的,只能说明那个AI太单纯了。

1 个赞

当时我也没太在意,主要是网传这个问题不错的,我就拿过来测试一下,谁知道他的题目本身就有点问题,今天单独看了一下,发现确实漏了。

2 个赞

其实我一直觉得所谓O1就是GPT自己搞的加持而已,所以区分了O1和Mini两个版本。所以我觉得我用个提示词加持来对比,非常合理而公平啊。

1 个赞

17岁高中生那个是一个,还有O1刚出来的时候Github上就有了个G1,试了下效果差不多。

1 个赞

O1那么慢,都不知道里面干了点什么,还不支持流式,但是Gemini这个他也没有宣传思考,但是支持流式输出,丝毫不影响速度,有这么强就很厉害了。

1 个赞

O1很明显就是通过Agent和提示词去实现了思维链,所以费率和时间消耗都上去了。Gemini这个吧,再看看。

1 个赞

用提示词要求思维链,依然不是真的"思考",劣势依然存在,与o1不能混为一谈,它们架构之间差别很大

伪思考链的作用最多把模型发挥其可能的最大能力理论上限,而且需要更多的Tokens.为什么我说是可能?因为模型本身就有自注意力机制,将这个过程显化一定程度上能放大模型的优势与劣势,不应对提示词的作用过分夸大,实际的模型训练依然要在架构上优化.架构上的优化比提示词更简单,说实话多个模型多次配合的多Agent能达到类似的效果,但模型的配合是个问题,小模型必然是需要专门训练的.

o1也就那样,期待更好的.

1 个赞

很可以他的token只有30000,不然就得开新的,我用来问问题的,给我总结的非常高,比人工都还好,当然他是给你提供建议,列出非常详细的建议。

1 个赞

Gemini接口地址用啥嘞

1 个赞