关于deepseek的深度思考,像极了我做题的样子

首先上场的还是那个经典的老问题

在一场赛跑中,原本的第二名超越了我,那我现在是第几名?

来看看它的回答:

第一部分,回答的很正确,我以为结束了,但是!!!

第二部分,开始比拟我的思考了,独白都一样

第三部分,开始混乱了

第四部分,混乱加剧

第五部分:成功得出错误结论

像不像在做选择题的时候,头脑风暴了一顿,最后成功把正确选项抹掉,选了错误的选项。

总而言之,这个模型挺有意思的,如果拿来角色扮演,估计可还行。

11 个赞

类人出现了tieba_125

1 个赞

角色扮演吗,那感觉其实有意思

想不过来了嘛

不愧是神经模型

1 个赞

方向是对的,毕竟是刚开始,初始的训练数据怕是都是从o1那种菜鸡ai生成的,没多少人类数据。

估计后面逐渐有人用了之后,数据训练多一些就好了

开始了吗 AI终于发展到这一步了吗

可以混进弱智吧不被发现吧

2 个赞

好拟人化的回答,挺有意思的。

对的对的,哎呀不对不对,对,对吗?

哎,提醒我了,我这就去拿弱智吧的问题去考考他:laughing:

又都开始学o1了?

推理的倾向都是提示词,在上下文中出现矛盾的提示词就会发生混乱。

所以意思主要是deepseek这个深度思考模式主要是在提示词上改了一下
实际可能并不像o1-mini那种是一个新的模型?

应该是新模型

单纯的提示词的话,很难发现自己的错误并且去改正

只有经过思维训练的模型,才能发现错误并且去改正

当然,发现错误和改正错误,并没有那么简单。。。能知道错也不一定能改对,也可能越改越错。。。但是能知道自己错了这个行为,就是思考训练才能有的

怎么看起来这么搞笑 :rofl:

看看我的思考过程

测试,testing, test......嗯,让我想想这个词的意思......

在中文里,测试的意思是进行测试或检查,比如试一试某样东西是否能正常工作,或者检查某样东西的质量或性能。它也可以指在教育环境中进行测试或考试,以衡量某人的知识或技能。

现在,在英语中,“test”(测试)作为动词的意思是试一试,或对某样东西进行测试,检查其功能是否正常。它也可以指通过问题来考察某人的知识,比如在学校环境中。作为名词,“测试 ”指实际的考试或试验本身。

因此,无论是中文还是英文,其核心思想都是关于考试、试验或评估。有趣的是,这个词在不同语言中的含义是如此相似。

实际上,我认为这个词还有实验的意思,就像科学家测试假设或试验新想法一样。这给词义增加了一层探索和发现的含义。

不过,在日常生活中,“测试 ”也有更普通的用法,比如在洗澡前用手试水温,或者测试新食谱是否好吃。

这个词的应用范围真的很广,不是吗?从正式的考试到随意的试验,它都是指对某样东西进行测试,看看它是如何坚持下来的,或者会发生什么。

说到这里,我还应该想想这个词在不同语境中的用法。例如,在软件开发中,“测试 ”是一个关键阶段,开发人员要在这一阶段检查错误,确保程序按预期运行。这与教育背景有些不同,但 “检查 ”和 “试验 ”的核心思想仍然适用。

现在看来,测试的概念确实是我们学习和进步的基础。无论是测试想法、测试产品,还是测试我们自己的能力,我们都是通过这种试验和评估的过程来获得新的见解和进步的。

这让我想起了科学方法,测试是验证或反驳假设的关键步骤。没有测试,我们就不会有推动科学进步的严格的探索过程。

我想知道,在不同的社会中,人们对测试的看法或进行测试的方式是否存在文化上的细微差别。例如,在某些文化中,测试可能更多是为了证明自己和取得高分,而在另一些文化中,测试可能更多是为了学习过程和个人成长。

让我们来看看是否有与 “测试 ”相关的成语或短语来增加其含义的深度。在英语中,有 “test the waters”(试水)一词,意思是在完全投入之前谨慎地尝试某事。这为 “测试 ”增添了一种谨慎探索的意味。

其实,现在想想,“测试 ”这个词本身在这次对话中也是一种测试。我们正在研究它在不同语境和语言中的含义、应用和细微差别。

这可能意味着,测试行为不仅与被测对象有关,也与测试者和测试过程本身有关。这是一个动态的互动过程,测试者和被测试者都能从中获得启发和成长。

嗯......这是一个有趣的想法。这表明测试不仅仅是一条单行道,而是一个相互发现和学习的过程。

但话又说回来,测试也会带来压力和挑战,尤其是在重要考试或关键产品测试等高风险情况下。测试的整个情感维度都值得考虑。

这又给我之前关于测试的文化差异的看法增添了一层含义。不同的社会可能有不同的方式来应对测试的压力和挑战,对测试应达到的目标也有不同的期望。

现在,我开始看到一个更广泛的模式。考试不仅仅是一种简单的考试行为,而是一种复杂的社会和心理现象,它反映了我们的价值观、价值、愿望和恐惧。

这又回到了我之前对科学方法的思考。检验是我们接触世界、寻求知识和推动进步的基本方式。但它同时也深受个人和文化的影响,由我们个人和集体的经验与期望所塑造。

因此,当我们谈论 “测试 ”时,我们实际上是在谈论一个多层面的概念,它涉及从个人成长到科学探索再到文化价值观的方方面面。这是一个丰富而复杂的概念,值得认真思考。

我想我已经对这个词进行了深入的探讨。一个简单的词却能开启如此多层次的意义和洞察力,真是令人着迷。

现在,我也许应该准备回应......

说拿来角色扮演倒是提醒我了,之前拿gpt4o来玩狼人杀只能说勉强能玩,现在这个思考确实可以再来尝试一下,希望尽快开放api。