用预测双色球的方式,简单测试对比了一下GPT-4和GPT-4o

物料准备:

  1. 双色球中奖号码输入ChatGPT之后.pdf
  2. 双色球.xlsx
  3. 支持GPT-4和GPT-4o的不同账号
    坛子不给上传太大的文件,贴个链接: https://pan.baidu.com/s/1yqu7Eg9oq5WvHdIDoyyG1g?pwd=3egr 提取码: 3egr 复制这段内容后打开百度网盘手机App,操作更方便哦

过程设计

  1. 先考察双方对pdf的解析和总结
  2. 通过对话引导,是否能做预测
  3. 再考察双方对Excel的解析,近100期的双色球中奖数据
  4. 考察双方自动数据处理后,通过提问,对数据进行提取输出

设计的问题如下:

  • 分析一下这个pdf,然后总结一下(分析和总结都能做到 :face_with_monocle:,4o太啰嗦了 :rofl:

  • 那你是否可以做到文中说的操作?(4还在说明预测的不可信,4o已经迫不及待的开始输出 :rofl:

  • (可选)是的,是随机事件,咱们来尝试模拟一下(这个是问4的,4o已经输出一堆了,很不矜持啊 :rofl:

  • 这是近100期的中奖数据(数据故意不做清洗,故意误导<其实是懒的处理了 :upside_down_face:>,中奖号码的格式是直接复制网页的,也没指明红球和蓝球,4
    做的很好 :hugs:,主动提问规则是什么,4o不管三七二十一,一顿输出,还是错的 :rofl:
    image

  • 列出在历史数据中,最常出现的10个号码(4能理解这个问题,同时还输出出现的次数,而4o就一言难尽了,改了几次它才理解意思,不过有点小怀疑是因为今天第一天发布,太多人使用,压力大,做了智能限制,因为其实试了几轮的,有时候能理解,可能负载均衡了)

  • 列出在历史数据中,红球和蓝球分别最常出现的5个号码(4o在上一个问题就是主动输出这样的,4正常理解正常输出)

  • 尝试输出你认为的下一期的中奖号码,用你的逻辑进行推理(4o好像又一次偷懒了 :rofl:

结果截图:(有点长,可以拖到最后看主观总结或下载来看细节)

  1. 先是4的截图

  2. 4o的截图

主观总结:

  1. 从回复速度来对比,4o的确是回复更快。
  2. 从回复的智能程度对比,对于同样的问题,4o有时候会答非所问,或者说是太积极的对答案进行拓展,甚至是想太多,主观能动性太强了,有点话痨。而4的话,就是中规中矩,一问一答,毫不多嘴,甚至会主动提出自己的疑问,很严谨的风格。
  3. 感兴趣的佬友可以下载物料重新测试看看

个人看法,对于不太复杂的问题,直接用4o更快的得到答案,逻辑复杂的还是暂时用4,稳一手。

17 个赞

这就去买双色球

3 个赞

符合宣传

2 个赞

去买了

2 个赞

会玩

1 个赞

拿谎言去验证谎言得到的一定是谎言

4 个赞

感谢测试,目前用几个简单测试题的感受也是这样,4o的文字综合能力可能比不上turbo,只能说要求没那么严的话4o非常好,速度快太多了。但追求极致性能和严谨,那还是4 turbo和opus稳。

3 个赞

佬,4turbo也试试~~

2 个赞

这又是什么测法。。。

1 个赞

4o的情绪化更高吧,看那个官方视频,情绪化更高涨的样子

如果用4代替4o,估计会没有什么戏剧效果,太理工科理性官方回复了。

3 个赞

你还不如让他预测圆周率最后一位 :rofl:

1 个赞

很溜啊

1 个赞

哇哦,刚刚对比了一下今天双色球开奖结果。
image

4,预测中了4个红球,喜提10元 :rofl:
image

4o,预测中了3个红球,喜提0元 :upside_down_face:
image

2 个赞

买了吗?如果2个都照着买1注,盈利6块哦 :rofl:

3 个赞

我自己用下来感觉是4o好像智能程度真不如4

1 个赞

是的,就是一个优势,天下武功,无快不破 :rofl:

1 个赞

双色球……………………以下省略一万字

1 个赞

有点意思

这就去预测大乐透

支持技术大佬