参考链接:
https://x.com/iamRezaSayar/status/1885760491466997791
https://x.com/Yuchenj_UW/status/1885416559029740007
https://x.com/Yuchenj_UW/status/1885472365309833382
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
https://x.com/iamRezaSayar/status/1885760491466997791
https://x.com/Yuchenj_UW/status/1885416559029740007
https://x.com/Yuchenj_UW/status/1885472365309833382
o3-mini 碾压DeepSeek R1?一条python程序引发近400万围观
这个测试最佳答案是 grok-3
但看起来ds表现也还不错
我之前没发现 还能这么好玩
有没有大佬搞搞看.
Beyond fun
o3-mini-high
指令是啥
用o3-mini-high搓小玩具可好玩了。
你这个也不错
直接OCR楼主的
编写一个Python程序,显示一个球在旋转的六边形内弹跳。球应该受到重力和摩擦力的影响,并且必须逼真地从旋转的墙壁上弹起。
有意思,
这么高级我问不出来
你可以问他咋办
Gemini Exp 1206
你这个也不错
看看我这个
编写一个用于科普的、展示太阳系运行的演示模型。要求可以通过鼠标交互,有简要的介绍。要求美观和科学性。具有复杂感。我需要一个双击打开网页可以运行的文件。
让AI生成更真实点的
从这一方面,其实在某种程度上可以证明o3-mini-high的编程能力比o1-pro的要好。
我输入的prompt都是
write a Python program that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically.
白色背景的是o1-pro的结果,黑色背景的是o3-mini-high的结果(虽然两个propmt都是一样的,但是还贴心的给我生成了两个不同颜色的背景来区分。我真的哭死)
录制的时候可能帧数有点低了,实际上黑色背景的没有这么卡
可以看见o1-pro在这给我瞎搞。。而且两个程序都不贴心,在给出代码之前都不告诉我要pip install pygame
可以多试试