目前能力最强模型oai Deep Research测试帖(提供免费的DR进行测试)

接上一贴:DeepResearch是目前数学最强的ai模型(附使用prompt)

考虑到绝大多数人没有资源使用DR(20刀plus每月10次,200刀pro每月120次),所以本帖提供免费的DR进行测试
目前只接受数学或者相关的专业问题(考虑次数问题,有其他问题也可以发,但会根据资源决定是否测试),用于prompt测试,没看过上一个帖子总结一下就是使用prompt最大化利用DR o3模型的能力,可以参考以下问题(应该是我初中出的最难的一道中考级数学题了,目前只有DR能做,o3mh也无法做,这里也感谢一下@chat01提供的少量积分用于之前测试):https://chat01.ai/zh/chat/01JP4VP437BDTRNK0VDK69NT9Q

目前我有个人测试渠道,每天的测试量近乎无限,佬u们尽管上题
可以将问题评论,考虑隐私问题也接受pm,如果需要测试还请点一个免费的赞 :wink:

33 Likes

感谢大佬

1 Like

要积分的

1 Like

我有资源测试,给题目就可以

http://lilinux.do/t/topic/402846/204
你试试怎么一次让o3回答所有问题?我试的时候他会去网上找题然后乱答

不止数学能力,感觉生成的文章也很牛,但是这个价格太离谱,佬友搭建的这个站,9.9刀200积分,差不多只能问3次,怎么感觉比自己开通会员还亏呢,会员140一个月还能问10次

1 Like

就是整体能力都很强的,因为是o3驱动的,主要看使用什么prompt,如果有问题也可以dm(私信)我,我资源有余就可以帮问

1 Like

是数学题吗,目前还没有很多的测试,可以试试这种,不过ta本来也不太适合一次性解多道题:

**注意这是数学问题,需要求解解析解,no_websearch(专注数学有深度和创造性的高级推导), rarely_python(仅允许少量数值的分析作为辅助,不能作为解答过程),最终解答过程应当标准且详尽完整,不能省略任何推导和计算!作为题解展示!

**Start Deep Research(without websearch)
3 Likes

感觉可以再和pplx,gen,you,x和谷歌的深度搜索进行对比,看看他们之间的差距如何


答案:

1 Like



佬你再看下,有两道题的,第一题求曲线系方程我都默认对,第二第三问才是难的

1 Like


第三问多了个0

2 Likes

定点确实是(0,-3/5)

2 Likes

可以让他总结一下最近英一事件始末么?

1 Like

又试了一遍,可以答对,就不截图了
其实这题也不是很难(感觉没有我出的那些题难)

1 Like

你是分批拆题目做的吗?我这边deepresearch测出来只对了一半

1 Like

http://paste.onesofpi.me/share/paste/x01RBqWs

2 Likes

没,一次性的,公式太多错误,一会latex,一会katex,不好直接分享

可能是我这里共享号降智了吧,不过确实是触发了deepresearch的进度条来着,挺奇怪的