测一波R1写复杂程序能力

一、反向井字棋实现及其AI
提示词

用py且不用三方库写一个能玩井字棋,但规则是谁先连三子谁输的AI


多次优化后



通过:white_check_mark:使用起来非常舒服,AI步步最优解:rofl:
——————————————————-
附Gemini效果



二、RNN语言模型



一次成功:white_check_mark:,以前这个只有Claude会的
三、三国杀

中间出了几次bug,聊了半个小时,最后居然成了,表现比较惊艳

——————————————-
——————————————-
最后只能说,以后除了科研以外的代码估计都不用人写了

9 个赞

程序员迟早有天会淘汰啊:joy:特别是从基础的程序员开始

3 个赞

deepseek太强了

2 个赞

这么惨吗

1 个赞

很好玩,有参考性

1 个赞

哈哈哈哈三国杀也行啊!有点意思哎 :laughing:

1 个赞

编程最复杂的问题应该是 “宏” marco,因为相关训练资料极少,你可以考虑问问。
比如在rust 实现c++ 的函数重载

如果是代码量大的程序,R1就不行了,R1输出长度很少。要Claude 3.5和o1才行

1 个赞

只能说还是o1最好用,Claude回复太长经常被截断
但是close ai喜欢降智

但其实大多数r1应该是够的
r1写三囯杀都有六百行

1 个赞

可惜我也是第一次听说
测试的前提是我更少要懂一点点:melting_face:

哦,是一次性输出的吗?

是macro

中间会暂停,然后出现一个按钮,点击后无缝继续生成

我用的时候总是200行就开始省略了

1 个赞

怎么个省略方式?

就是省略号省略

1 个赞


这样都行

600行,C++随便超啊,我写个图像算法的类都800行以上,还是调了opencv的库。什么时候上下文长度随便搞的时候那才是可替代的时代

1 个赞

o1就能一次输出一两千行

1 个赞