但是这种非原装思维链有时会负优化,比如
这道题裸的DeepSeek V3依托微调时加入的一点思维能力可以直接秒掉,但是加了这段10000token的巨型prompt之后会反复算错导致耗尽输入token数也没算完