1734570000 时间戳转换成北京时间
我手上的竟然都不对
gemini2exp 4o claude3.5都阵亡了 国产模型都在乱答
来晒一晒你们的结果
为啥让它答,直接让它写代码,给你运行输出结果
是这样的 让他输出代码的结果 是错的
语言大模型的本质是概率,,比如第一个字是概,第二个字可能是率、论等等,最大可能性是率,就出现概率,计算能力本来就不行
这种一般让插件执行结果
禁用function call,调用函数是作弊的行为
问题是 让他调用函数,也输出的不对呀
你这代码它没给你运行。让它使用代码解释器来计算
确实是,要求 使用代码解释器
结果对了
好家伙!失败了
我手上的各种模型 默认情况全失败,0通过
也就gpt和claude 能调用代码解释器 才能回答对
gemini2exp 让他调用代码解释器后,算到25年去了
数学问题正常,代码解释器就是用在这的
LLM可以告诉你如何计算时间戳,但是无法自己去计算
类似于
LLM可以告诉你怎么把大象放到冰箱里去,但是它无法把大象放到冰箱里去
这个问题没有挑战,暂时无解
10+11=?的问题,也不是它算出来的,只是语料里10+11=21出现的多,给你个高概率的回答
o1-pro原来这么厉害
这个是Chat2API版本的,狗屎OAI不开放我T5级官KEY的o1正式版API权限