为什么gpt-4.5总是偷懒,婉拒长文本翻译?

我尝试让gpt-4.5翻译一整篇数学论文,也就11页。
我使用mistral的ocr识别成markdown文档,然后让gpt-4.5把上传的markdown文本翻译成中文。

我使用的提示词:



但是三次尝试都以gpt-4.5不愿意全文翻译而失败。


我相信gpt-4.5是更聪明的“文科模型”,我觉得翻译应该用参数量大的模型,因为它对语言处理更加细腻,而小模型翻译的效果可能近乎机翻,不理想;但是gpt-4.5懒懒的,令人苦恼。

之前用翻译PDF文件的工具,更多是把PDF拆成很多小段的话,然后让大模型翻译,再重组成翻译后的PDF。

是否是需要更严格和格式化的提示词来指挥gpt-4.5呢?
大模型到底应该如何翻译PDF才能做到信雅达(便于阅读理解),保持PDF结构以及可靠呢?
佬友可有想法~

11 Likes

4.5高情商模型,已经预判了你做的一切w

9 Likes

oh, no!
我想要一个乖乖听话的高情商模型hhh

3 Likes

话说4.5翻译不是太贵了么。。。4o翻译我觉得就挺奢侈了

3 Likes

用4.5翻译?!

4 Likes

页面版默认偷懒的,为了让你用150刀的api :laughing:

5 Likes

首先,提示词建议换更直白通俗易懂的,你说信雅达,模型可能不能完全get到它的意思。

其次,gpt4.5上下文长度可以查一下,看看有多少,超过了规定的,它有的会翻译,但会截断,有的甚至直接摆烂了。

最后翻译的话可以看看站里的deepL,那个我感觉翻译的挺准的。

2 Likes

内容发出来我试试呢

1 Like

1.md (46.7 KB)

请君尝试

1 Like

认可的,我会倾向于4o,但不会用4o-mimi
这次用4.5只是一次尝试 :smiling_face:

1 Like

花了我 10 块钱 :clown_face:


1 Like

和Claude 3.5一样

可以试试这个

痛哭,大佬破费了 :pleading_face:

他知道自己很贵,所以故意让自己闭嘴怕浪费了你的token,太贴心了:sob:

4 Likes

mistral的ocr就是le chat官网 直接传pdf叫他识别吗

这样的提示词我见过,例如之前流传的windsurf的提示词。

现在的sonnet 3.7,它已经有比较清晰和固执的“人格”,这种提示词骗不动它,sonnet 3.7的harmless的特性会忽略提示词中的这种PUA背景,并且假装听进去了,但仍然给出它对一个正常提示词应该给出的输出。

是因为你没有给它设定token,也就是断句

什么玩意儿

……?那有没有可能是prompt设计有问题

sonnet-3.7的指令依从性是要高于3.5的