我尝试让gpt-4.5翻译一整篇数学论文,也就11页。
我使用mistral的ocr识别成markdown文档,然后让gpt-4.5把上传的markdown文本翻译成中文。
我使用的提示词:
但是三次尝试都以gpt-4.5不愿意全文翻译而失败。
我相信gpt-4.5是更聪明的“文科模型”,我觉得翻译应该用参数量大的模型,因为它对语言处理更加细腻,而小模型翻译的效果可能近乎机翻,不理想;但是gpt-4.5懒懒的,令人苦恼。
之前用翻译PDF文件的工具,更多是把PDF拆成很多小段的话,然后让大模型翻译,再重组成翻译后的PDF。
是否是需要更严格和格式化的提示词来指挥gpt-4.5呢?
大模型到底应该如何翻译PDF才能做到信雅达(便于阅读理解),保持PDF结构以及可靠呢?
佬友可有想法~
11 Likes
oh, no!
我想要一个乖乖听话的高情商模型hhh
3 Likes
Alfred6
(格里菲斯)
4
话说4.5翻译不是太贵了么。。。4o翻译我觉得就挺奢侈了
3 Likes
首先,提示词建议换更直白通俗易懂的,你说信雅达,模型可能不能完全get到它的意思。
其次,gpt4.5上下文长度可以查一下,看看有多少,超过了规定的,它有的会翻译,但会截断,有的甚至直接摆烂了。
最后翻译的话可以看看站里的deepL,那个我感觉翻译的挺准的。
2 Likes
认可的,我会倾向于4o,但不会用4o-mimi
这次用4.5只是一次尝试 
1 Like
Aopex
(玛奇玛)
14
他知道自己很贵,所以故意让自己闭嘴怕浪费了你的token,太贴心了
4 Likes
mistral的ocr就是le chat官网 直接传pdf叫他识别吗
这样的提示词我见过,例如之前流传的windsurf的提示词。
现在的sonnet 3.7,它已经有比较清晰和固执的“人格”,这种提示词骗不动它,sonnet 3.7的harmless的特性会忽略提示词中的这种PUA背景,并且假装听进去了,但仍然给出它对一个正常提示词应该给出的输出。