Mistral AI 推出 Mistral OCR API:宣称最快最准光学字符识别,千页 1 美元

Mistral AI 表示这一 API 具备优秀的多模态文档处理能力,能从 PDF、幻灯片、数学表达式、LaTeX 学术文档等复杂文档元素中提取文本内容,所得结果将以 Markdown 文件的形式清晰呈现。

Mistral OCR 模型可解析、理解和转录数千种脚本、字体和语言。根据 Mistral AI 给出的数据,该模型现有版本在识别中的表现优于谷歌 Document AI、微软 Azure OCR、OpenAI GPT-4o 等一系列竞争者。 Mistral AI 推出 Mistral OCR API:宣称最快最准光学字符识别,千页 1 美元 - IT之家

9 个赞

有大佬来讲下这个要咋用吗

1 个赞

太棒了,昨天刚刚嫖到25美金余额 :winking_face_with_tongue:

怎么做到的,哈哈

中文怎么样啊

求問教程

在这里可以领25刀的promo code

1 个赞

感谢,可以用,

论中文识别,还是kimi最强。

图片 OCR 挺烂的。不知道 PDF 效果怎么样

1 个赞

我帮大家测过了,不严谨地说,版面识别还可以,但是中文文本识别真不行,至少比不过Gemini-2.0-Flash和Qwen2.5VL-72B。

25刀的链接很好

不太行,看实测的文章: