gemini2.5 ocr能力屌爆了

ns123 · 2025 年3 月 28 日 06:11

手写汉字轻松拿捏。。。

fangyuan99 · 2025 年3 月 28 日 06:19

gemini 多模态能力一直都是顶尖的，从 1.5 时代就很强

Throttle · 2025 年3 月 28 日 06:20

这都能识别啊

Heiyugg · 2025 年3 月 28 日 06:35

有些字蛮潦草也能识别，是蛮狠的

handsome · 2025 年3 月 28 日 06:37

哇！这么强！

Joker228 · 2025 年3 月 28 日 06:45

这么厉害，

FuckNvidia · 2025 年3 月 28 日 06:50

OCR我觉得用2.0 Flash够了，2.5 pro 真的有点浪费资源了。

linux.undo · 2025 年3 月 28 日 07:36

看了原视频，的确可以碾压手机里的扫描app

ningnao · 2025 年3 月 28 日 07:47

Qwen-VL-OCR-Latest 识别出来差一个落字，看起来跟截图之后鼠标挡住有点关系…

细雨初晴润苔痕
闲登小径入荒村
风前杨柳千丝动
树下花点点魂
春日暖云影温
诗情画意且留存
漫山桃李无言语
纷飞快蝶入紫门

capgrey · 2025 年3 月 28 日 07:48

感觉以后，人能看懂的，AI也能看懂。
人看不懂的，AI也有可能看懂。

fengchris · 2025 年3 月 28 日 07:51

真的厉害了

Gforward · 2025 年3 月 28 日 07:57

nba

tianyang · 2025 年3 月 28 日 08:05

这个好像不开源吧，不过识别好屌

chunkk · 2025 年3 月 28 日 08:07

这个视频在论坛一个佬友的帖子里有总结，总之OCR识别是真厉害，对比当下openai Claude，还有千问

wo_wo · 2025 年3 月 28 日 08:31

视觉能力很强，用来翻译漫画也可以理解分镜顺序了

Mee · 2025 年3 月 28 日 08:47

医生的手写处方能不能识别

justin5 · 2025 年3 月 28 日 08:52

试了下识别拼音，比豆包差点。

Sarah_Yu · 2025 年3 月 28 日 09:06

求问对于带箭头的流程图，哪个模型效果比较好

A_zhao · 2025 年3 月 28 日 09:12

gemini确实很强

HiJack_D · 2025 年3 月 28 日 09:14

来人，上中医方子

话题		回复	浏览量
豆包识别中文手写体非常优秀开发调优人工智能	41	619	2025 年3 月 25 日
Mistral AI 推出 Mistral OCR API：宣称最快最准光学字符识别，千页 1 美元前沿快讯	12	479	2025 年3 月 12 日
求助，寻找自动用一个ai进行ocr识别，再将识别结果递交另外一个ai处理的程序或方法搞七捻三快问快答	23	270	2025 年3 月 9 日
事实证明，Gemini1.5Pro的识图能力最强，没有之一，本人实测资源荟萃人工智能	66	3233	2024 年11 月 17 日
实测 Gemini 火热的 p 图能力🔥 前沿快讯纯水	25	1117	2025 年3 月 15 日