用了一周gemini,对1121模型的识图能力有很深的印象。手写体的数学题目能识别并完美作对。想知道这个模型识图的极限
相关话题
话题 | 回复 | 浏览量 | 活动 | |
---|---|---|---|---|
哪款大模型最适合OCR图片转文字?或者验证码识别?佬们有什么推荐? | 1 | 257 | 2024 年12 月 4 日 | |
gemini2.5 ocr能力屌爆了 | 32 | 2052 | 2025 年4 月 5 日 | |
事实证明,Gemini1.5Pro的识图能力最强,没有之一,本人实测 | 66 | 3243 | 2024 年11 月 17 日 | |
gemini-exp-1121的视觉能力没啥提升 | 3 | 352 | 2024 年11 月 22 日 | |
Gemini-exp-1114的视觉能力得到巨大提升 | 26 | 1650 | 2024 年11 月 29 日 |