某张图片识别效果很差劲,基本不可用

背景

竖立文字效果极差

Untitled

微信自带

Untitled

ishort

Untitled

千问

Untitled

白猫

图片转文字 - 图片转Excel表格 - PDF转Word - 白描网页版

Untitled

魔搭OFA

效果好

OFA 多模态 OCR 场景

OFA(One-For-All)是通用多模态预训练模型,使用简单的序列到序列的学习框架统一模态(跨模态、视觉、语言等模态)和任务(如图片生成、视觉定位、图片描述、图片分类、文本生成等),详见我们发表于ICML 2022的论文:

OFA: Unifying Architectures, Tasks, and Modalities Through a...