某张图片识别效果很差劲,基本不可用
竖立文字效果极差




图片转文字 - 图片转Excel表格 - PDF转Word - 白描网页版

效果好
OFA 多模态 OCR 场景
OFA(One-For-All)是通用多模态预训练模型,使用简单的序列到序列的学习框架统一模态(跨模态、视觉、语言等模态)和任务(如图片生成、视觉定位、图片描述、图片分类、文本生成等),详见我们发表于ICML 2022的论文:
OFA: Unifying Architectures, Tasks, and Modalities Through a...