OCR识别不准确问题 | Notion

某张图片识别效果很差劲，基本不可用

背景

竖立文字效果极差

Untitled

微信自带

Untitled

ishort

Untitled

千问

Untitled

白猫

图片转文字 - 图片转Excel表格 - PDF转Word - 白描网页版

Untitled

魔搭OFA

效果好

OFA 多模态 OCR 场景

OFA(One-For-All)是通用多模态预训练模型，使用简单的序列到序列的学习框架统一模态（跨模态、视觉、语言等模态）和任务（如图片生成、视觉定位、图片描述、图片分类、文本生成等），详见我们发表于ICML 2022的论文：

OFA: Unifying Architectures, Tasks, and Modalities Through a...