readiris corporate教程-贝博恩创新科技网

Readiris Corporate 教程：从入门到精通

Readiris Corporate 是一款功能全面的专业 OCR 软件，主要用于将扫描的纸质文档、PDF 文件和图片中的文本、图像、表格识别并转换为可编辑的格式，如 Word、Excel、PDF 等，它以其高识别率、批量处理能力和对复杂版式的优秀支持而闻名。

（图片来源网络，侵删）

Readiris Corporate 的安装过程非常直观：

启动 Readiris Corporate 后，您会看到一个简洁而功能强大的界面,主要分为以下几个区域：

这是最常用、最核心的工作流程,适用于处理单个文档。

您有多种方式将文档导入 Readiris：

（图片来源网络，侵删）

在开始识别之前，请在右侧的“导出设置”窗格中进行配置,这直接影响最终效果。

A. 选择输出格式 在“导出为”下拉菜单中选择您需要的格式。
- Microsoft Word (.docx): 保留原文档的段落、字体和布局,适合识别纯文本或图文混排的文档。
- Microsoft Excel (.xlsx): 专门用于识别表格，软件会自动检测单元格、行和列,并填充数据。
- PDF: 您可以创建一个“可搜索的图像 PDF”（在图像上叠加透明文本层）或一个“可编辑的 PDF”（真正的文本格式）。
- HTML, 文本, 无格式文本: 其他格式选项。
B. 设置页面布局 告诉软件如何理解文档的结构。
- 单栏: 适用于简单的信件、文章。
- 多栏: 适用于报纸、杂志等有多个文本列的文档。
- 表格: 当您选择输出为 Excel 时，此选项尤为重要,软件会全力识别表格结构。
- 杂志/报纸: 混合了文本和图片的复杂布局。
C. 配置 OCR 语言 在“OCR 语言”中，勾选文档中使用的语言，可以多选，中文简体”+“英文”，确保语言选择正确,能显著提高识别准确率。
（图片来源网络，侵删）
D. 其他高级选项
- 保留原始图片: 勾选此项后，导出的 Word 或 PDF 文档中会保留原始的扫描图片，识别的文本会作为“隐藏层”或浮动文本框出现,方便您对照修改。
- OCR 模式: 通常使用默认的“标准”即可，对于质量很差的扫描件，可以尝试“模糊文档”或“手写”模式。

点击“OCR”按钮：完成所有设置后，点击功能区或快速访问工具栏中的 “OCR” 按钮（或按 F9）。
等待处理：软件会开始分析图像并进行识别,处理速度取决于文档页数和电脑性能。
预览与修正：识别完成后，软件会自动打开一个新窗口，左侧是识别结果（可编辑文本），右侧是原始图像。这是修正错误的最佳时机！
- 修正错误：直接在左侧文本框中像在 Word 里一样修改错别字。
- 重新识别：如果某个区域识别错误，可以在右侧图像中选中该区域，然后右键选择“重新识别”。
- 忽略区域：如果图像中有不需要识别的 Logo、边框或噪点，可以用“忽略区域”工具（通常是红色蒙版）将其框选起来,软件会跳过这部分。
保存文件：确认无误后，点击“文件” -> “另存为”，或直接按 Ctrl + S，选择保存位置和文件名,即可导出为您设置好的格式。

这是 Readiris Corporate 的王牌功能,可以极大地提高工作效率。

将扫描的 PDF 转换为可搜索/可编辑的 PDF：
1. 导入一个纯图片的 PDF 文件。
2. 在导出设置中，选择格式为 PDF。
3. 在“PDF 设置”下，选择 “可搜索的图像 PDF” 或 “可编辑的 PDF”。
4. 执行 OCR，即可得到一个可以复制文本、使用 PDF 搜索功能的文件。
合并多个文件：在批处理中，您可以将多个识别后的文档合并成一个大的 Word 或 PDF 文件。

如果识别准确率不理想，可以点击功能区 “工具” -> “OCR 设置”,进行更精细的调整：

问题	可能原因	解决方法
识别率低，错别字多	扫描质量差（模糊、有阴影） OCR 语言选择错误字体特殊或手写体	重新扫描，确保分辨率至少为 300 DPI。检查并正确选择所有使用的语言。对于特殊字体，尝试使用“字体训练”功能（高级功能）或手动修正。
表格识别错乱	页面布局未选择“表格” 表格线不清晰或有断点