贝博恩创新科技网

readiris corporate教程

Readiris Corporate 教程:从入门到精通

Readiris Corporate 是一款功能全面的专业 OCR 软件,主要用于将扫描的纸质文档、PDF 文件和图片中的文本、图像、表格识别并转换为可编辑的格式,如 Word、Excel、PDF 等,它以其高识别率、批量处理能力和对复杂版式的优秀支持而闻名。

readiris corporate教程-图1
(图片来源网络,侵删)

第一部分:软件安装与界面概览

安装

Readiris Corporate 的安装过程非常直观:

  1. 下载安装程序。
  2. 双击运行程序。
  3. 按照安装向导的提示,点击“下一步”。
  4. 输入序列号:这是关键一步,请确保输入您购买的激活码。
  5. 选择安装路径和组件(通常保持默认即可)。
  6. 完成安装并重启电脑。

主界面介绍

启动 Readiris Corporate 后,您会看到一个简洁而功能强大的界面,主要分为以下几个区域:

  • A. 功能区:顶部是核心功能区,包含了所有操作命令,如“文件”、“编辑”、“OCR”、“批处理”等。
  • B. 快速访问工具栏:功能区下方,包含最常用的快捷操作,如“新建”、“打开”、“保存”、“扫描”、“OCR”等。
  • C. 预览窗口:中间最大的区域,用于显示您要处理的文档图像,您可以在这里进行旋转、裁剪、删除页面等操作。
  • D. 导出设置窗格:右侧的面板,用于设置识别后的输出格式、页面布局、OCR 语言等关键参数。
  • E. 缩放控制:右下角,用于调整预览窗口中图像的显示大小。

第二部分:基础操作流程(三步完成识别)

这是最常用、最核心的工作流程,适用于处理单个文档。

Step 1: 导入文档

您有多种方式将文档导入 Readiris:

readiris corporate教程-图2
(图片来源网络,侵删)
  • 直接拖放 最简单的方式,直接将您的扫描文件(PDF, JPG, PNG, TIFF 等)从文件夹拖拽到预览窗口中。
  • 使用“打开”命令 点击快速访问工具栏的“打开”按钮,或按 Ctrl + O,在弹出的对话框中选择您的文件。
  • 扫描文档 如果您有扫描仪,可以直接点击“扫描”按钮,软件会自动调用扫描仪驱动程序,将纸质文档扫描并导入。
  • 使用剪贴板 在其他程序(如截图工具)中复制图像,然后切换到 Readiris,按 Ctrl + V 粘贴。

Step 2: 设置识别参数(关键步骤)

在开始识别之前,请在右侧的“导出设置”窗格中进行配置,这直接影响最终效果。

  • A. 选择输出格式 在“导出为”下拉菜单中选择您需要的格式。

    • Microsoft Word (.docx): 保留原文档的段落、字体和布局,适合识别纯文本或图文混排的文档。
    • Microsoft Excel (.xlsx): 专门用于识别表格,软件会自动检测单元格、行和列,并填充数据。
    • PDF: 您可以创建一个“可搜索的图像 PDF”(在图像上叠加透明文本层)或一个“可编辑的 PDF”(真正的文本格式)。
    • HTML, 文本, 无格式文本: 其他格式选项。
  • B. 设置页面布局 告诉软件如何理解文档的结构。

    • 单栏: 适用于简单的信件、文章。
    • 多栏: 适用于报纸、杂志等有多个文本列的文档。
    • 表格: 当您选择输出为 Excel 时,此选项尤为重要,软件会全力识别表格结构。
    • 杂志/报纸: 混合了文本和图片的复杂布局。
  • C. 配置 OCR 语言 在“OCR 语言”中,勾选文档中使用的语言,可以多选,中文简体”+“英文”,确保语言选择正确,能显著提高识别准确率。

    readiris corporate教程-图3
    (图片来源网络,侵删)
  • D. 其他高级选项

    • 保留原始图片: 勾选此项后,导出的 Word 或 PDF 文档中会保留原始的扫描图片,识别的文本会作为“隐藏层”或浮动文本框出现,方便您对照修改。
    • OCR 模式: 通常使用默认的“标准”即可,对于质量很差的扫描件,可以尝试“模糊文档”或“手写”模式。

Step 3: 执行识别与导出

  1. 点击“OCR”按钮:完成所有设置后,点击功能区或快速访问工具栏中的 “OCR” 按钮(或按 F9)。
  2. 等待处理:软件会开始分析图像并进行识别,处理速度取决于文档页数和电脑性能。
  3. 预览与修正:识别完成后,软件会自动打开一个新窗口,左侧是识别结果(可编辑文本),右侧是原始图像。这是修正错误的最佳时机!
    • 修正错误:直接在左侧文本框中像在 Word 里一样修改错别字。
    • 重新识别:如果某个区域识别错误,可以在右侧图像中选中该区域,然后右键选择“重新识别”。
    • 忽略区域:如果图像中有不需要识别的 Logo、边框或噪点,可以用“忽略区域”工具(通常是红色蒙版)将其框选起来,软件会跳过这部分。
  4. 保存文件:确认无误后,点击“文件” -> “另存为”,或直接按 Ctrl + S,选择保存位置和文件名,即可导出为您设置好的格式。

第三部分:高级功能与技巧

批量处理

这是 Readiris Corporate 的王牌功能,可以极大地提高工作效率。

  1. 点击功能区中的 “批处理”
  2. 在弹出的窗口中,点击 “添加文件”“添加文件夹”,导入您需要批量处理的多个文档。
  3. 设置输出选项:和单个处理一样,在这里统一设置所有文档的输出格式、语言、布局等。
  4. 设置输出位置:选择一个文件夹来保存所有处理好的文件。
  5. 点击“开始”:软件会自动逐个处理所有文件,您只需等待即可。

PDF 的特殊处理

  • 将扫描的 PDF 转换为可搜索/可编辑的 PDF
    1. 导入一个纯图片的 PDF 文件。
    2. 在导出设置中,选择格式为 PDF
    3. 在“PDF 设置”下,选择 “可搜索的图像 PDF”“可编辑的 PDF”
    4. 执行 OCR,即可得到一个可以复制文本、使用 PDF 搜索功能的文件。
  • 合并多个文件:在批处理中,您可以将多个识别后的文档合并成一个大的 Word 或 PDF 文件。

创建可填写的 PDF 表单

  1. 导入一个包含表格的文档(如纸质申请表)。
  2. 在导出设置中,选择格式为 PDF
  3. 在“PDF 设置”下,选择 “PDF 表单”
  4. 执行 OCR,软件会尝试将表格中的空白区域识别为可填写的文本框。
  5. 在结果中,您可以直接点击这些文本框进行填写。

OCR 设置优化

如果识别准确率不理想,可以点击功能区 “工具” -> “OCR 设置”,进行更精细的调整:

  • 字符集: 确保包含您需要的所有字符(如中文、英文、数字、标点)。
  • 自动旋转: 自动纠正歪斜的页面。
  • 图像预处理: 如“去噪”、“去除边框”、“锐化”等,可以改善低质量扫描件的效果。

第四部分:常见问题与解决方法

问题 可能原因 解决方法
识别率低,错别字多 扫描质量差(模糊、有阴影)
OCR 语言选择错误
字体特殊或手写体
重新扫描,确保分辨率至少为 300 DPI。
检查并正确选择所有使用的语言。
对于特殊字体,尝试使用“字体训练”功能(高级功能)或手动修正。
表格识别错乱 页面布局未选择“表格”
表格线不清晰或有断点
分享:
扫描分享到社交APP
上一篇
下一篇