主屏幕高级功能通过OCR创建可搜索的OOXML文件

通过OCR创建可搜索的OOXML文件

发送OOXML (PPTX、DOCX或XLSX)文件时,使用OCR字符识别技术创建可搜索的OOXML文件。

若要启用OOXML文件的搜索,选择[PPTX]、[DOCX]或[XLSX]作为文件类型,并选择[字符识别]。然后,配置以下设置。

设置

说明

[开]/[关]

选择[开]启用OOXML文件的搜索。

[语言选择]

选择要进行OCR处理的语言。

选择原稿中使用的语言以正确识别文本数据。

[调整旋转]

将此选项设置为开启,根据OCR处理检测到的文本数据的方向自动执行每个页面的旋转调整。

禁用旋转调整时,如果指定的原稿方向与文字方向不匹配,本机将不会正确识别文本数据。

[输出方法]

当[DOCX]或[XLSX]被选择为文件类型时,该选项可用。

选择如何使用通过OCR处理所检测到的文字创建OOXML文件。

当[DOCX]被选择为文件类型时:

系统分析扫描原稿,并在原稿中创建包括插图的"图像数据"、OCR处理可检测到的"文本数据"、或者原稿中的文字被处理为图像的"文字图像数据"

  • [文字优先]:合并"文本数据""图像数据"创建可搜索的DOCX文件。该功能可显示无需任何调整即可通过OCR处理检测到的"文本数据";因此,根据OCR处理结果,视觉质量可能与扫描原稿有所不同。

  • [图像优先]:仅合并"图像数据""文字图像数据"创建DOCX文件。

  • [图像和文本]:合并"图像数据""文本数据""文字图像数据"创建可搜索的DOCX文件。"文本数据""文字图像数据"分开保存;因此,保持原稿的视觉质量的同时可以进行文字搜索。

当[XLSX]被选择为文件类型时:

系统创建原稿的"扫描图像"以及通过从扫描原稿进行OCR处理所检测到的"文本数据"

  • [图像和文本]:合并"扫描图像""文本数据"创建可搜索的XLSX文件。保持原稿视觉质量的同时可以执行文字搜索。

  • [仅文本]:仅使用"文本数据"创建可搜索的XLSX文件。该功能可显示无需任何调整即可通过OCR处理检测到的"文本数据";因此,根据OCR处理结果,视觉质量可能与扫描原稿有所不同。

  • 若要使用此功能,需要选购件。有关所需选购件的详细资料,请参见此处

  • 同时启用数字证书(数字标识)加密时[调整旋转]不可用。

  • 如果在[语言选择]中选择以下语言,本机可自动识别文字方向。
    [日语]、[简体中文]、[韩语]、[繁体中文]

  • 选择[语言选择]时,如果垂直方向和水平方向同时出现在原稿的同一页面上,那么文字将被识别为其中一种方向。
    [简体中文]、[韩语]、[繁体中文]