主屏幕高级功能通过OCR创建可搜索的PDF文件

通过OCR创建可搜索的PDF文件

可搜索的PDF功能

将扫描的原稿数据转化为PDF格式时,将透明的文本数据粘贴到PDF文件,然后创建可搜索的PDF文件。此功能使用OCR字符识别技术从扫描的图像自动创建文本信息。

以下显示本机可以识别的原稿文字大小。

分辨率为200 dpi时

  • 日文:12 pt至142 pt

  • 欧洲和美洲语言:9 pt至142 pt

  • 亚洲语言:20 pt至142 pt

分辨率为300 dpi时

  • 日文:8 pt至96 pt

  • 欧洲和美洲语言:6 pt至96 pt

  • 亚洲语言:12 pt至96 pt

  • 若要使用此功能,需要选购件。有关所需选购件的详细资料,请参见此处

  • 在以下情况下,文本数据可能无法正常识别:
    原稿中使用了MFP中不支持的文本。
    所选语言不同于原稿语言。
    未自动调整页面方向时,原稿方向与文字方向不匹配。

创建可搜索的PDF文件

发送PDF文件时,使用OCR字符识别技术创建可搜索的PDF文件。

若要创建可搜索的PDF,将[PDF]或[紧凑型PDF]选择为文件类型,然后选择[PDF详细设置]-[可查找的PDF]。然后,配置以下设置。

设置

说明

[开]/[关]

选择[开]创建可搜索的PDF文件。

[语言选择]

选择要进行OCR处理的语言。

选择原稿中使用的语言以正确识别文本数据。

[调整旋转]

将此选项设置为开启,根据OCR处理检测到的文本数据的方向自动执行每个页面的旋转调整。

禁用旋转调整时,如果指定的原稿方向与文字方向不匹配,本机将不会正确识别文本数据。

[自动文件名称分配]

将此选项设置为开启,自动从OCR字符识别结果中导出适合用作文档名的字符串,并将其指定为文档名。

文档名根据首页、日期、时间和序列号的文字识别结果自动指定。

  • [文件类型]选择[紧凑型PDF]时,OCR处理速度可能比选择[PDF]时更快。

  • 同时启用数字证书(数字标识)加密时[调整旋转]不可用。

  • 将[PDF/A]设置为[PDF/A-1a]时,可搜索PDF设置不可用。

  • 如果在[语言选择]中选择以下语言,本机可自动识别文字方向。
    [日语]、[简体中文]、[韩语]、[繁体中文]

  • 选择[语言选择]时,如果垂直方向和水平方向同时出现在原稿的同一页面上,那么文字将被识别为其中一种方向。
    [简体中文]、[韩语]、[繁体中文]