免费截图识别
所有刊物

选择PDF工具——第4部分:如何使PDF变为可搜索

纸张必须手动搜索,但数字文档可以立即搜索,对吗?不幸的是,情况并非总是如此。大约25%至33%的PDF文档根本不包含可搜索的信息。例如,当一份扫描件被包装成PDF文档后,您得到了一张文本工具无法访问的图像。

但是,可识别的文本信息的可用性不仅对于搜索或复制文本至关重要。它也是辅助技术如盲人屏幕阅读器的无障碍文件的关键,这已成为政府、公共服务、教育等领域的一项要求。

这些问题的解决方案是光学字符识别。OCR将可见图像转换为编码为文本的信息(有关OCR的详细信息)。ABBYY FineReader PDF 中这项技术的优点是它在后台运行,因此在需要时始终可用。因此,如果您打开的文档包含尚不可读信息,FineReader PDF 会在后台执行OCR。

在后台执行的OCR转换是FineReader PDF 的一项独特功能,这使您无需更改文档本身就可以立即访问各种PDF文档。如果文档仅包含扫描件,且该扫描件的一部分是图像,FineReader PDF 使用OCR来查找所有可识别的文本。

此功能最大的好处在于,在搜索文档并找到搜索词所有的匹配项之前,您甚至根本不会注意到FineReader PDF 在工作,这是其他PDF工具无法做到的。PDF只是按照您期望的那样工作,并向您展示其工作内容。只有当您使用另一个PDF工具并尝试相同的操作时,才能看到两者的差异。

眼见为实–欢迎观看我们的视频:

 

产品技巧
电子邮件订阅

您的订阅成功!

关注我们
ABBYY免费在线识别服务

试试OCR工具