/pages/ProductsPageNew.aspx

泰比 (ABBYY) Recognition Server

构造

ABBYY Recognition Server按照工作流程处理每个图像文件。工作流程是由管理员预定义的处理参数。ABBYY Recognition Server可以同时处理参数不同的多个工作流程。每个工作流对应独特的输入源(文件夹,SharePoint库或邮箱)。所有在来源显示的图像均按照相应的工作流参数进行处理。

文件处理

ABBYY Recognition Server由几个部分组成,它可以在一个局域网上的相同或不同的计算机上安装。是:
•服务器管理器 - 中央服务组件,它控制文件处理队列和站之间分配任务
•处理站 - 执行识别和文档转换服务
•扫描站 - 为客户批量扫描和图像处理前站
•索引站 - 客户站的文件索引和分类
•管理控制台 - 用于配置和监控识别服务器的客户端控制台

 Recognition Server 其主要成分

工作流程

ABBYY Recognition Server的自动化文档处理包括六个阶段,这些阶段可以在单独的工作流程进行配置。每个工作流有其特定的设置和优先级,且彼此独立运行。

文件处理的六个阶段

文件处理的六个阶段

1.图像扫描/导入

图像可以由操作者在扫描站扫描后发送到Recognition Server或者通过Recognition Server从输入文件夹(网络文件夹,FTP文件夹,SharePoint库或邮箱)自动导入的。该应用程序根据优先级和可用计算资源自动处理在队列中的图像文件。

扫描站点

扫描站点提供批量扫描和图像预处理的功能:

  • 通过TWAIN, WIA和 ISIS扫描;
  • 快速图片预览
  • 图片预处理(旋转、去杂、去噪等)
  • 通过条码、空白页面和页面固定数字进行文档分割。

从网络/FTP输入
泰比 (ABBYY) Recognition Server可以自动从以下网络途径输入图片:

  • 网络文件夹
  • FTP 文件夹
  • Email文件夹

作为批次扫描的图片,泰比 (ABBYY) Recognition Server可以提供几种内置文档分割方式可选:空白页、条码或者页面上的粘贴以及打印条码。同事还支持脚本方式书写另外的客户规则。

2.识别

Recognition Server的OCR识别是在处理站自动运行的。如果同时安装多个处理站在系统中,这些文件将这些处理站之间均匀分布的以获得最大性能。安装多个处理站能够加快OCR识别速度。

Recognition Server中的OCR和条码识别技术提供了无语匹敌的精确性,支持多种类型文本,以及最流行的1D/2D条码。OCR支持198多种语言,包括拉丁文,西里尔文希腊其他脚本中文,日语,韩语,越南语,希伯来语意第绪语泰国。 欧洲的古体语言也支持。

为了保留文档版面,泰比 (ABBYY) Recognition Server使用Adaptive Document Recognition Technology  (ADRT)技术,它可以在保存成DOC和RTF时很好保留文档原始版面,包括页眉、页脚、表格内容等。

3.验证(可选)

在某些情况下,例如书籍数字化时,验证识别结果可能是必要的。验证站使操作者能够检查所有的文件或者只检查低于一定精确度的文件。

4.文件分离(可选)

执行批量扫描或导入的时候,将涉及到文件分离。文件可以用空白分隔页,条形码或每个文档页面固定数目分开的。分离也可以根据脚本规则进行。

5.分类和索引(可选)

泰比 (ABBYY) Recognition Server是一个强大的索引软件。文件索引可以通过脚本自动完成或者由操作员在索引站手工选择文件类型并指定文件属性。操作员也可以检验由脚本自动导出的数据。

文档类型的探测、分类和索引可以通过Java或者VB自动实现。

6.发布

文件处理的最后阶段,Recognition Server将文件输出到其最终储存处(网络文件夹,SharePoint®文件库或电子邮件)。此外,输出文件还可以应用于智能路由或发送至基于文档属性和特性的ECM系统。

识别服务器可以将图片转换成不同可以搜索的文件格式:PDF、PDF/A, RTF, TXT, DOC(X), XLS(X), XML。

通过内置PDF创建功能,RS可以提供以下扩展:

  • 文档安全
  • MRC压缩技术,保留视觉效果的同事创建小尺寸文件。
  • 网页优化
  • PDF标签
  • 增加页眉、页脚和印章
  • 创建PDF和PDF/A兼容的文件。

管理

Recognition Server管理通过基于Microsoft管理控制台方便的界面。它允许系统管理员配置和监控其活动:设置加工参数,许可证管理,站,用户的权限,处理队列中,并查看日志。
与优先级管理和调度的功能,管理员可以控制在其中文件的处理顺序和有效在晚上时间或周末时间里使用的OCR调度站的硬件资源。

整合

泰比 (ABBYY) Recognition Server与其他应用集成提供了一个应用程序编程接口(API)。 API可以用来传递图像文件和工艺参数识别服务器,获取有关工作完成的通知,并获得转换后的文件。



???????? ?????????