/pages/ProductsPageNew.aspx

泰比 (ABBYY) Recognition Server

构造

泰比 (ABBYY) Recognition Server由几个部分组成,它可以在一个局域网上的相同或不同的计算机上安装。其主要成分是:
•服务器管理器 - 中央服务组件,它控制文件处理队列和站之间分配任务
•加工站 - 执行识别和文档转换服务
•扫描站 - 为客户批量扫描和图像处理前站
•索引站 - 客户站的文件索引和分类
•连接到谷歌Search Appliance的™(GSA) - 一个组件,它允许使用Google Search Appliance中提取文档图像内容的泰比 (ABBYY) Recognition Server

•连接到微软搜索系统(IFilter的) - 一个组件,它允许微软Office SharePoint Server和Windows搜索内容从文档图像提取使用泰比 (ABBYY) Recognition Server

•远程管理控制台 - 用于配置和监控识别服务器的客户端控制台

 

工作流程

泰比 (ABBYY) Recognition Server的文档转换过程可分为六个逻辑部分

1. 扫描/导入与分离文件

扫描站点

扫描站点提供批量扫描和图像预处理的功能:

  • 通过TWAIN, WIA和 ISIS扫描;
  • 快速图片预览
  • 图片预处理(旋转、去杂、去噪等)
  • 通过条码、空白页面和页面固定数字进行文档分割。

从网络/FTP输入
泰比 (ABBYY) Recognition Server可以自动从以下网络途径输入图片:

  • 网络文件夹
  • FTP 文件夹
  • Email文件夹

作为批次扫描的图片,泰比 (ABBYY) Recognition Server可以提供几种内置文档分割方式可选:空白页、条码或者页面上的粘贴以及打印条码。同事还支持脚本方式书写另外的客户规则。

2. 识别

OCR在处理站点自动进行处理。Server manager可以连接多台计算机作为处理站点,Server manager可以在几个站点之间平衡负载。浙江提供文档处理的速度。

Recognition Server中的OCR和条码识别技术提供了无语匹敌的精确性,支持多种类型文本,以及最流行的1D/2D条码。OCR支持198多种语言,包括拉丁文,西里尔文希腊其他脚本中文,日语,韩语,越南语,希伯来语意第绪语泰国。 欧洲的古体语言也支持。

为了保留文档版面,泰比 (ABBYY) Recognition Server使用Adaptive Document Recognition Technology  (ADRT)技术,它可以在保存成DOC和RTF时很好保留文档原始版面,包括页眉、页脚、表格内容等。

3. 质量控制

有时需要精确处理重要文档。同时,扫描质量并不完美,受困于分辨率低和多余杂点。这种情况下,就需要一种可靠的质量控制机制。

自动质量控制允许管理员设置识别精度的门限:质量很差的文档不会被处理,只是放在另外的单独文件夹内。

校验站点:是一个供客户提前判断识别结果的客户端。校验可以是所有页面校验,也可以是基于精度门限。校验站支持许可管理。

4. 设置文件类型和属性

泰比 (ABBYY) Recognition Server是一个强大的索引软件。文档分类和索引可以在一个界面化的索引站点处理。它允许操作员从预先设定列表选择文档类型和文档属性。如果如果属性是文档自己保存,就不需要将他们纳入。操作员可以轻易的勾画出页面上需要的字段,索引区域可以录入。

文档类型的探测、分类和索引可以通过Java或者VB自动实现。

5. 输出/公布

泰比 (ABBYY) Recognition Server将文件输出到一个预定义好的格式和位置,包括网络文件夹、email、SharePoint或者其他脚本输出格式。

程序支持灵活的命名和路由规则。例如,文档类型和属性可以作为文件名或者文件夹。

识别服务器可以将图片转换成不同可以搜索的文件格式:PDF、PDF/A, RTF, TXT, DOC(X), XLS(X), XML。

通过内置PDF创建功能,RS可以提供以下扩展:

  • 文档安全
  • MRC压缩技术,保留视觉效果的同事创建小尺寸文件。
  • 网页优化
  • PDF标签
  • 增加页眉、页脚和印章
  • 创建PDF和PDF/A兼容的文件。

管理

Recognition Server管理通过基于Microsoft管理控制台方便的界面。它允许系统管理员配置和监控其活动:设置加工参数,许可证管理,站,用户的权限,处理队列中,并查看日志。
与优先级管理和调度的功能,管理员可以控制在其中文件的处理顺序和有效在晚上时间或周末时间里使用的OCR调度站的硬件资源。

整合

泰比 (ABBYY) Recognition Server与其他应用集成提供了一个应用程序编程接口(API)。 API可以用来传递图像文件和工艺参数识别服务器,获取有关工作完成的通知,并获得转换后的文件。



???????? ?????????