ABBYY FineReader Engine ABBYY FineReader Engine

面向软件开发人员的最全面的OCR SDK

将人工智能驱动的OCR功能集成到您的应用程序

请求试用联系我们

ABBYY FineReader Engine 12技术规格

ABBYY FineReader Engine 12有三个版本:

  • ABBYY FineReader Engine 12 for Windows
  • ABBYY FineReader Engine 12 for Linux
  • ABBYY FineReader Engine 12 for Mac

系统要求

硬件

配备x86兼容处理器的PC(1 GHz或更高)

操作系统

  • Windows Server 2016、Windows Server 2012、带有2014年4月更新汇总的Windows Server 2012 R2、Windows Server 2008 R2 SP1
  • Windows 10、带有2014年4月更新汇总的Windows 8.1、Windows 8、Windows 7 SP1

经过测试的云和虚拟环境

  • Azure Cloud Services
  • Azure Service Fabric
  • Azure Virtual Machines
  • Amazon EC2
  • Microsoft Hyper-V Server 2008
  • Microsoft Hyper-V Server 2008 R2 SP1
  • Microsoft Hyper-V Server 2012
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop for Mac 13.0.1
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0

ABBYY FineReader Engine也可以在支持的平台上的Docker容器中运行。

储存器

  • 用于处理单页文档 - 最小400 MB RAM,建议1 GB RAM
  • 用于处理多页文档 - 最小1 GB RAM,建议使用1.5 GB RAM
  • 用于并行处理 - 每个内核450 MB RAM + 350 MB RAM
  • 用于并行处理阿拉伯语、中文、日语或韩语的文档 - 每个核心750 MB RAM + 850 MB RAM

硬盘空间

库安装为1.400 MB,程序操作为100 MB。处理多页文档时,每页需要额外的15MB。

其他要求

  • TWAIN兼容的扫描仪、数码相机或传真调制解调器,用于扫描或图像导入
  • 用于模式训练、字典编辑,通过GUI扫描:视频卡和监视器(最小分辨率1024×768)
  • 应安装Microsoft®InternetExplorer 8.0或更高版本。要正确检查字体,应安装文档中包含的字体。

ABBYY SDK 12许可服务要求

硬件

具有x86兼容处理器(1 GHz或更高)的PC

操作系统

  • Windows Server 2016、Windows Server 2012 R2、Windows Server 2012、Windows Server 2008 R2
  • Windows 10、Windows 8.1、Windows 8、Windows 7 SP1

ABBYY SDK 12许可服务已在以下虚拟环境中进行了测试:

  • Microsoft Hyper-V Server 2008
  • Microsoft Hyper-V Server 2008 R2 SP1
  • Microsoft Hyper-V Server 2012
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop for Mac 13.0.1
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0

开发工具

ABBYY FineReader Engine for Windows应用程序编程接口(API)符合COM标准,可以轻松用于C / C ++、Visual Basic、.NET、Delphi、Java或任何支持COM组件的开发工具。Engine可以适用于VBS、JS、Perl等脚本语言

ABBYY FineReader Engine 12 for Linux专为glibc 2.11及更高版本而设计。如果您需要ABBYY FineReader Engine用于较旧的glibc版本,请联系ABBYY代表处. 对于FineReader Engine动态库,必须使用libstdc ++.so.6、libgcc_s.so.1和libgomp.so.1标准库。

硬件

支持SSE和SSE2指令集,具有x86兼容处理器(1 GHz或更高)的PC

操作系统

  • Fedora 27、26、25
  • Red Hat Enterprise Linux 7.4、6.9
  • Debian GNU/Linux 9.2、8.8
  • Ubuntu 17.10、16.04.1 LTS、14.04.5 LTS
  • CentOS 7.3、6.9
  • ALT Linux 8(不支持Wibu加密狗)

此外,ABBYY还提供专业服务,使软件适应其他平台。

经过测试的云和虚拟环境:

  • Microsoft Azure Virtual Machines
  • Amazon EC2
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0
  • Linux KVM

ABBYY FineReader Engine也可以在支持的平台上的Docker容器中运行。

储存器

  • 用于处理单页文档 - 最小400 MB RAM,建议1 GB RAM
  • 用于处理多页文档 - 最小1 GB RAM,建议使用1.5 GB RAM
  • 用于并行处理 - 每个内核450 MB RAM + 350 MB RAM
  • 用于并行处理阿拉伯语、中文、日语或韩语的文档 - 每个核心750 MB RAM + 850 MB RAM

硬盘空间

库安装为1.400 MB,程序操作为100 MB。处理多页文档时,每页需要额外的15MB。

其他要求

  • Tmpfs尺寸 — 4GB + 1GB*(核心数量)
  • Swap尺寸 — 4GB + 1GB*(核心数量)
  • ABBYY FineReader Engine支持systemd init系统
  • 要进行正确的字体检测,应安装文档中包含的字体

开发工具

ABBYY FineReader Engine for Linux提供C / C ++本机API和Java包装器,因此应用程序需要用C / C ++或Java编写。

硬件

具有x86兼容处理器的PC(1 GHz或更高)

操作系统

Mac OS X (10.12.x, 10.13.x).

储存器

  • 用于处理单页文档 - 最小400 MB RAM,建议1 GB RAM
  • 用于处理多页文档 - 最小1 GB RAM,建议使用1.5 GB RAM

硬盘空间

库安装为1.400 MB,程序操作为100 MB。处理多页文档时,每页需要额外的15MB。

要进行正确的字体检测,应安装文档中包含的字体

开发工具

OS X版本仅提供C / C ++本机API,因此应用程序需要使用C / C ++编写。

支持识别语言

ABBYY FineReader Engine 12支持市场上最多的识别语言。它提供拉丁语,西里尔语,希腊语或亚美尼亚语的语言识别,以及阿拉伯语、缅甸语(技术预览)、波斯语、希伯来语、中文、日语、韩语、俄语,泰语和其他语言。为了进一步提高识别准确性,为许多语言提供了集成的词典。为了增加对不寻常单词和非典型字体的识别,可以使用一个小的集成实用程序来实现自己的字典并创建自己的字符模式。

此外,SDK还提供对17至19世纪印刷的英文、法文、德文、意大利文和西班牙文的历史文件的识别,人工语言的识别(世界语、国际语、伊多语和西方语、识别编程语言(Basic、C / C ++)、COBOL、Fortran、JAVA和Pascal),简单的化学式和标准数字。总之,ABBYY FineReader Engine支持208种OCR和126种ICR语言。

 有词典支持

阿布哈兹语
阿迪格語
南非荷兰语
阿古尔语
阿尔巴尼亚语
阿尔泰语
阿拉伯语(沙特阿拉伯) 
亚美尼亚语 (东部) 
亚美尼亚语(格拉巴) 
亚美尼亚语(西部) 
阿瓦尔语
艾马拉语
阿塞拜疆语(西里尔)
阿塞拜疆语(拉丁) 
巴什基尔语 
Basic编程语言
巴斯克语
白俄罗斯语
本巴语
布莱克福特语
布列塔尼语
布哥图语
保加利亚语 
缅甸语(技术预览)
布里亚特语
C/C++编程语言
加泰隆语 
查莫罗语
车臣语
简单化学分子式
简体中文
繁体中文
楚克其语
楚瓦什语
为MICR(CMC-7)文本类型
Cobol编程语言
科西嘉语
克里米亚鞑靼语
克罗地亚语 
克罗语
捷克语 
丹麦语 
达尔格瓦语
数字
东干语
丹麦语(荷兰) 
丹麦语(比利时) 
为MICR(E-13B)文本类型
英语 
爱斯基摩语(西里尔)
爱斯基摩语(拉丁)
世界语
爱沙尼亚语 
鄂温语
鄂温克语
法罗语
波斯语 
斐济语
芬兰语 
Fortran编程语言
法语 
弗里西亚语
弗留利语
苏格兰盖尔语
加告兹语
加利西亚语
干达语
德语 
德语(卢森堡)
德语(新的拼写规则) 
希腊语 
瓜拉尼语
哈尼语
豪萨语
夏威夷语
希伯来语 
匈牙利语 
冰岛语
伊多语
印度尼西亚语 
印古什语
国际语
爱尔兰语
意大利语 
日语 
日本(现代) 
Java编程语言
卡巴尔达语
卡尔梅克语
恰伊-巴尔卡尔语
卡拉卡尔帕克语
卡舒比语
卡瓦语
哈萨克语
哈卡斯语
汉特语
吉库犹语
吉尔吉斯语
刚果语
朝鲜语 
韩国语(韩文字母) 
科尔雅克语
克佩勒语
库梅克语
库尔德语
拉克语
萨米语(拉皮什)
拉丁语 
拉脱维亚语 
用粗体字写的拉脱维亚语
列兹金语
立陶宛语 
卢巴语
马其顿语
马拉加斯语
马来语
马林凯语
马耳他语
曼西语
毛利语
马里语
玛雅语
苗语
米南卡堡语
莫霍克语
蒙古语
莫尔多瓦语
那瓦特语
涅涅茨语
尼夫赫语
诺盖语
挪威语 
挪威语(博克马尔) 
挪威语(尼诺斯克) 
尼昂加语
西方语
为OCR-A文本类型
为OCR-B文本类型
奥杰布瓦语
旧式拼写英语 
旧式拼写法语 
旧式拼写德语 
旧式拼写意大利语 
旧式拼写古斯拉夫语
旧式拼写西班牙语 
奥塞梯语
帕皮阿门托语
Pascal编程语言
普什图语
托克皮辛语
波兰语 
葡萄牙语(巴西) 
葡萄牙语(葡萄牙) 
奥克语
凯楚阿语
利托-罗曼诸语
罗马尼亚 
罗马尼亚(摩尔瓦多)
罗马尼亚语
卢旺达语
隆迪语
俄语(旧式拼写) 
俄语 
俄语(带重音) 
萨摩亚语
塞尔库普语
塞尔维亚语(西里尔)
塞尔维亚语(拉丁)
修纳语
苏族语(达科塔)
斯洛伐克语 
斯洛文尼亚语 
索马里语
索布语
索托语
西班牙语 
巽他語
斯瓦希利语
史瓦济语
瑞典语 
塔巴萨兰语
塔加洛语
塔希提语
塔吉克语
鞑靼语 
泰国语 
景颇语
汤加语
茨瓦纳语
侗族语
土耳其语 
土库曼语(西里尔)
土库曼语(拉丁)
图瓦语
乌德穆尔特语
维吾尔语(西里尔)
维吾尔语(拉丁)
乌克兰语 
乌拉都语
爱斯基摩语(西里尔)
爱斯基摩语(拉丁)
越南语 
宿务语
威尔士语
沃洛夫语
科萨语
雅库特语
依地语
萨巴特克语
祖鲁语
南非荷兰语
阿尔巴尼亚语
阿拉伯语(沙特阿拉伯)*
艾马拉语
阿塞拜疆语(拉丁)
巴斯克语
本巴语
布莱克福特语
布列塔尼语
布哥图语
保加利亚语
布里亚特语
查莫罗语
科西嘉语
克里米亚鞑靼语
克罗地亚语
克罗语
捷克语
丹麦语
数字
丹麦语(荷兰)
丹麦语(比利时)
英语
爱沙尼亚语
鄂温语
鄂温克语
斐济语
芬兰语
法语
弗里西亚语
弗留利语
苏格兰盖尔语
加利西亚语
干达语
德语
德语(卢森堡)
德语(新的拼写规则)
希腊语
瓜拉尼语
哈尼语
夏威夷语
匈牙利语
伊多语
印度尼西亚语
国际语
爱尔兰语
意大利语
恰伊-巴尔卡尔语
卡舒比语
卡瓦语
哈萨克语
吉尔吉斯语
刚果语
克佩勒语
库梅克语
库尔德语
萨米语(拉皮什)
拉丁语
拉脱维亚语
立陶宛语
卢巴语
马拉加斯语
马林凯语
马里语
玛雅语
苗语
米南卡堡语
莫霍克语
蒙古语
莫尔多瓦语
那瓦特语
涅涅茨语
尼夫赫语
诺盖语
挪威语
挪威语(博克马尔)
挪威语(尼诺斯克)
尼昂加语
奥杰布瓦语
旧式拼写英语
旧式拼写法语
旧式拼写德语
旧式拼写意大利语
旧式拼写西班牙语
帕皮阿门托语
托克皮辛语
波兰语
葡萄牙语(巴西)
葡萄牙语(葡萄牙)
凯楚阿语
利托-罗曼诸语
罗马尼亚
罗马尼亚(摩尔瓦多)
罗马尼亚语
卢旺达语
隆迪语
俄语
萨摩亚语
塞尔库普语
塞尔维亚语(西里尔)
塞尔维亚语(拉丁)
苏族语(达科塔)
斯洛伐克语
斯洛文尼亚语
索马里语
索托语
西班牙语
斯瓦希利语
史瓦济语
瑞典语
塔加洛语
塔希提语
塔吉克语
景颇语
汤加语
茨瓦纳语
侗族语
土耳其语
土库曼语(拉丁)
图瓦语
维吾尔语(拉丁)
乌克兰语
乌茲别克语(拉丁)
宿务语
沃洛夫语
科萨语
萨波特克语

* 不支持阿拉伯语ICR。 但是,可以识别手写的阿拉伯数字。

简体中文
繁体中文
捷克语
丹麦语
荷兰语(荷兰)
英语
爱沙尼亚语
芬兰语
法语
德语
希腊语
匈牙利语
印度尼西亚语
意大利语
日语
朝鲜语
挪威语
挪威语(博克马尔)
挪威语(尼诺斯克)
波兰语
葡萄牙语(巴西)
葡萄牙语(标准)
俄语
西班牙语
瑞典语
土耳其语
乌克兰语

与用户交互的语言

消息框,如错误消息、提示和警告,提供英语、保加利亚语、捷克语、中文(PRC和台湾)、丹麦语、荷兰语、爱沙尼亚语、法语、德语、希腊语、匈牙利语、意大利语、日语、韩语、波兰语、葡萄牙语( 巴西)、俄罗斯、斯洛伐克、西班牙、瑞典、土耳其和乌克兰。

支持图像格式(打开、保存)

ABBYY FineReader Engine可以打开多种格式的图像文件。 此外,OCR SDK能够以多种图像格式保存结果。

支持的图像格式列表:

格式 扩展名 打开 保存
BMP
未压缩的黑色和白色
4位色和及8位色— 未压缩的Palette
16位色 — 未压缩、未压缩的Mask
24位色 — 未压缩的
32位色 — 未压缩的、未压缩的Mask
bmp    
BMP
4位色和8位色 — RLE未压缩的Palette
bmp    
DCX
黑色和白色
2位色、4位色和8位色调色盘
24位色
dcx    
DjVu(仅Windows版本)
黑色和白色、灰色、颜色
djvu、djv    
GIF
黑色和白色 — LZW压缩的
2位、3位、4位、 5位、6位、 7位、8位调色盘 — LZW压缩的
gif    
JBIG2
黑色和白色
jb2    
JPEG
灰色、颜色
jpg、jpeg、jfif    
JPEG 2000
灰色 — 第1部分
颜色 — 第1部分
jp2、jpc、j2k    
PCX
黑色和白色
2位色、4位色和8位色
24位颜色
pcx    
图像PDF(扫描的PDF) pdf    
数字创造的PDF(1.7或更早版本) pdf    
PNG
黑色和白色、灰色、颜色
png    
TIFF
黑色和白色 — 未压缩、CCITT3、CCITT4、Packbits、ZIP、LZW
灰色 — 未压缩、Packbits、JPEG、 ZIP、LZW
24-bit颜色 — 未压缩、 JPEG、ZIP、LZW
1位色、4位色和8位色palette — 未压缩、Packbits、ZIP、LZW
(包括多页TIFF)
tif、tiff    
TIFF
黑色和白色 — CCITT3FAX
tif、tiff    
WDP(仅Windows版本)
黑色和白色、灰色、颜色
(需要WIC或Microsoft .NET Framework 3.0)
Wdp    
WIC-compatible(仅Windows版本)
(需要WIC或Microsoft .NET Framework 3.0)
     

注意:ABBYY FineReader Engine不会打开大于32512 * 32512像素的图像。

支持的文档保存格式

ABBYY FineReader Engine可以使用以下格式保存已识别的文本:

  • RTF
  • DOCX
  • XLSX and XLS(仅Windows版本)

    保存为XLS格式时,FineReader Engine支持MS Excel 5和8格式。

  • PPTX
  • PDF、PDF 2.0、PDF/UA
  • PDF/A-1 (a、b)、PDF/A-2 (a、b、u)、PDF/A-3 (a、b、u)

    FineReader Engine支持所有PDF格式的MRC压缩。

  • HTML、 HTML 5

    FineReader Engine支持各种代码页(Windows、DOS、Mac、ISO)和Unicode(UTF-16、UTF-8)编码。

  • TXT

    FineReader Engine支持各种代码页(Windows、DOS、Mac、ISO)和Unicode(UTF-16、UTF-8)编码。

  • CSV
  • XML — 文件格式包含已识别的文本,该结构在XML标记的帮助下进行描述。
  • ALTO 3.1
  • XPS(仅Windows版本)
  • FB2
  • EPUB
  • ODT
  • vCard — 仅用于导出名片

支持的条形码类型

ABBYY FineReader Engine识别以下的条形码类型:

  • 1D:Codabar、Code 128、Code 39、Code 93、Code 32、EAN 8 and 13、Full ASCII Code 39、GS1-128、IATA 2 of 5、Industrial 2 of 5、Interleaved 2 of 5、Intelligent Mail (a.k.a USPS 4-CB)、Matrix 2 of 5、Patch、PostNet、UPC-A、UPC-E.
  • 2D:Aztec、Data Matrix、MaxiCode、PDF 417、QR Code.

光学标记识别

ABBYY FineReader Engine识别简单复选标记、分组复选标记、模型复选标记和手动更正的复选标记:

  • 方框中的复选标记
  • 在白色背景上的复选标记
  • 非标准复选标记(此类复选标记需要事先培训)

注意:此功能仅适用于ABBYY FineReader Engine for Windows。 Linux和Mac版本不支持。

有关其他技术信息,请参阅ABBYY.technology或查阅ABBYY FineReader Engine帮助文件。

要求试用版

准备试用?或是想了解更多信息?只需填写下面的表格,我们将会及时与您取得联系。

请注意,我们比较喜欢通信跟使用企业电子邮件地址的各户。
请别用公共电子邮件网站yahoo.com,hotmail.com,gmail.com,163.com,qq.com等。

我知道我可以在任何时候完全或部分撤销我的同意,以便将来生效。

如需撤销您的同意,请访问取消订阅网页或发送电子邮件至dataprotection@abbyy.com
您也可以发送撤销同意的书面声明至邮政信箱: PO BOX 16257, CY-2087, Nicosia, Cyprus。

*指定您的电子邮件地址的时候您自动同意订阅ABBYY通讯与收到新闻,特别优惠和节日礼物!

非常感谢您关注泰比(ABBYY)产品!

您的请求会被转发到您所在地区的相应的销售代表,我们会尽快给您答复。

如果您有兴趣寻找出更多的有关区域的泰比(ABBYY)办事处的,您可以访问我们的联系页面。

此致,
泰比(ABBYY)团队