Cnki - ABBYY

文档人工智能

智能文档处理

Vantage

面向数字劳动力的智能文档处理平台

FlexiCapture

撷取任何文档中的数据，包括但不限于结构化表格、调查、非结构化文本密集型论文

市场

预训练人工智能提取模型、连接器等

光学字符识别

FineReader AI

将人工智能驱动的光学字符识别功能集成到您的应用程序中。

所有产品

流程人工智能

流程理解

时间表流程探索

根据实际业务数据了解流程的实际工作方式。

时间表流程分析

预先构建分析工具，以实现对流程的详细理解。

流程优化

时间表流程监控

监控每个流程，以发现问题并采取行动。

时间表流程预测

高级人工智能可预测潜在的不良后果。

时间表流程模拟

使用流程历史来构建数字孪生

库

探索

资源中心

白皮书、分析师报告、信息图表等。

客户故事

了解我们的客户如何使用ABBYY来改进业务，实现业务的现代化。

见解

智能企业

商业和技术领导者的见解与观点。

ABBYY博客

关于智能自动化、数字化转型和未来工作的最新故事。

视频教程

加入我们，了解更多关于ABBYY智能自动化解决方案的信息。

对于开发人员

社群

向专家了解智能自动化的最新趋势。

文档

成功部署并使用ABBYY产品所需的一切事物。

最有价值专业人士（MVP）

这是一个授予在ABBYY人工智能领域展现出卓越专长的开发人员的杰出称号。

实施

专业服务

为您的智能自动化之旅提供专家支持。

培训和认证

投资ABBYY智能自动化解决方案，获取丰厚回报。

返回案例研究

ABBYY FineReader Engine (SDK) 将科研论文转换为数字知识

教育 | 文档存档

中国国家知识基础设施工程 ( CNKI ) 是一项得到中国教育部、科技部、中宣部、新闻出版广电总局大力支持的电子出版工程。该工程提供了中国超过 90% 的知识资源，其涵盖的文献主题、文献种类、地理范围和年份范围均为全国之最。数据库收录了众多科研领域的学报、学位论文、报纸、会议记录、年鉴、参考文献、百科全书、专利、标准、科技成果和法律法规。

中国九十年代末的大规模知识资源数字化工程开创了中国最为兼容并包的学术知识平台。1999年，清华大学与清华同方共同开发了中国知识资源整合数据库，并提出了中国学术期刊的标准体系。如今中国的每一位科研工作者都在使用这一平台，所有的学位论文与科研成果也都会援引该平台的知识资源。

“ABBYY 是国际知名的 OCR 技术提供商，其 OCR 识别精度、甚至中文的识别精度都远远超乎我的期望。ABBYY 的技术使我们节约了大量时间，提高了工作效率。我们希望双方能够进一步合作，优化我们新的工作流程。”

CNKI 技术总监吴先生

挑战

CNKI 专注于教育领域，收录了大量的图书、文档、期刊、博士论文、报纸等中外文纸质资料，而这些资料都需要经过数字化处理后，整理编入易于检索的知识数据库。数据库每天都会收录数以百计的新档案，每个新档案中还有数以千计的新条目。

除了卷帙浩繁的收录资料，繁杂的资料语言也是亟待解决的问题。资料涉及的语言有中文、越南语、泰语及绝大多数的欧洲语言等。此外，科研著作与学位论文特有的大量插图、表格、方程、制图、图表等也至关重要，需要尽数保留。所有资料还需编入索引，保存为特殊的 CAJ ( 中国学术期刊 ) 格式。鉴于上述难点，采用人工数字化资料费时费力，将给 CNKI 带来巨大的负担。所以 CNKI 采用了一家中国本地厂商的 OCR 解决方案，利用自动化光符阅读提高录入效率。与人工复录相比，OCR 方案效率较高、改善显著，但仍未达到预期效果。

首先，由于该系统仅支持中文，所以有相当数量的资料无法识别。其次，识别质量欠佳，校验结果花费了大量时间与人力。最后，该系统仅能捕获文本，无法保存文档布局和其他元素。

解决方案

为了寻找替换的 OCR 核心解决方案，CNKI 致函上海泰彼信息技术有限公司，全球领先的 OCR 与数据采集技术提供商 ABBYY在中国的代表处。

为了在最短时间内完成积压资料的数字化，泰彼公司建议采用 ABBYY FineReader Engine — OCR 软件开发工具包方案，以实现与 CNKI 现有环境进行深度无缝整合。

在数字化第一阶段，ABBYY FineReader Engine识别出文档中的所有文本。在第二阶段，该引擎从文档内容中抓取检索值 ( 元数据 )。利用元数据，可以实现知识数据库中数字化资料的快速高效检索。

与以往的 OCR 方案相比，ABBYY FineReader Engine能够保存文档的原始布局，并将经过处理的文档导出为 Microsoft® Word 文档、Excel® 文档、可检索的 PDF/A 文件，以及符合中国国家标准的 CAJ 本土格式文件。

只需一名操作员，即可快速轻松地校验 ABBYY OCR 识别结果，并确保检索结果 100% 精确。

最终成果

采用 ABBYY OCR 技术后，CNKI 显著提高了资料处理速度与精度，减少了人工干预。ABBYY FineReader Engine的智能文档分析功能保存了导出文档的结构与布局，确保文档将来在 CNKI 数据库中的有效使用和存储。

通过使用多核处理，资料识别速度得到了显著提升。在过去，同样的任务需要耗费数周时间，而现在仅仅需要几天。得益于自动化资料处理，CNKI 能够将原本从事人工录入和校验资料工作的数十名员工解放出来，投入其他项目的工作，大幅提高了生产力。

最重要的是，这类大规模数字化工程的最深远影响在于提升了使用者舒适度。现在这一全球平台的用户都可以更快的速度、更高的准确度搜索到所需信息。 ABBYY 的数字化解决方案令中国国家范围的知识更易于检索、便于使用，完美践行了 ABBYY 的企业使命 — 知行合一。

ABBYY FineReader Engine

智能教育解决方案

PDF 文件

ABBYY FineReader Engine (SDK) 将科研论文转换为数字知识

挑战

解决方案

最终成果

学习有关该提供商的更多信息

学习有关该提供商的更多信息

了解有关该提供商的更多信息

了解有关该提供商的更多信息

了解有关该提供商的更多信息

了解有关该提供商的更多信息

学习有关该提供商的更多信息

学习有关该提供商的更多信息

学习有关该提供商的更多信息

有关该提供商的更多信息

学习有关该提供商的更多信息

学习有关该提供商的更多信息

学习有关该提供商的更多信息

学习有关该提供商的更多信息

ABBYY FineReader Engine (SDK) 将科研论文转换为数字知识

挑战

解决方案

最终成果

Youku.com 1 学习 有关该提供商的更多信息

abbyy.cn 3

hsforms.com app-sj20.marketo.com 3

www.recaptcha.net 5

Youku.com 3 学习 有关该提供商的更多信息

Alibaba.com 2 了解有关该提供商的更多信息

Google 4 了解有关该提供商的更多信息

Youku.com 3 了解有关该提供商的更多信息

mmstat.com youku.com2

www.abbyy.cn 1

Alibaba.com 3 了解有关该提供商的更多信息

Baidu 9 学习 有关该提供商的更多信息

Google 4 学习 有关该提供商的更多信息

Taobao.com 1 学习 有关该提供商的更多信息

Youtube 2 有关该提供商的更多信息

Youku.com 21 学习 有关该提供商的更多信息

www.recaptcha.net 1

AABBYY 1 学习 有关该提供商的更多信息

Baidu 1 学习 有关该提供商的更多信息

Youku.com 7 学习 有关该提供商的更多信息

www.abbyy.cn 10

学习有关该提供商的更多信息

学习有关该提供商的更多信息

了解有关该提供商的更多信息

了解有关该提供商的更多信息

了解有关该提供商的更多信息

了解有关该提供商的更多信息

学习有关该提供商的更多信息

学习有关该提供商的更多信息

学习有关该提供商的更多信息

有关该提供商的更多信息

学习有关该提供商的更多信息

学习有关该提供商的更多信息

学习有关该提供商的更多信息

学习有关该提供商的更多信息