案例研究

ABBYY®FineReader® Engine助力中国检察官进行法律决策

查看或下载此文章的可打印版本 (PDF 949 kb)

四川雅达尔科技有限公司成立于2013年。自成立以来,企业专为政法行业提供完整的数字化解决方案。公司的主要产品之一是“电子法庭案件管理系统”。通过识别、访问和链接到相关的案件数据,此应用程序有助于区域检察官和警察局处理和存储法律文件。已有500多个中国检察院成功应用了雅达尔解决方案。

挑战

为了确保有效、正确地使用信息,促进诉讼过程中的决策,必须使电子卷宗取代传统的纸质卷宗。因此,诉讼人在处理法院案件的过程中(从找到先例案件到存档最终文件),能够及时获取和准备所需的资料。

雅达尔解决方案的特色之一就是建立包含先前所有卷宗的电子目录。法官在处理证据并做出判决时,会将其作为判决先例。但是,创建电子目录是一项具有挑战性的任务,因为它需要对大量低质量的纸质卷宗进行数字化处理。因此,开发此目录需要使用提供出色OCR质量的解决方案。

当前的四川雅达尔解决方案旨在每天处理2000至5000页的文档量。这些文件使用简体中文字、拉丁字母和数字。创建电子文档目录并对大量文件进行分类是一项枯燥乏味的工作,因为该过程中的所有步骤都必须手动执行。例如,在对文件进行分类后,必须手动填写目录中的所有信息以及分类信息。

由于数据量巨大,因此工作人员经常会出现拼写错误或选错目录的情况,导致目录信息不完整,需要修改才能满足文件创建的需求。文档类型的多样化使得数据输入的速度特别低。另外,鉴于确保输入的数据与相应纸质文件信息100%一致性至关重要的,避免错误是另一项急待解决的主要任务。要更好地解决这一重大挑战,需要引入一个具备智能 OCR能力的解决方案。

解决方案

将屡次获奖的ABBYY内容智能解决方案集成到现有的方案中,可以扩展系统的功能,并将无法访问的信息转换为诉讼所需的可用数据。例如,系统可以将证人的证词、文件、参考资料等新案件所需要的所有信息进行比对,提取相互矛盾的信息内容。法官在做出判决时,可以展示被告的年龄、既往的定罪信息、所造成的损失数额等重要事实信息,以及其他重要的细节内容。

使用由 ABBYY Content IQ工具授权的雅达尔方案的算法,可扫描数百万份法庭记录并查找类似案例。同样,解决方案也可就重点关注的涉及罚款、监禁或其他判决等关键方面提供建议。这样审查过程确保了司法系统工作的一致性和完整性。从信息分析过程中得出的建议有助于避免即使有经验的法官有时也会带有的偏见。

为了解决数据输入慢和不准确的问题,雅达尔公司选择将ABBYY FineReader Engine集成到他们完整的解决方案中。在卓越的OCR技术的协助下,在选择图像、扫描图像和识别图像后,目录页内容立即转换为可读的XML格式的文件。建立提取结构化数据的条件规则,依照此规则提取数据,指定栏位的内容会立即显示在应用程序的显示窗口中。随后,再次校验这些文件,并提供给工作人员使用。

输入数据所花费的时间大幅减少了。以前处理所有文件所需的时间占整个工作时间的50%。总的来说,工作效率的提高源于两个主要因素:输入数据的准确性得到提高,以及文档处理速度加快。

结果

使用ABBYY FineReader Engine后,文本识别过程已完全实现自动化。在不到一年的时间内,雅达尔电子法庭案件管理系统完成了开发、测试并投入使用。

使用该软件实现了两个主要目标。第一,减少了人工的工作量,省去了文件分类的繁琐过程。第二,实现了信息的高精准度。雅达尔已注意到所研发的解决方案的卓越品质,尤其在高识别率方面。

“大量劳动力成本和对数据准确性的持续需求促使我们采用新技术。我们之前也尝试过其他的OCR技术,但是后来发现它们都不能满足我们的识别要求。所以我们选择了国际知名的ABBYY公司和他们的OCR技术。现在我们可以说,在使用ABBYY技术后,经过一段时间的优化和运行之后,识别率达到95%。这样的结果远远超出了我们的预期。现在,我们对整个软件的稳定运行和高效率非常满意。”

唐虎,Yadaer项目经理