Copyright © 2020-2023 www.SOT9.com. All Rights Reserved .
合作联系: QQ: 3217490875
J4L OCR工具是一套功能强大的组件设计,包括OCR功能,在Java应用程序中。这意味着你可以接收传真或扫描文件,并从图像中提取业务信息。
的主要组成部分是:
·A Java包装器为的神器出山:www.shenqi73.comTESSERACT的OCR引擎。的的OCR引擎TESSERACT本身在Apache 2.0许可下交付和我们支持的版本仅适用于Windows编译的。
·文本文档解析器。
的图像识别处理,因此,可以分为2个步骤:
·组件将图像文件(TIF,PNG,JPG等),并返回它包含的文本。的Java包装程序将执行此操作使用TESSERACT的。另外,你可以使用任何其他的OCR引擎。
在第二个步骤,您的Java应用程序需要了解的OCR引擎返回的文本。这是通过文档解析器。该文件的解析器使用作为输入的文本字符串(数据)和一个XML文件,该文件描述的文件结构,将输出业务文档,无论是作为一个Java对象或一个XML文件