在HP实验室开发的OCR引擎,在1985年和1995年,现在在谷歌。
精确的OCR引擎是1995年UNLV精确度测试中的前3引擎之一。 1995年至2006年间,它几乎没有做的工作,但自那时以来,它已改善了广泛的谷歌,可能是最准确的开源OCR引擎。
结合,与Leptonica图片处理库,它可以读取各种格式的神器出山:www.shenqi73.com图像转换成文本在超过40种语言。
命令行用法:ImageName的outputbase [-L语言]-PSM pagesegfmode] [CONFIGFILE ...]
此版本中的新功能:
·线程
安全!将所有重要的全局变量和静态变量适当的类成员。 TESSERACT现在是线程安全的(在多线程并行的多个实例可以使用。)与轻微的异常,一些控制参数仍然是全球和影响的所有主题
·新增立方,一个新的识别阿拉伯语。多维数据集也可以组合使用与正常TESSERACT其他语言与在(多)速度较低的成本,提高了精度。有没有培训模块的多维数据集
·OcrEngineMode在初始化取代AccuracyVSpeed控制立方体
·极大地提高了分割搜索结果的精度和速度方面的改进,特别是对中国
·新增PageIterator和ResultIterator简洁的方式来获得的全部结果的精确的,目前没有提供任何的的TessBaseAPI :: *方法。所有其他的方法,已被弃用,,如ETEXT_STRUCT特别是在未来将被删除
·ApplyBoxes完全重写,使traini ...