Tesseract引擎功能强大,概括地可以分为两部分:

  • 图片布局分析
  • 字符分割和识别

图片布局分析,是字符识别的准备工作。工作内容:通过一种混合的基于制表位检测的页面布局分析方法,将图像的表格、文本、图片等内容进行区分。

字符分割和识别是整个Tesseract的设计目标,工作内容最为复杂。首先是字符切割,Tesseract采用两步走战略:

参考:http://blog.csdn.net/guzhenping/article/details/51019010