1.安装依赖:
1 | sudo yum -y groupinstall "Development Tools" |
2.下载leptonica和tesseract:
https://code.google.com/p/leptonica/downloads/list
https://code.google.com/p/tesseract-ocr/downloads/list
http://www.leptonica.org/download.html
https://code.google.com/p/tesseract-ocr/
3.解压下载好的压缩包:tesseract-ocr-3.02.02.tar.gz
leptonica-1.72.tar.gz
tesseract-ocr-3.02.eng.tar.gz
4.进入leptonica
目录编译安装:
1 | ./configure |
5.进入tesseract-ocr
目录编译安装:
1 | ./autogen.sh |
6.解压语言包tesseract-ocr-3.02.eng.tar.gz
,
解压后将tesseract-ocr/tessdata
下的所有文件全部拷贝到 /usr/local/share/tessdata
下。
7.测试安装成功:
进入tesseract-ocr
目录:
1 | tesseract phototest.tif phototest -l eng |
若生成phototest.txt,且其中内容与phototest.tif相同则成功。