0%

Linux配置tesseract-orc 4.0

想在Parrot上配训练识别验证码,奈何一直无法利用Py生成text

Linux安装tesseract-ocr相关包

sudo apt install tesseract-ocr tesseract-ocr-all imagemagick libtesseract-dev -y

Pip安装相关包

pip install tesseract tesserocr Pillow

解决错误

就一个简单的Py输出tesserocr.image_to_text()直接崩溃

报RuntimeError: Failed to init API

我看了下路径,我路径下是有tessdata文件夹的

看了一坨文章,和github的issue,都没找到解决办法,因为按照他们那些破写法都是windows的。。。还有一个就是设置环境变量,export TESSDATA_PREFIX=”/usr/share/tesseract-ocr/4.00/“,也没成功

之后我打算不用Py,直接用tesseract

tesseract test_code.png output_code

程序提示找不到英文训练文件,而且提示我要设置环境变量,既然提示了,那我就添加环境变量

export TESSDATA_PREFIX="/usr/share/tesseract-ocr/4.00/"

还是提示环境变量问题,难道是我环境变量配置得不对,重新配置

export TESSDATA_PREFIX="/usr/share/tesseract-ocr/4.00/tessdata"

这次直接可以运行了,然后又测试了Py脚本,也可以正常运行了

github只是说把路径添加进去,而不是把tessdata也一并添加到路径里。。。

欢迎关注我的其它发布渠道