Tesseractとは?
Tesseractは、Googleがオープンソースで開発しているOCRエンジンです。
OCRは、Optical Character Recognitionの略で、画像の文字を認識して、テキストデータに変換する技術です。
Tesseractとライブラリをインストールする
!apt install tesseract-ocr libtesseract-dev tesseract-ocr-jpn tesseract-ocr #Tesseract
!pip install pyocr #Tesseractのラッパーライブラリ
ライブラリを読み込む
import pyocr #pyocrライブラリ
import cv2 #OpenCVライブラリ
from PIL import Image #画像処理ライブラリ>Imageモジュール
画像の文字を認識してテキストを取得する
tools=pyocr.get_available_tools() #利用可能なOCRエンジンを取得
tool=tools[0] #インストールしたTesseractを利用
im=cv2.imread("test.png")
im_gray=cv2.cvtColor(im, cv2.COLOR_BGR2GRAY) #グレースケール化
#OCR
txt=tool.image_to_string(
Image.fromarray(im_gray), #cv2型画像をPIL型に変換
lang="jpn" #日本語設定
)
print(txt)
コメント