OpenCVで画像を最適化してTesseractでOCRする

スポンサーリンク

Tesseractとは?

Tesseractは、Googleがオープンソースで開発しているOCRエンジンです。

OCRは、Optical Character Recognitionの略で、画像の文字を認識して、テキストデータに変換する技術です。

Tesseractとライブラリをインストールする

!apt install tesseract-ocr libtesseract-dev tesseract-ocr-jpn tesseract-ocr #Tesseract
!pip install pyocr #Tesseractのラッパーライブラリ

ライブラリを読み込む

import pyocr #pyocrライブラリ
import cv2 #OpenCVライブラリ
from PIL import Image #画像処理ライブラリ>Imageモジュール

画像の文字を認識してテキストを取得する

tools=pyocr.get_available_tools() #利用可能なOCRエンジンを取得
tool=tools[0] #インストールしたTesseractを利用

im=cv2.imread("test.png")
im_gray=cv2.cvtColor(im, cv2.COLOR_BGR2GRAY) #グレースケール化

#OCR
txt=tool.image_to_string(
  Image.fromarray(im_gray), #cv2型画像をPIL型に変換
  lang="jpn" #日本語設定
)

print(txt)

コメント

タイトルとURLをコピーしました