Python 画像中の文字認識をして、テキストへ出力する「pyocr/Tesseract-OCR」
光学文字認識の技術であるOCR(Optical Character Recognition)を使用します。
▼必要なライブラリとソフトのインストール
1. pyocrをインストールする
pip install pyocr
2. tesseract-OCRをインストールする
Windowsは下記リンク先にexeファイルがあります。
Home · UB-Mannheim/tesseract Wiki · GitHub
インストール途中で下記のようにチェックが外れてる箇所が表示されます。
ここで、Additional script data(download)内にあるJapaneseにチェックを入れます。
また、Additional language data(download)内にあるJapaneseにもチェックを入れる
3. tesseract-OCRのパス(path)を通す
まず、インストールされた先を一応確認します。64bit版でfor all userの場合は、例えば次にインストされます。C:\Program Files\Tesseract-OCR
次に、PCアイコンを右クリックしてプロパティ>システムの詳細設定>環境変数>システム環境変数のPathを選択した状態で「編集」>空白行に、上記tesseract-OCRがインストールされたパスを入力して再起動します。
▼本コードの実施例
下図はテスト用の画像ファイルです(wikiより)。文章が複数行に渡って記載されています。
本コードを実行すると、文字を認識して下図のようにテキストファイルへ出力します。
■本プログラム
以上
<広告>