[python] Tesseract を使った OCR

2021/06/29

[python] Tesseract を使った OCR

## pyocr を使ったサンプル

```py
from PIL import Image
import pyocr
 
# OCR エンジンの取得
tools = pyocr.get_available_tools()
tool = tools[0] # 今回は Tesseract しかないので、0番目に入っている

# ビルダーの作成
builder = pyocr.builders.TextBuilder(tesseract_layout=6) # デフォルト値は3

#OCR対象の画像ファイルを読み込む
img = Image.open("test.jpg")
 
#画像から文字を読み込む
result = tool.image_to_string(img, lang="jpn", builder=builder)
 
print(result)
```

## pytesseract を使ったサンプル

```py
from PIL import Image
import pytesseract

# pytesseract を使ったサンプル
 
#OCR対象の画像ファイルを読み込む
img = Image.open("test.jpg")
 
#画像から文字を読み込む
result = pytesseract.image_to_string(img, lang="jpn")
 
print(result)
```

へっぽこプログラマーの備忘録

2021/06/29

[python] Tesseract を使った OCR

Translate

Popular Posts

Labels

Blog Archive