最も基本的なコードのメモです。
pyocr を使ったサンプル
from PIL import Image
import pyocr
# OCR エンジンの取得
tools = pyocr.get_available_tools()
tool = tools[0] # 今回は Tesseract しかないので、0番目に入っている
# ビルダーの作成
builder = pyocr.builders.TextBuilder(tesseract_layout=6) # デフォルト値は3
#OCR対象の画像ファイルを読み込む
img = Image.open("test.jpg")
#画像から文字を読み込む
result = tool.image_to_string(img, lang="jpn", builder=builder)
print(result)
pytesseract を使ったサンプル
from PIL import Image
import pytesseract
# pytesseract を使ったサンプル
#OCR対象の画像ファイルを読み込む
img = Image.open("test.jpg")
#画像から文字を読み込む
result = pytesseract.image_to_string(img, lang="jpn")
print(result)