如何提高讀取正方體的準確性? (How to improve read tesseract accuracy?)


問題描述

如何提高讀取正方體的準確性? (How to improve read tesseract accuracy?)

我想得到以下預期結果。您能給我一些改進結果的建議嗎?

  • 輸入圖像

輸入圖片

  • 預期結果
流 動 資 産
固 定 資 産
  • 實際結果
産 産
資 資
動 定
  • 重現結果
$ git clone https://github.com/zono/ocr.git
$ cd ocr
$ git checkout 0f2541eac302dd1fe2efbbd3b36e7ba40a99d232
$ docker‑compose up ‑d
$ docker exec ‑it ocr /bin/bash
# /usr/local/bin/tesseract /ocr/src/bssample7.png stdout ‑l jpn
産 産
資 資
動 定
  • 版本
$ docker ‑v
Docker version 19.03.5, build 633a0ea

# tesseract ‑v
tesseract 4.1.1‑rc2‑22‑g08899
 leptonica‑1.79.0
  libjpeg 8d (libjpeg‑turbo 1.5.2) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11

參考解法

方法 1:

you need to use another page‑segmentation‑method to get the expected result.

Try to append ‑‑psm 6 to your command to make it look like this:

$ tesseract /ocr/src/bssample7.png outputfilename ‑l jpn ‑‑psm 6

Here you can read about the different methods:

https://github.com/tesseract‑ocr/tesseract/wiki/ImproveQuality#page‑segmentation‑method

Kind regards

方法 2:

I found the solution from Tesseract OCR Read Horizontally rather than Vertically C#

# /usr/local/bin/tesseract /ocr/src/bssample7.png stdout ‑l jpn ‑‑psm 6
流 動 資 産
固 定 資 産

(by zonoEbbyzono)

參考文件

  1. How to improve read tesseract accuracy? (CC BY‑SA 2.5/3.0/4.0)

#tesseract #ocr






相關問題

Android Studio 如何修復無法創建類文件錯誤? (Android Studio How to fix cannot create class-file error?)

Python - 程序收到信號 SIGSEGV,分段錯誤 (Python - Program received signal SIGSEGV, Segmentation fault)

Tesseract OCR 在線程中使用時崩潰 (Tesseract OCR crash when used in thread)

如何將 Leptonica Pix 對象轉換為 Android 的位圖 (How to convert Leptonica Pix Object to Android's Bitmap)

錯誤 2 在 pytesseract 中沒有這樣的文件或目錄 (Error 2 No such file or directory in pytesseract)

OCR:沒有得到想要的結果 (OCR : Not getting desired result)

在 x64 位機器上的 Visual Studio 2013 中鏈接 tesseract 和 opencv (Linking tesseract and opencv in Visual Studio 2013 on x64 bit machine)

如何提高讀取正方體的準確性? (How to improve read tesseract accuracy?)

如何將 C++ tesseract-ocr 代碼轉換為 Python? (how to convert C++ tesseract-ocr code to Python?)

Tesseract Worker.Load 掛在 Vercel 上 (Tesseract Worker.Load hangs on Vercel)

如何在窗口上使用 MinGW 編譯 tesseract baseapi.h? (How to compile tesseract baseapi.h with MinGW on window?)

Pytesseract 或 Keras OCR 從圖像中提取文本 (Pytesseract or Keras OCR to extract text from image)







留言討論