ΠΊΠ°ΠΊ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ ΡΠ΅ΡΡΠ΅ΡΠ°ΠΊΡ Π½Π° windows
ΠΠ΅ ΠΏΠΎΠΉΠΌΡ ΠΊΠ°ΠΊ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ pytesseract
Π Π΅ΡΠ΅Π½ΠΈΠ΅
ΠΠΈΠΊΠ°ΠΊ Π½Π΅ ΠΌΠΎΠ³Ρ ΡΠ°Π·ΠΎΠ±ΡΠ°ΡΡΡΡ ΠΊΠ°ΠΊ Π·Π°ΠΏΡΡΡΠΈΡΡ ΡΡΠΎΡ ΠΊΠΎΠ΄.
Π£ΡΡΠ°Π½ΠΎΠ²ΠΈΠ» Tesseract OCR ΠΏΠΎ ΡΡΠΎΠΌΡ Π³Π°ΠΉΠ΄Ρ https://www.youtube.com/watch. lroundZone ΠΈ Π½Π° Π²Π²ΠΎΠ΄ Π² ΠΊΠΎΠ½ΡΠΎΠ»Ρ tesseract ΠΎΠ½ ΠΎΡΠ·ΡΠ²Π°Π΅ΡΡΡ.
Π ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ
ΡΡΠ΅Π΄Π°Ρ
->ΡΠΈΡΡΠ΅ΠΌΠ½ΡΠ΅ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΠ΅ ΡΡΠ΅Π΄Ρ PATH ΡΠΊΠ°Π·Π°Π» Π³Π΄Π΅ Π½Π°Ρ
ΠΎΠ΄ΠΈΡΡΡ Tesseract OCR
Π£ΡΡΠ°Π½ΠΎΠ²ΠΈΠ» opencv-python c ΠΏΠΎΠΌΠΎΡΡΡ pip install opencv-python
Π£ΡΡΠ°Π½ΠΎΠ²ΠΈΠ» pytesseract pip install pytesseract
ΠΡΠ²ΠΎΠ΄ΠΈΡ Π²ΠΎ ΡΡΠΎ:
PS E:\py projects\content> e:; cd ‘e:\py projects\content’; & ‘python’ ‘c:\Users\dkati\.vscode\extensions\ms-python.python-2021.3.680753044\pythonFiles\lib\python\debugpy\launcher’ ‘55678’ ‘—‘ ‘e:\py projects\content\img_to_str.py’
Traceback (most recent call last):
File «C:\Users\dkati\AppData\Local\Programs\Python\Python39\lib\s ite-packages\pytesseract\pytesseract.py», line 255, in run_tesseract
proc = subprocess.Popen(cmd_args, **subprocess_args())
File «C:\Users\dkati\AppData\Local\Programs\Python\Python39\lib\s ubprocess.py», line 947, in __init__
self._execute_child(args, executable, preexec_fn, close_fds,
File «C:\Users\dkati\AppData\Local\Programs\Python\Python39\lib\s ubprocess.py», line 1416, in _execute_child
hp, ht, pid, tid = _winapi.CreateProcess(executable, args,
FileNotFoundError: [WinError 2] ΠΠ΅ ΡΠ΄Π°Π΅ΡΡΡ Π½Π°ΠΉΡΠΈ ΡΠΊΠ°Π·Π°Π½Π½ΡΠΉ ΡΠ°ΠΉΠ»
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File «e:\py projects\content\img_to_str.py», line 6, in
like=pytesseract.image_to_string(img,config=’outputbase digits’)
File «C:\Users\dkati\AppData\Local\Programs\Python\Python39\lib\s ite-packages\pytesseract\pytesseract.py», line 409, in image_to_string
return <
File «C:\Users\dkati\AppData\Local\Programs\Python\Python39\lib\s ite-packages\pytesseract\pytesseract.py», line 412, in
Output.STRING: lambda: run_and_get_output(*args),
File «C:\Users\dkati\AppData\Local\Programs\Python\Python39\lib\s ite-packages\pytesseract\pytesseract.py», line 287, in run_and_get_output
run_tesseract(**kwargs)
File «C:\Users\dkati\AppData\Local\Programs\Python\Python39\lib\s ite-packages\pytesseract\pytesseract.py», line 259, in run_tesseract
raise TesseractNotFoundError()
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it’s not in your PATH. See README file for more information.
PS E:\py projects\content>
ΠΠΎΠ±Π°Π²Π»Π΅Π½ΠΎ ΡΠ΅ΡΠ΅Π· 41 ΠΌΠΈΠ½ΡΡΡ
ΠΠ°ΡΠ΅Π» ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ Π΄Π°Π½Π½ΠΎΠΉ ΠΏΡΠΎΠ±Π»Π΅ΠΌΡ. ΠΠΎΡΠ»Π΅ Π²ΡΠ΅ΠΉ ΡΡΡΠ°Π½ΠΎΠ²ΠΊΠΈ ΠΈ ΡΠ°Π½ΡΠ΅Π² Ρ Π±ΡΠ±Π½ΠΎΠΌ Π½ΡΠΆΠ½ΠΎ ΠΏΠ΅ΡΠ΅Π·Π°Π³ΡΡΠ·ΠΈΡΡ windows
Π£ΡΡΠ°Π½ΠΎΠ²ΠΊΠ° Tesseract Π΄Π»Ρ OCR
OCR β ΠΌΠ΅Ρ Π°Π½ΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΈΠ»ΠΈ ΡΠ»Π΅ΠΊΡΡΠΎΠ½Π½ΡΠΉ ΠΏΠ΅ΡΠ΅Π²ΠΎΠ΄ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠΉ ΡΡΠΊΠΎΠΏΠΈΡΠ½ΠΎΠ³ΠΎ, ΠΌΠ°ΡΠΈΠ½ΠΎΠΏΠΈΡΠ½ΠΎΠ³ΠΎ ΠΈΠ»ΠΈ ΠΏΠ΅ΡΠ°ΡΠ½ΠΎΠ³ΠΎ ΡΠ΅ΠΊΡΡΠ° Π² ΡΠ΅ΠΊΡΡΠΎΠ²ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡΡΠΈΡ ΡΡ Π΄Π»Ρ ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»Π΅Π½ΠΈΡ ΡΠΈΠΌΠ²ΠΎΠ»ΠΎΠ² Π² ΠΊΠΎΠΌΠΏΡΡΡΠ΅ΡΠ΅.
ΠΠ½Π°ΠΊΠΎΠΌΡΡΠ²ΠΎ Ρ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠΎΠΉ
Tesseract ΠΏΠ΅ΡΠ²ΠΎΠ½Π°ΡΠ°Π»ΡΠ½ΠΎ ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½Π° Hewlett Packard Π² 1980-Ρ Π³ΠΎΠ΄Π°Ρ , Π² 2005 Π³ΠΎΠ΄Ρ Π±ΡΠ» ΠΎΠΏΡΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½ Π΅Ρ ΠΈΡΡ ΠΎΠ΄Π½ΡΠΉ ΠΊΠΎΠ΄. Π Π°Π²Π³ΡΡΡΠ΅ 2006 Π³. Google ΠΊΡΠΏΠΈΠ» Π΅Ρ ΠΈ ΠΎΡΠΊΡΡΠ» ΠΈΡΡ ΠΎΠ΄Π½ΡΠ΅ ΡΠ΅ΠΊΡΡΡ ΠΏΠΎΠ΄ Π»ΠΈΡΠ΅Π½Π·ΠΈΠ΅ΠΉ Apache 2.0 Π΄Π»Ρ ΠΏΠΎΡΠ»Π΅Π΄ΡΡΡΠ΅ΠΉ ΡΠ°Π·ΡΠ°Π±ΠΎΡΠΊΠΈ.
ΠΡΠΎΠ³ΡΠ°ΠΌΠΌΠ½ΠΎΠ΅ ΠΎΠ±Π΅ΡΠΏΠ΅ΡΠ΅Π½ΠΈΠ΅ Tesseract ΡΠ°Π±ΠΎΡΠ°Π΅Ρ ΡΠΎ ΠΌΠ½ΠΎΠ³ΠΈΠΌΠΈ Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΡΠΌΠΈ ΡΠ·ΡΠΊΠ°ΠΌΠΈ ΠΎΡ Π°Π½Π³Π»ΠΈΠΉΡΠΊΠΎΠ³ΠΎ (ΠΏΠ΅ΡΠ²ΠΎΠ½Π°ΡΠ°Π»ΡΠ½ΠΎ) Π΄ΠΎ ΠΏΠ°Π½Π΄ΠΆΠ°Π±ΠΈ. Π‘ ΠΌΠΎΠΌΠ΅Π½ΡΠ° ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΡ Π² 2015 Π³ΠΎΠ΄Ρ ΠΎΠ½ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΈΠ²Π°Π΅Ρ Π±ΠΎΠ»Π΅Π΅ 100 ΠΏΠΈΡΡΠΌΠ΅Π½Π½ΡΡ ΡΠ·ΡΠΊΠΎΠ² ΠΈ ΡΠΎΠ΄Π΅ΡΠΆΠΈΡ ΠΎΠ±ΡΡΠ°Π΅ΠΌΡΠΉ ΠΊΠΎΠ΄ Π΄Π»Ρ Π΄ΡΡΠ³ΠΈΡ ΡΠ·ΡΠΊΠΎΠ². ΠΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° ΡΡΡΡΠΊΠΎΠ³ΠΎ ΡΠ·ΡΠΊΠ° ΡΠ΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π° ΠΏΠΎΠ΄ΠΊΠ»ΡΡΠ΅Π½ΠΈΠ΅ΠΌ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΡΡ ΠΌΠΎΠ΄ΡΠ»Π΅ΠΉ.
ΠΠ΅ΡΠ²ΠΎΠ½Π°ΡΠ°Π»ΡΠ½ΠΎ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠ° Π±ΡΠ»Π° Π½Π°ΠΏΠΈΡΠ°Π½Π° Π½Π° C, Π² 1998 Π³ΠΎΠ΄Ρ Π±ΡΠ»Π° ΠΏΠ΅ΡΠ΅Π½Π΅ΡΠ΅Π½Π° Π½Π° C ++. Π£ Π½Π΅Ρ Π½Π΅Ρ Π³ΡΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡΠ°, Π½ΠΎ Π΅ΡΡΡ ΡΡΠΎΡΠΎΠ½Π½ΠΈΠ΅ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠ½ΡΠ΅ ΠΏΡΠΎΠ΅ΠΊΡΡ, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΎΠ±Π΅ΡΡΡΠ²Π°ΡΡ Tesseract Π΄Π»Ρ ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»Π΅Π½ΠΈΡ Π³ΡΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΈΠ½ΡΠ΅ΡΡΠ΅ΠΉΡΠ° ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Ρ.
Π£ΡΡΠ°Π½ΠΎΠ²ΠΊΠ° Tesseract
Π§ΡΠΎΠ±Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΡ Tesseract, Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ Π΅Ρ Π² ΠΎΠΏΠ΅ΡΠ°ΡΠΈΠΎΠ½Π½ΡΡ ΡΠΈΡΡΠ΅ΠΌΡ.
ΠΠ»Ρ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Π΅ΠΉ MacOS Π²ΠΎΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΡΡ brew:
ΠΡΠ»ΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΡΡ ΠΎΠΏΠ΅ΡΠ°ΡΠΈΠΎΠ½Π½Π°Ρ ΡΠΈΡΡΠ΅ΠΌΠ° Ubuntu:
ΠΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»ΡΠΌ Windows ΠΎΡΠΈΡΠΈΠ°Π»ΡΠ½ΡΡ Π±ΠΈΠ½Π°ΡΠ½ΡΡ ΡΠ±ΠΎΡΠΎΠΊ Tesseract Π½Π΅ ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»ΡΠ΅ΡΡΡ, ΠΏΠΎΡΡΠΎΠΌΡ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡΠ΅ΡΡΡ Π²ΠΎΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡΡΡ ΠΏΠΎΠΈΡΠΊΠΎΠ²ΡΠΌΠΈ ΡΠΈΡΡΠ΅ΠΌΠ°ΠΌΠΈ Π΄Π»Ρ ΠΏΠΎΠΈΡΠΊΠΎΠ² ΡΡΠΎΡΠΎΠ½Π½ΠΈΡ ΡΠ±ΠΎΡΠΎΠΊ.
ΠΡΠΎΠ²Π΅ΡΠΊΠ° ΠΏΡΠ°Π²ΠΈΠ»ΡΠ½ΠΎΡΡΠΈ ΡΡΡΠ°Π½ΠΎΠ²ΠΊΠΈ
Π§ΡΠΎΠ±Ρ ΠΏΡΠΎΠ²Π΅ΡΠΈΡΡ, ΡΡΠΎ Tesseract Π±ΡΠ» ΡΡΠΏΠ΅ΡΠ½ΠΎ ΡΡΡΠ°Π½ΠΎΠ²Π»Π΅Π½, Π²ΡΠΏΠΎΠ»Π½ΠΈΠΌ ΡΠ»Π΅Π΄ΡΡΡΡΡ ΠΊΠΎΠΌΠ°Π½Π΄Ρ:
Π ΠΊΠΎΠΌΠ°Π½Π΄Π½ΡΡ ΡΡΡΠΎΠΊΡ Π΄ΠΎΠ»ΠΆΠ½Π° ΡΠ°ΡΠΏΠ΅Π²Π°ΡΡΡΡ Π²Π΅ΡΡΠΈΡ Tesseract, Π° ΡΠ°ΠΊΠΆΠ΅ ΡΠΏΠΈΡΠΎΠΊ ΡΠΎΠ²ΠΌΠ΅ΡΡΠΈΠΌΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ ΡΠΎΡΠΌΠ°ΡΠΎΠ² ΡΠ°ΠΉΠ»ΠΎΠ² ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠΉ.
ΠΡΠ»ΠΈ ΠΏΠΎΡΠ²ΠΈΠ»Π°ΡΡ ΠΎΡΠΈΠ±ΠΊΠ°:
ΡΠΎΠ³Π΄Π° Π²Π΅ΡΠ½ΠΈΡΠ΅ΡΡ ΠΊ ΠΏΡΠ΅Π΄ΡΠ΄ΡΡΠ΅ΠΌΡ ΡΠ°Π³Ρ ΠΈ ΡΡΡΡΠ°Π½ΠΈΡΠ΅ ΠΎΡΠΈΠ±ΠΊΠΈ ΡΡΡΠ°Π½ΠΎΠ²ΠΊΠΈ. ΠΡΠΎΠΌΠ΅ ΡΠΎΠ³ΠΎ, ΠΌΠΎΠΆΠ΅Ρ ΠΏΠΎΡΡΠ΅Π±ΠΎΠ²Π°ΡΡΡΡ ΠΎΠ±Π½ΠΎΠ²ΠΈΡΡ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΡ ΠΎΠΊΡΡΠΆΠ΅Π½ΠΈΡ PATH (ΡΠΎΠ»ΡΠΊΠΎ Π΄Π»Ρ ΠΏΡΠΎΠ΄Π²ΠΈΠ½ΡΡΡΡ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»Π΅ΠΉ).
ΠΡΠΎΠ²Π΅ΡΠΊΠ° Tesseract OCR
ΠΠ»Ρ ΡΠΎΠ³ΠΎ ΡΡΠΎΠ±Ρ ΠΏΠΎΠ»ΡΡΠΈΡΡ ΡΠ°Π·ΡΠΌΠ½ΡΠ΅ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ Π² Tesseract OCR Π½ΡΠΆΠ½ΠΎ ΠΏΡΠ΅Π΄Π²Π°ΡΠΈΡΠ΅Π»ΡΠ½ΠΎ ΠΎΠ±ΡΠ°Π±ΠΎΡΠ°ΡΡ ΡΠΈΡΡΠΎΠ²ΡΠΌΠΈ ΡΠΈΠ»ΡΡΡΠ°ΠΌΠΈ ΠΏΠΎΡΡΡΠΏΠ°ΡΡΠΈΠ΅ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ.
ΠΡΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠΈ Tesseract ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡΠ΅ΡΡΡ:
ΠΡΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΡ ΠΎΡ ΡΡΠΈΡ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°ΡΠΈΠΉ ΠΌΠΎΠ³ΡΡ ΠΏΡΠΈΠ²Π΅ΡΡΠΈ ΠΊ Π½Π΅ΠΏΡΠ°Π²ΠΈΠ»ΡΠ½ΡΠΌ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ°ΠΌ OCR.
Π’Π΅ΠΏΠ΅ΡΡ ΠΏΡΠΈΠΌΠ΅Π½ΠΈΠΌ OCR ΠΊ ΡΠ»Π΅Π΄ΡΡΡΠ΅ΠΌΡ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ:
ΠΠ°ΠΏΡΡΡΠΈΠΌ ΠΊΠΎΠΌΠ°Π½Π΄Ρ Π² ΡΠ΅ΡΠΌΠΈΠ½Π°Π»Π΅:
Tesseract ΠΏΡΠ°Π²ΠΈΠ»ΡΠ½ΠΎ ΡΠ°ΡΠΏΠΎΠ·Π½Π°Π» ΡΠ΅ΠΊΡΡ Β«Testing Tesseract OCRΒ» ΠΈ ΡΠ°ΡΠΏΠ΅ΡΠ°ΡΠ°Π» Π΅Π³ΠΎ Π² ΡΠ΅ΡΠΌΠΈΠ½Π°Π»Π΅.
ΠΠ³ΡΠ°Π½ΠΈΡΠ΅Π½ΠΈΡ Tesseract
Π ΡΠΎΠΆΠ°Π»Π΅Π½ΠΈΡ, ΡΡΠΎΡ ΡΠΈΠ½ΡΠ΅ΡΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΏΡΠΈΠΌΠ΅Ρ Π΄ΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎ Π΄Π°Π»ΡΠΊ ΠΎΡ ΡΠ΅Π°Π»ΡΠ½ΠΎΡΡΠΈ. ΠΡΠ»ΠΈ ΡΠ°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π΅ΠΌΡΠΉ ΡΠ΅ΠΊΡΡ ΠΏΠ»ΠΎΡ ΠΎ ΠΎΡΠ΄Π΅Π»ΠΈΠΌ ΠΎΡ ΡΠΎΠ½Π° ΠΈΠ»ΠΈ ΠΎΠ½ ΡΠΈΠ»ΡΠ½ΠΎ ΠΏΠΈΠΊΡΠ΅Π»ΠΈΡΠΎΠ²Π°Π½, ΡΠΎ Tesseract ΡΠΊΠΎΡΠ΅Π΅ Π²ΡΠ΅Π³ΠΎ Π²Π΅ΡΠ½ΡΡ ΠΎΡΠΈΠ±ΠΎΡΠ½ΡΠ΅ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ. Tesseract Π»ΡΡΡΠ΅ Π²ΡΠ΅Π³ΠΎ ΠΏΠΎΠ΄Ρ ΠΎΠ΄ΠΈΡ Π΄Π»Ρ ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅ΡΠ½ΠΎΠΉ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ², Π² ΠΊΠΎΡΠΎΡΡΡ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ ΡΠΊΠ°Π½ΠΈΡΡΡΡΡΡ, ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°ΡΡΡΡ ΡΠΈΡΡΠΎΠ²ΡΠΌΠΈ ΡΠΈΠ»ΡΡΡΠ°ΠΌΠΈ, Π° Π·Π°ΡΠ΅ΠΌ ΠΊ Π½ΠΈΠΌ ΠΏΡΠΈΠΌΠ΅Π½ΡΠ΅ΡΡΡ ΠΎΠΏΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΡΠ°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΠ΅ ΡΠΈΠΌΠ²ΠΎΠ»ΠΎΠ².
Π‘Π»Π΅Π΄ΡΠ΅Ρ ΠΎΡΠΌΠ΅ΡΠΈΡΡ, ΡΡΠΎ Tesseract Π½Π΅ ΡΠ²Π»ΡΠ΅ΡΡΡ Π³ΠΎΡΠΎΠ²ΡΠΌ ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ΠΌ Π΄Π»Ρ OCR, ΠΊΠΎΡΠΎΡΠΎΠ΅ ΡΠΌΠΎΠΆΠ΅Ρ ΡΠ°Π±ΠΎΡΠ°ΡΡ Π²ΠΎ Π²ΡΠ΅Ρ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡΡ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠΉ ΠΈ ΠΊΠΎΠΌΠΏΡΡΡΠ΅ΡΠ½ΠΎΠ³ΠΎ Π·ΡΠ΅Π½ΠΈΡ. ΠΠ»Ρ ΡΠ»ΠΎΠΆΠ½ΡΡ ΡΠ°ΡΡΠ½ΡΡ ΡΠ»ΡΡΠ°Π΅Π² Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎ ΠΏΡΠΈΠΌΠ΅Π½ΠΈΡΡ ΠΌΠ΅ΡΠΎΠ΄Ρ ΠΈΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΡ ΠΏΡΠΈΠ·Π½Π°ΠΊΠΎΠ², ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ΅ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ ΠΈ ΠΈΡΠΊΡΡΡΡΠ²Π΅Π½Π½ΡΠΉ ΠΈΠ½ΡΠ΅Π»Π»Π΅ΠΊΡ.
Π Π΅Π·ΡΠΌΠ΅
ΠΡΠ»ΠΈ ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°Π΅ΠΌΡΠ΅ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ Π½Π΅ Π±ΡΠ΄ΡΡ ΡΠΎΠ΄Π΅ΡΠΆΠ°ΡΡ ΡΡΡΠΊΠΎΠ³ΠΎ ΡΠ΅ΠΊΡΡΠ°, Tesseract Π΄Π°ΡΡ ΠΏΠ»ΠΎΡ ΠΈΠ΅ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ. Π ΡΠ»ΡΡΠ°Π΅ Π·Π°ΡΡΠΌΠ»ΡΠ½Π½ΡΡ Π²Ρ ΠΎΠ΄Π½ΡΡ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠΉ, ΠΏΠΎΠ»ΡΡΠΈΡΡ Π»ΡΡΡΡΡ ΡΠΎΡΠ½ΠΎΡΡΡ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ±ΡΡΠ°Ρ ΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»ΡΡΠΊΡΡ ΠΌΠΎΠ΄Π΅Π»Ρ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ.
Tesseract Π»ΡΡΡΠ΅ Π²ΡΠ΅Π³ΠΎ ΠΏΠΎΠ΄Ρ ΠΎΠ΄ΠΈΡ Π΄Π»Ρ ΡΠΈΡΡΠ°ΡΠΈΠΉ Ρ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡΠΌΠΈ Π²ΡΡΠΎΠΊΠΎΠ³ΠΎ ΡΠ°Π·ΡΠ΅ΡΠ΅Π½ΠΈΡ, Π³Π΄Π΅ ΡΠ΅ΠΊΡΡ ΠΏΠ΅ΡΠ΅Π΄Π½Π΅Π³ΠΎ ΠΏΠ»Π°Π½Π° ΡΡΡΠΊΠΎ ΠΎΡΠ΄Π΅Π»ΠΈΠΌ ΠΎΡ ΡΠΎΠ½Π°.
Π‘ΠΎΠ·Π΄Π°ΡΠΌ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ Π½Π° Π‘++ Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ Tesseract-ocr, MinGW ΠΈ Π½Π°ΠΏΠΈΠ»ΡΠ½ΠΈΠΊΠ°
Π’Π°ΠΊ ΡΠ»ΡΡΠΈΠ»ΠΎΡΡ, ΡΡΠΎ ΠΏΠΎΠ½Π°Π΄ΠΎΠ±ΠΈΠ»ΠΎΡΡ Π½Π°ΠΌ Π²Π½Π΅Π΄ΡΠΈΡΡ Π² ΡΠ²ΠΎΡ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΡ ΡΠ°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΡ ΡΠ΅ΠΊΡΡΠ°, ΠΏΠΎΡΡΠΎΠΌΡ Π½Π°ΡΠ°Π»ΠΈΡΡ ΠΏΠΎΠΈΡΠΊΠΈ ΠΏΠΎΠ΄Ρ ΠΎΠ΄ΡΡΠ΅ΠΉ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ. Π ΠΊΠΎΠ½Π΅ΡΠ½ΠΎΠΌ ΡΡΡΡΠ΅ ΠΎΡΡΠ°Π½ΠΎΠ²ΠΈΠ»ΠΈΡΡ Π½Π° Π΄Π²ΡΡ ΠΎΠΏΠ΅Π½ΡΠΎΡΡΠ½ΡΡ ΠΏΡΠΎΠ΅ΠΊΡΠ°Ρ CuneiForm Linux ΠΈ Tesseract-ocr. ΠΠ½ΠΈΠΌΠ°ΡΠ΅Π»ΡΠ½ΠΎΠ΅ ΠΈΠ·ΡΡΠ΅Π½ΠΈΠ΅ ΠΏΡΠΎΠ΅ΠΊΡΠ° CuneiForm ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΎ, ΡΡΠΎ ΡΡΠΎ ΠΏΡΠΎΡΡΠΎ ΠΏΠΎΡΡ ΠΏΡΠΎΠ΄ΡΠΊΡΠ° ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ Cognitive Technologies, ΠΈΡΡ ΠΎΠ΄Π½ΠΈΠΊΠΈ ΠΊΠΎΡΠΎΡΠΎΠ³ΠΎ ΠΎΠ½ΠΈ ΠΎΡΠΊΡΡΠ»ΠΈ Π² 2008 Π³ΠΎΠ΄Ρ ΠΈ Π±Π»Π°Π³ΠΎΠΏΠΎΠ»ΡΡΠ½ΠΎ Π·Π°Π±ΠΈΠ»ΠΈ ΠΏΠΎΠ»ΡΡΠΈΠ² ΡΠ²ΠΎΡ ΠΏΠΎΡΡΠΈΡ Π²Π½ΠΈΠΌΠ°Π½ΠΈΡ (Π²ΠΎ Π²ΡΡΠΊΠΎΠΌ ΡΠ»ΡΡΠ°Π΅ ΡΠ°ΠΊΠΎΠ΅ ΡΠ»ΠΎΠΆΠΈΠ»ΠΎΡΡ Π²ΠΏΠ΅ΡΠ°ΡΠ»Π΅Π½ΠΈΠ΅). ΠΠΎ ΡΡΡΠΈ Π²Π΅ΡΡ ΠΏΡΠΎΠ΅ΠΊΡ ΡΠΎΡΡΠΎΡΠ» Π² ΠΏΠΎΡΡΠΈΡΠΎΠ²Π°Π½ΠΈΠΈ, Π° ΠΎ Π½ΠΎΠ²ΡΡ ΡΠΈΡΠ°Ρ Π΄Π°ΠΆΠ΅ ΡΠ΅ΡΠΈ Π½Π΅ ΡΠ»ΠΎ. ΠΡΡ ΡΡΠΎ, Π²ΠΊΡΠΏΠ΅ Ρ ΠΏΠ΅ΡΠ°Π»ΡΠ½ΠΎΠΉ Π½ΠΎΠ²ΠΎΡΡΡΡ Π½Π° ΡΡΡΠ°Π½ΠΈΡΠΊΠ΅ ΠΏΡΠΎΠ΅ΠΊΡΠ°, Π·Π°ΡΡΠ°Π²ΠΈΠ»ΠΎ Π½Π°Ρ ΠΎΡΠΊΠ°Π·Π°ΡΡΡΡ ΠΎΡ CuneiForm Π² ΠΏΠΎΠ»ΡΠ·Ρ Tesseract, ΠΊΠΎΡΠΎΡΡΠΉ Π² Π΄Π°Π½Π½ΡΠΉ ΠΌΠΎΠΌΠ΅Π½Ρ ΠΏΡΠΈΠ½Π°Π΄Π»Π΅ΠΆΠΈΡ Google, ΡΡΠΎ Π΄Π°ΡΡ Π½Π΅ΠΊΠΎΡΠΎΡΡΡ ΡΠ²Π΅ΡΠ΅Π½Π½ΠΎΡΡΡ Π² Π±ΡΠ΄ΡΡΠ΅ΠΌ ΠΏΡΠΎΠ΅ΠΊΡΠ°. ΠΠΎΠ΄ ΠΊΠ°ΡΠΎΠΌ ΠΎΠΏΡΡ ΡΠ±ΠΎΡΠΊΠΈ Tesseract-ocr ΠΏΠΎΠ΄ Windows Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ MinGW ΠΈ ΠΏΠΎΡΠ»Π΅Π΄ΡΡΡΠ΅Π³ΠΎ ΡΠΎΠ·Π΄Π°Π½ΠΈΡ ΠΏΡΠΎΡΡΠ΅ΠΉΡΠ΅Π³ΠΎ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΡ Π½Π° Π‘++.
ΠΠΎΠ΄Π³ΠΎΡΠΎΠ²ΠΊΠ°
Π― ΠΏΠΎΡΡΠ°ΡΠ°ΡΡΡ ΠΎΠΏΠΈΡΠ°ΡΡ Π²ΡΡ ΡΡΠΎ Π½ΡΠΆΠ½ΠΎ ΡΠ΄Π΅Π»Π°ΡΡ, ΡΡΠΎΠ±Ρ ΡΠΎΠ±ΡΠ°ΡΡ tesseract Ρ ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡΠ½ΠΎΠΉ Π³ΠΎΠ»ΠΎΠ²Π½ΠΎΠΉ Π±ΠΎΠ»ΡΡ, ΠΏΡΠΈ ΡΡΠΎΠΌ ΠΏΠΎΡΡΠ°ΡΠ°ΡΡΡ Π½Π΅ ΡΠ³Π»ΡΠ±Π»ΡΡΡΡΡ Π² Π±Π°Π½Π°Π»ΡΠ½ΠΎΡΡΠΈ.
Π£ΡΡΠ°Π½ΠΎΠ²ΠΊΠ° ΠΈ Π½Π°ΡΡΡΠΎΠΉΠΊΠ° MinGW
Π‘ΠΊΠ°ΡΠΈΠ²Π°Π΅ΠΌ ΠΈ ΡΡΡΠ°Π½Π°Π²Π»ΠΈΠ²Π°Π΅ΠΌ ΠΏΠΎΡΠ»Π΅Π΄Π½ΠΈΠΉ Π΄ΠΎΡΡΡΠΏΠ½ΡΠΉ ΠΈΠ½ΡΡΠ°Π»Π»ΡΡΠΎΡ Ρ ΠΎΡΠΈΡΠΈΠ°Π»ΡΠ½ΠΎΠ³ΠΎ ΡΠ°ΠΉΡΠ° ΠΏΡΠΎΠ΅ΠΊΡΠ°, Π½Π΅ Π·Π°Π±ΡΠ²Π°Π΅ΠΌ Π²ΡΡΡΠ°Π²ΠΈΡΡ Π³Π°Π»ΠΎΡΠΊΠΈ Π΄Π»Ρ C++ Compiler ΠΈ MSYS Basic System. ΠΠΎΡΠ»Π΅ ΡΡΠΎΠ³ΠΎ Π·Π°Ρ
ΠΎΠ΄ΠΈΠΌ Π² MinGW Shell ΠΈ ΡΡΡΠ°Π½Π°Π²Π»ΠΈΠ²Π°Π΅ΠΌ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΡΠ΅ ΠΏΠ°ΠΊΠ΅ΡΡ, ΠΊΠΎΡΠΎΡΡΠ΅ ΠΏΠΎΠ½Π°Π΄ΠΎΠ±ΡΡΡΡ Π½Π°ΠΌ ΠΏΠΎΠ·ΠΆΠ΅, ΡΠ»Π΅Π΄ΡΡΡΠ΅ΠΉ ΠΊΠΎΠΌΠ°Π½Π΄ΠΎΠΉ:
mingw-get install mingw32-automake mingw32-autoconf mingw32-autotools mingw32-libz
Π‘ΡΠ°Π·Ρ Π·Π°ΠΌΠ΅ΡΠΈΠΌ, ΡΡΠΎ Π² /mingv ΠΏΡΠΈΠΌΠΎΠ½ΡΠΈΡΠΎΠ²Π°Π½ ΠΊΠ°ΡΠ°Π»ΠΎΠ³, Π² ΠΊΠΎΡΠΎΡΡΠΉ ΡΡΡΠ°Π½ΠΎΠ²Π»Π΅Π½ MinGW, ΡΡΠΎ Π½Π°ΠΌ ΡΠ°ΠΊΠΆΠ΅ ΠΏΡΠΈΠ³ΠΎΠ΄ΠΈΡΡΡ ΠΏΡΠΈ ΡΠ±ΠΎΡΠΊΠ΅ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊ.
Π£ΡΡΠ°Π½Π°Π²Π»ΠΈΠ²Π°Π΅ΠΌ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΡ Leptonica
Tesseract-ocr ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅Ρ Π΄Π»Ρ ΡΠ°Π±ΠΎΡΡ Ρ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡΠΌΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΡ Leptonica, Ρ ΠΎΠΏΠΈΡΡ ΠΊΠ°ΠΊ ΡΠΎΠ±ΡΠ°ΡΡ ΠΈ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ Π΅Ρ ΠΈΠ· ΠΈΡΡ ΠΎΠ΄Π½ΡΡ ΠΊΠΎΠ΄ΠΎΠ², ΠΊΠΎΡΠΎΡΡΠ΅ ΠΌΠΎΠΆΠ½ΠΎ Π²Π·ΡΡΡ Ρ ΠΎΡΠΈΡΠΈΠ°Π»ΡΠ½ΠΎΠ³ΠΎ ΡΠ°ΠΉΡΠ°, Π½ΠΎ ΠΏΠ΅ΡΠ΅Π΄ ΡΡΠΈΠΌ Π½Π°ΠΌ Π½ΡΠΆΠ½ΠΎ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ libJpeg, libPng ΠΈ libTiff, ΠΊΠΎΡΠΎΡΡΠ΅ Π² ΡΠ²ΠΎΡ ΠΎΡΠ΅ΡΠ΅Π΄Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅Ρ Leptonica (ΡΠ΄Π΅Π»Π°Π΅ΠΌ ΡΡΠΎ ΡΠ°ΠΊΠΆΠ΅ ΡΠ±ΠΎΡΠΊΠΎΠΉ ΠΈΠ· ΠΈΡΡ ΠΎΠ΄Π½ΡΡ ΠΊΠΎΠ΄ΠΎΠ²).
Π‘Π±ΠΎΡΠΊΠ° libJpeg
Π‘Π±ΠΎΡΠΊΠ° libPng
Π’Π°ΠΊΠΆΠ΅ ΡΠΊΠ°ΡΠΈΠ²Π°Π΅ΠΌ Π°ΡΡ ΠΈΠ² Ρ ΠΈΡΡ ΠΎΠ΄Π½ΡΠΌΠΈ ΠΊΠΎΠ΄Π°ΠΌΠΈ ΡΠΎ ΡΡΡΠ°Π½ΠΈΡΠΊΠΈ ΠΏΡΠΎΠ΅ΠΊΡΠ° ΠΈ ΡΠ°ΡΠΏΠ°ΠΊΠΎΠ²ΡΠ²Π°Π΅ΠΌ Π² ΠΊΠ°ΡΠ°Π»ΠΎΠ³ D:\lib\png (ΠΡ, Π΅ΡΡΠ΅ΡΡΠ²Π΅Π½Π½ΠΎ, ΠΌΠΎΠΆΠ΅ΡΠ΅ Π²ΡΠ±ΡΠ°ΡΡ Π΄ΡΡΠ³ΠΎΠΉ). ΠΠΎΠ·Π²ΡΠ°ΡΠ°Π΅ΠΌΡΡ Π² MinGW Shell ΠΈ ΠΏΠΎΠ²ΡΠΎΡΡΠ΅ΠΌ ΡΠΎ ΠΆΠ΅ ΡΠ°ΠΌΠΎΠ΅, ΡΡΠΎ ΠΈ Π΄Π»Ρ libJpeg.
Π‘Π±ΠΎΡΠΊΠ° libTiff
ΠΡΡ ΠΈΠ² Ρ ΠΈΡΡ ΠΎΠ΄Π½ΡΠΌΠΈ ΠΊΠΎΠ΄Π°ΠΌΠΈ Π±Π΅ΡΡΠΌ Ρ ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡΠ΅ΠΌΠΎΠ³ΠΎ ftp ΠΈ ΡΠ°ΡΠΏΠ°ΠΊΠΎΠ²ΡΠ²Π°Π΅ΠΌ Π² D:\lib\tiff. Π ΡΠΎΠ±ΠΈΡΠ°Π΅ΠΌ Π°Π½Π°Π»ΠΎΠ³ΠΈΡΠ½ΠΎ ΠΏΡΠ΅Π΄ΡΠ΄ΡΡΠΈΠΌ Π΄Π²ΡΠΌ.
Π‘Π±ΠΎΡΠΊΠ° Leptonica
ΠΡΡ
ΠΈΠ² Ρ ΠΈΡΡ
ΠΎΠ΄Π½ΡΠΌΠΈ ΠΊΠΎΠ΄Π°ΠΌΠΈ Ρ Π½Π°Ρ ΡΠΆΠ΅ Π΅ΡΡΡ, ΠΎΡΡΠ°Π»ΠΎΡΡ Π΅Π³ΠΎ ΡΠ°ΡΠΏΠ°ΠΊΠΎΠ²Π°ΡΡ Π² D:\lib\leptonica. Π Π΄Π°Π»ΡΡΠ΅ Π²ΠΏΠΎΡΡ Π²ΡΠΏΠΎΠΌΠ½ΠΈΡΡ ΠΏΡΠΎ Π½Π°ΠΏΠΈΠ»ΡΠ½ΠΈΠΊ, ΡΠ±ΠΎΡΠΊΠ° Ρ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠΎΠΉ Zlib Π½Π΅ ΡΠ΄Π°ΡΡΡΡ ΠΈΠ·-Π·Π° Π½Π΅Π±ΠΎΠ»ΡΡΠΎΠ³ΠΎ Π±Π°Π³Π°, ΠΊΠΎΡΠΎΡΡΠΉ Π²ΠΏΡΠΎΡΠ΅ΠΌ Π»Π΅Π³ΠΊΠΎ ΠΈΡΠΏΡΠ°Π²ΠΈΡΡ ΡΠ°ΠΌΠΎΡΡΠΎΡΡΠ΅Π»ΡΠ½ΠΎ. ΠΠ»Ρ ΡΡΠΎΠ³ΠΎ ΠΎΡΠΊΡΡΠ²Π°Π΅ΠΌ ΡΠ°ΠΉΠ» src/pngio.c, ΡΠ°ΡΠΏΠΎΠ»ΠΎΠΆΠ΅Π½Π½ΡΠΉ Π² ΠΊΠ°ΡΠ°Π»ΠΎΠ³Π΅, ΠΊΡΠ΄Π° ΠΌΡ ΡΠ°ΡΠΏΠ°ΠΊΠΎΠ²Π°Π»ΠΈ ΠΈΡΡ
ΠΎΠ΄Π½ΠΈΠΊΠΈ Leptonica. Π’Π°ΠΌ Π½Π΅ΠΎΠ±Ρ
ΠΎΠ΄ΠΈΠΌΠΎ Π½Π°ΠΉΡΠΈ ΡΡΡΠΎΠΊΡ #include Β«png.hΒ» ΠΈ Π²ΡΡΠ°Π²ΠΈΡΡ ΠΏΠΎΡΠ»Π΅ Π½Π΅Ρ Π΄ΠΈΡΠ΅ΠΊΡΠΈΠ²Ρ, ΡΡΠΎΠ±Ρ ΠΏΠΎΠ»ΡΡΠΈΠ»ΠΎΡΡ ΠΏΡΠΈΠΌΠ΅ΡΠ½ΠΎ Π²ΠΎΡ ΡΠ°ΠΊ:
#include «png.h»
#ifdef HAVE_LIBZ
#include «zlib.h»
#endif
Π‘Π±ΠΎΡΠΊΠ° ΠΈ ΡΡΡΠ°Π½ΠΎΠ²ΠΊΠ° Tesseract-ocr
Π’Π΅ΠΏΠ΅ΡΡ Ρ Π½Π°Ρ Π΅ΡΡΡ Π²ΡΠ΅ Π½Π΅ΠΎΠ±Ρ
ΠΎΠ΄ΠΈΠΌΡΠ΅ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠΈ. Π‘ΠΊΠ°ΡΠΈΠ²Π°ΡΡ ΠΈΡΡ
ΠΎΠ΄Π½ΠΈΠΊΠΈ Π½Π° ΡΡΠΎΡ ΡΠ°Π· Π±ΡΠ΄Π΅ΠΌ ΠΈΠ· ΡΡΠ°Π½ΠΊΠ° svn ΡΠ°Π·ΡΠ°Π±ΠΎΡΡΠΈΠΊΠΎΠ²:
svn checkout ht tp://tesseract-ocr.googlecode.com/svn/trunk/ tesseract-ocr-read-only
*ΠΏΡΠΎΠ±Π΅Π» ΠΌΠ΅ΠΆΠ΄Ρ t ΠΏΡΠ΅Π΄Π½Π°ΡΠ½Π°ΡΠ΅Π½ ΠΈΡΠΊΠ»ΡΡΠΈΡΠ΅Π»ΡΠ½ΠΎ Π΄Π»Ρ Ρ
Π°Π±ΡΠ°ΠΏΠ°ΡΡΠ΅ΡΠ°, ΡΠ±Π΅ΡΠΈΡΠ΅ Π΅Π³ΠΎ.
ΠΡΠΎΡΡΠΎΠ΅ ΠΏΡΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅
Π― ΠΏΡΠΈΠ²Π΅Π΄Ρ ΠΊΠΎΠ΄ ΡΠ΅Π»ΠΈΠΊΠΎΠΌ, ΡΠ°ΠΊ ΠΊΠ°ΠΊ ΠΎΠ½ Π²Π΅ΡΡΠΌΠ° ΠΌΠ°Π»:
#include
#include
#include
#include
Π ΡΡΡΠΊΠΈΠ΅ ΠΠ»ΠΎΠ³ΠΈ
ΠΡΠΎΡΡΠΎΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΈ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ Tesseract-OCR
Π’ΡΠ°Π½ΡΡΠ΅Ρ ΠΈΠ·
Tesseract, OCR (ΠΠΏΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΡΠ°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΠ΅ ΡΠΈΠΌΠ²ΠΎΠ»ΠΎΠ², ΠΎΠΏΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΡΠ°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΠ΅ ΡΠΈΠΌΠ²ΠΎΠ»ΠΎΠ²) Ρ ΠΎΡΠΊΡΡΡΡΠΌ ΠΈΡΡ
ΠΎΠ΄Π½ΡΠΌ ΠΊΠΎΠ΄ΠΎΠΌ, ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½Π½ΡΠΉ HP Labs, ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΈΠ²Π°Π΅ΠΌΡΠΉ Google ΠΡΠΎΠ΄ΠΎΠ»ΠΆΠ°ΠΉΡΠ΅ ΡΠΎΠ²Π΅ΡΡΠ΅Π½ΡΡΠ²ΠΎΠ²Π°ΡΡ, Π΅ΡΠ»ΠΈ ΠΊΠΎΠΌΠ°Π½Π΄Π΅ ΡΡΠΎ Π½Π΅ΠΎΠ±Ρ
ΠΎΠ΄ΠΈΠΌΠΎ, Π²Ρ ΡΠ°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π΅Π³ΠΎ Π² ΠΊΠ°ΡΠ΅ΡΡΠ²Π΅ ΡΠ°Π±Π»ΠΎΠ½Π° Π΄Π»Ρ ΡΠ°Π·ΡΠ°Π±ΠΎΡΠΊΠΈ ΠΌΠ΅Ρ
Π°Π½ΠΈΠ·ΠΌΠ° ΡΠ°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΡ, ΠΊΠΎΡΠΎΡΡΠΉ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΠ΅Ρ Π²Π°ΡΠΈΠΌ ΠΏΠΎΡΡΠ΅Π±Π½ΠΎΡΡΡΠΌ.
ΠΠ°Π»Π΅Π΅ ΠΌΡ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΠΌ Tesseract ΠΏΠΎΠ΄ Windows ΠΈ ΠΎΡΡΡΠ΅ΡΡΠ²ΠΈΠΌ ΠΏΡΠΎΡΡΠΎΠ΅ ΠΏΡΠ΅ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΈ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅:
Π Π΅Π°Π»ΠΈΠ·Π°ΡΠΈΡ Π’Π΅ΡΡΠ΅ΡΠ°ΠΊΡΠ°
ΠΠ±ΡΠΈΠΉ ΠΏΡΠΎΡΠ΅ΡΡ: ΡΡΡΠ°Π½ΠΎΠ²ΠΊΠ° Tesseract-> ΠΎΡΠΊΡΡΡΡ ΠΊΠΎΠΌΠ°Π½Π΄Π½ΡΡ ΡΡΡΠΎΠΊΡ-> ΡΠΎΠ·Π΄Π°ΡΡ ΡΠ΅Π»Π΅Π²ΠΎΠΉ ΡΠ°ΠΉΠ»
Π’Π΅ΡΡΠ΅ΡΠ°ΠΊΡ ΡΡΡΠ°Π½ΠΎΠ²ΠΊΠ°
ΠΠ°Π³ΡΡΠ·ΠΈΡΠ΅ ΡΡΡΠ°Π½ΠΎΠ²ΠΎΡΠ½ΡΠΉ ΠΏΠ°ΠΊΠ΅Ρ tesseract-ocr-setup-3.02.02.exe. ΠΠΎΡΠ»Π΅ ΡΡΠΏΠ΅ΡΠ½ΠΎΠΉ ΡΡΡΠ°Π½ΠΎΠ²ΠΊΠΈ Π½Π° ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΡΡΠ΅ΠΌ Π΄ΠΈΡΠΊΠ΅ Π±ΡΠ΄Π΅Ρ Π½Π°Ρ
ΠΎΠ΄ΠΈΡΡΡΡ ΠΏΠ°ΠΏΠΊΠ° Tesseract-OCR, ΠΊΠ°ΠΊ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ Π½Π° ΡΠΈΡΡΠ½ΠΊΠ΅.
ΠΡΠΊΡΠΎΠΉΡΠ΅ ΠΊΠΎΠΌΠ°Π½Π΄Π½ΡΡ ΡΡΡΠΎΠΊΡ
ΠΡΠΊΡΠΎΠΉΡΠ΅ ΠΊΠΎΠΌΠ°Π½Π΄Π½ΡΡ ΡΡΡΠΎΠΊΡ, Π²Π²Π΅Π΄ΠΈΡΠ΅ tesseract ΠΈ Π½Π°ΠΆΠΌΠΈΡΠ΅ Enter, ΠΎΠ±ΡΠΈΠΉ Π²ΠΈΠ΄ tesseract ΡΠ»Π΅Π΄ΡΡΡΠΈΠΉ:
Π‘ΠΎΠ·Π΄Π°ΡΡ ΠΎΠ±ΡΠ΅ΠΊΡΠ½ΡΠΉ ΡΠ°ΠΉΠ»
Π‘Π½Π°ΡΠ°Π»Π° ΠΏΠΎΠ΄Π³ΠΎΡΠΎΠ²ΡΡΠ΅ ΡΠ°ΠΉΠ» ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ test.png
ΠΠ΅ΡΠ΅ΠΊΠ»ΡΡΠΈΡΠ΅ ΠΊΠΎΠΌΠ°Π½Π΄Π½ΡΡ ΡΡΡΠΎΠΊΡ Π² ΠΊΠ°ΡΠ°Π»ΠΎΠ³ ΡΠ΅Π»Π΅Π²ΠΎΠ³ΠΎ ΡΠ°ΠΉΠ»Π° ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, ΠΌΡ ΠΊΠΎΠ½Π²Π΅ΡΡΠΈΡΡΠ΅ΠΌ ΡΠ°ΠΉΠ» Π² test.png (ΡΠ°ΠΉΠ» ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΈΠ²Π°Π΅Ρ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΠΎΡΠΌΠ°ΡΠΎΠ²), ΡΠ°ΡΠΏΠΎΠ»ΠΎΠΆΠ΅Π½Π½ΡΠΉ Π² C: \ Users \ Lian \ Desktop \ test, Π° Π·Π°ΡΠ΅ΠΌ Π²Π²Π΅Π΄ΠΈΡΠ΅ Π΅Π³ΠΎ Π² ΠΊΠΎΠΌΠ°Π½Π΄Π½ΠΎΠΉ ΡΡΡΠΎΠΊΠ΅
[Π‘ΠΈΠ½ΡΠ°ΠΊΡΠΈΡ]: Π±Π°Π·Π° Π΄Π°Π½Π½ΡΡ Π²ΡΠ²ΠΎΠ΄Π° tesseract imagename [-l lang] [-psm pagesegmode] [configfileβ¦]
ΠΡΠΊΡΠΎΠΉΡΠ΅ ΡΠ°ΠΉΠ» output_1.txt ΠΈ Π½Π°ΠΉΠ΄ΠΈΡΠ΅, ΡΡΠΎ tesseract ΡΡΠΏΠ΅ΡΠ½ΠΎ ΠΏΡΠ΅ΠΎΠ±ΡΠ°Π·ΠΎΠ²Π°Π» ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΠ΅ Π²152408γ
ΠΡΠΈΡΡΠ½ΠΎ ΠΏΠΎΠΊΠ°Π·Π°ΡΡ, ΡΡΠΎ ΡΡΠ°ΡΡΠΉ Π±ΡΠ΅Π½Π΄ ΡΠ΅ΡΡΠ΅ΡΠ°ΠΊΡ Π²ΡΠ΅ Π΅ΡΠ΅ ΠΎΡΠ΅Π½Ρ ΡΠΈΠ»Π΅Π½! ΠΠΎ ΡΡΠΎ Π²ΡΠ΅ Π΅ΡΠ΅ Π½Π΅Π΄ΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎ ΡΠΎΡΠ½ΠΎ, ΡΠ°ΠΊ Π΅ΡΡΡ Π»ΠΈ ΡΠΏΠΎΡΠΎΠ± ΡΠ»ΡΡΡΠΈΡΡ ΡΠΎΡΠ½ΠΎΡΡΡ ΡΠ°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΡ ΡΠΈΠΌΠ²ΠΎΠ»ΠΎΠ² ΡΠ΅ΡΡΠ΅ΡΠ°ΠΊΡΠΎΠΌ? ΠΠ°Π»Π΅Π΅ ΠΌΡ Π±ΡΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π²ΡΠΏΠΎΠΌΠΎΠ³Π°ΡΠ΅Π»ΡΠ½ΡΠ΅ ΡΡΠ΅Π΄ΡΡΠ²Π° ΠΎΠ±ΡΡΠ΅Π½ΠΈΡjTessBoxEditorΠΡΠΈΡ ΠΎΠ΄ΠΈΡΠ΅ Π½Π° ΡΡΠ΅Π½ΠΈΡΠΎΠ²ΠΎΡΠ½ΡΠ΅ ΠΎΠ±ΡΠ°Π·ΡΡ, ΡΡΠΎΠ±Ρ ΡΠ»ΡΡΡΠΈΡΡ Π½Π°ΡΡ ΡΠΎΡΠ½ΠΎΡΡΡ!
Π’Π΅ΡΡΠ΅ΡΠ°ΠΊΡ ΡΡΠ΅Π½ΠΈΠ½Π³:
ΠΠ±ΡΠΈΠΉ ΠΏΡΠΎΡΠ΅ΡΡ: ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ jTessBoxEditor-> ΠΏΠΎΠ»ΡΡΠΈΡΡ ΠΏΡΠΈΠΌΠ΅Ρ ΡΠ°ΠΉΠ»Π°-> ΠΎΠ±ΡΠ΅Π΄ΠΈΠ½ΠΈΡΡ ΡΠ°ΠΉΠ» ΠΏΡΠΈΠΌΠ΅ΡΠ°-> ΡΠΎΠ·Π΄Π°ΡΡ ΡΠ°ΠΉΠ» BOX-> ΠΎΠΏΡΠ΅Π΄Π΅Π»ΠΈΡΡ ΡΠ°ΠΉΠ» ΠΊΠΎΠ½ΡΠΈΠ³ΡΡΠ°ΡΠΈΠΈ ΡΠΈΠΌΠ²ΠΎΠ»Π°-> ΠΈΡΠΏΡΠ°Π²ΠΈΡΡ ΡΠΈΠΌΠ²ΠΎΠ»—> Π²ΡΠΏΠΎΠ»Π½ΠΈΡΡ ΠΏΠ°ΠΊΠ΅ΡΠ½ΡΠΉ ΡΠ°ΠΉΠ»-> ΠΏΠΎΠΌΠ΅ΡΡΠΈΡΡ ΡΠ³Π΅Π½Π΅ΡΠΈΡΠΎΠ²Π°Π½Π½ΡΠ΅ ΠΎΠ±ΡΡΠ΅Π½Π½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅ Π² tessdata
Π£ΡΡΠ°Π½ΠΎΠ²ΠΈΡΠ΅ jTessBoxEditor
Π‘ΠΊΠ°ΡΠ°ΡΡ jTessBoxEditor, Π°Π΄ΡΠ΅Ρhttps://sourceforge.net/projects/vietocr/files/jTessBoxEditor/; ΠΠΎΡΠ»Π΅ ΡΠ°ΡΠΏΠ°ΠΊΠΎΠ²ΠΊΠΈ ΠΏΠΎΠ»ΡΡΠΈΡΠ΅ jTessBoxEditor, ΠΏΠΎΡΠΎΠΌΡ ΡΡΠΎ ΠΎΠ½ ΡΠ°Π·ΡΠ°Π±ΠΎΡΠ°Π½ Java, ΠΏΠΎΡΡΠΎΠΌΡ ΠΌΡ Π΄ΠΎΠ»ΠΆΠ½Ρ ΡΠ±Π΅Π΄ΠΈΡΡΡΡ, ΡΡΠΎ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΠ»ΠΈ JRE (ΡΡΠ΅Π΄Π° Π²ΡΠΏΠΎΠ»Π½Π΅Π½ΠΈΡ Java, ΡΡΠ΅Π΄Π° Π²ΡΠΏΠΎΠ»Π½Π΅Π½ΠΈΡ Java) ΠΏΠ΅ΡΠ΅Π΄ Π·Π°ΠΏΡΡΠΊΠΎΠΌ jTessBoxEditor.
ΠΠΎΠ»ΡΡΠΈΡΡ ΠΎΠ±ΡΠ°Π·ΡΡ ΡΠ°ΠΉΠ»ΠΎΠ²
ΠΡ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½Ρ ΡΠΈΡΠΎΠ²Π°Π½ΠΈΡ Π΄Π»Ρ ΡΠΈΡΠΎΠ²Π°Π½ΠΈΡ ΠΎΠ±ΡΠ°Π·ΡΠΎΠ² ΡΠ°ΠΉΠ»ΠΎΠ². Π§Π΅ΠΌ Π±ΠΎΠ»ΡΡΠ΅ ΡΠΈΡΠ»ΠΎ, ΡΠ΅ΠΌ Π»ΡΡΡΠ΅. Π― ΡΠ°ΠΌ Π½Π°ΡΠΈΡΠΎΠ²Π°Π» 5 ΠΊΠ°ΡΡΠΈΠ½ΠΎΠΊ, ΠΊΠ°ΠΊ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ Π½Π° ΡΠΈΡΡΠ½ΠΊΠ΅:
[ΠΡΠΈΠΌΠ΅ΡΠ°Π½ΠΈΠ΅]: ΡΠΎΡΠΌΠ°Ρ ΡΠ°ΠΉΠ»Π° ΠΎΠ±ΡΠ°Π·ΡΠ° ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ Π΄ΠΎΠ»ΠΆΠ΅Π½ Π±ΡΡΡ Π² ΡΠΎΡΠΌΠ°ΡΠ΅ tif \ tiff, Π² ΠΏΡΠΎΡΠΈΠ²Π½ΠΎΠΌ ΡΠ»ΡΡΠ°Π΅ Π²ΠΎ Π²ΡΠ΅ΠΌΡ ΠΏΡΠΎΡΠ΅ΡΡΠ° ΡΠ°ΠΉΠ»Π° ΡΠ»ΠΈΡΠ½ΠΈΡ ΠΌΠΎΠΆΠ΅Ρ ΠΏΡΠΎΠΈΠ·ΠΎΠΉΡΠΈ ΠΎΡΠΈΠ±ΠΊΠ° Β«ΠΠ΅ ΡΠ΄Π°Π΅ΡΡΡ Π½Π°ΠΉΡΠΈΒ».
ΠΡΠΈΠΌΠ΅Ρ ΡΠ°ΠΉΠ»Π° ΡΠ»ΠΈΡΠ½ΠΈΡ
ΠΡΠΊΡΠΎΠΉΡΠ΅ jTessBoxEditor, Tools-> Merge TIFF, Π²ΡΠ±Π΅ΡΠΈΡΠ΅ Π²ΡΠ΅ ΡΠ°ΠΉΠ»Ρ ΠΏΡΠΈΠΌΠ΅ΡΠΎΠ² ΠΈ ΡΠΎΡ ΡΠ°Π½ΠΈΡΠ΅ ΠΎΠ±ΡΠ΅Π΄ΠΈΠ½Π΅Π½Π½ΡΠΉ ΡΠ°ΠΉΠ» ΠΊΠ°ΠΊ num.font.exp0.tif.
Π‘ΠΎΠ·Π΄Π°ΡΡ ΡΠ°ΠΉΠ» BOX
ΠΡΠΊΡΠΎΠΉΡΠ΅ ΠΊΠΎΠΌΠ°Π½Π΄Π½ΡΡ ΡΡΡΠΎΠΊΡ ΠΈ ΠΏΠ΅ΡΠ΅ΠΉΠ΄ΠΈΡΠ΅ Π² ΠΊΠ°ΡΠ°Π»ΠΎΠ³, Π³Π΄Π΅ Π½Π°Ρ ΠΎΠ΄ΠΈΡΡΡ num.font.exp0.tif, Π²Π²Π΅Π΄ΠΈΡΠ΅ ΡΠ³Π΅Π½Π΅ΡΠΈΡΠΎΠ²Π°Π½Π½ΡΠΉ ΡΠ°ΠΉΠ» Ρ ΠΈΠΌΠ΅Π½Π΅ΠΌ num.font.exp0.box
ΠΠΏΡΠ΅Π΄Π΅Π»ΠΈΡΡ ΠΏΡΠΎΡΠΈΠ»ΠΈ ΠΏΠ΅ΡΡΠΎΠ½Π°ΠΆΠ΅ΠΉ
Π‘ΠΎΠ·Π΄Π°ΠΉΡΠ΅ ΡΠ΅ΠΊΡΡΠΎΠ²ΡΠΉ ΡΠ°ΠΉΠ» Ρ ΠΈΠΌΠ΅Π½Π΅ΠΌ font_properties Π² ΡΠ΅Π»Π΅Π²ΠΎΠΉ ΠΏΠ°ΠΏΠΊΠ΅ Ρ ΡΠΎΠ΄Π΅ΡΠΆΠΈΠΌΡΠΌ
[Π‘ΠΈΠ½ΡΠ°ΠΊΡΠΈΡ]:
ΠΠΎΡΡΠ΅ΠΊΡΠΈΡ ΠΏΠ΅ΡΡΠΎΠ½Π°ΠΆΠ°
ΠΌΠ½ΠΎΠ³ΠΎ ΡΡΡΠ°Π½ΠΈΡ!
ΠΠ΅ Π·Π°Π±ΡΠ΄ΡΡΠ΅ ΡΠΎΡ ΡΠ°Π½ΠΈΡΡ ΠΏΠΎΡΠ»Π΅ ΠΌΠΎΠ΄ΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ.
ΠΡΠΏΠΎΠ»Π½ΠΈΡΡ ΠΏΠ°ΠΊΠ΅ΡΠ½ΡΠΉ ΡΠ°ΠΉΠ»
Π‘ΠΎΠ·Π΄Π°ΡΡ ΠΏΠ°ΠΊΠ΅ΡΠ½ΡΠΉ ΡΠ°ΠΉΠ» Π² ΡΠ΅Π»Π΅Π²ΠΎΠΌ ΠΊΠ°ΡΠ°Π»ΠΎΠ³Π΅
ΠΡΠΎ ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ Π²ΡΠΏΠΎΠ»Π½Π΅Π½ΠΎ ΠΏΠΎΡΠ»Π΅ ΡΠΎΡ
ΡΠ°Π½Π΅Π½ΠΈΡ, ΠΈ ΡΠ΅Π·ΡΠ»ΡΡΠ°Ρ Π²ΡΠΏΠΎΠ»Π½Π΅Π½ΠΈΡ ΠΏΠΎΠΊΠ°Π·Π°Π½ Π½Π° ΡΠΈΡΡΠ½ΠΊΠ΅:
Π ΠΏΠΎΡΠ»Π΅Π΄Π½Π΅ΠΉ ΠΏΠ°ΠΏΠΊΠ΅ Π±ΡΠ΄ΡΡ Π½Π°Ρ
ΠΎΠ΄ΠΈΡΡΡΡ ΡΠ»Π΅Π΄ΡΡΡΠΈΠ΅ ΡΠ°ΠΉΠ»Ρ, ΠΊΠ°ΠΊ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ Π½Π° ΡΠΈΡΡΠ½ΠΊΠ΅:
ΠΠΎΠΌΠ΅ΡΡΠΈΡΠ΅ ΡΠ³Π΅Π½Π΅ΡΠΈΡΠΎΠ²Π°Π½Π½ΡΠ΅ ΠΎΠ±ΡΡΠ΅Π½Π½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅ Π² tessdata
ΠΠ°ΠΊΠΎΠ½Π΅Ρ, ΡΠΊΠΎΠΏΠΈΡΡΠΉΡΠ΅ num.trainddata Π² ΠΏΠ°ΠΏΠΊΡ tessdata Π² Tesseract-OCR.
Π€ΠΈΠ½Π°Π»ΡΠ½ΡΠΉ ΡΠ΅ΡΡ
ΠΡΠΏΠΎΠ»Π½ΠΈΡΠ΅ ΠΏΡΠ΅Π΄ΡΠ΄ΡΡΠΈΠ΅ ΡΠ°Π³ΠΈ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠΉΡΠ΅ ΠΊΠΎΠΌΠ°Π½Π΄Π½ΡΡ ΡΡΡΠΎΠΊΡ Π΄Π»Ρ Π²Π²ΠΎΠ΄Π°
ΠΡΠΈΠ±ΠΊΠ°, ΠΏΡΠΈ ΡΡΡΠ°Π½ΠΎΠ²ΠΊΠ΅ ΠΌΠΎΠ΄ΡΠ»Ρ tesseract-ocr, ΠΊΠ°ΠΊ ΡΠ΅ΡΠΈΡΡ?
ΠΠ΄ΡΠ°Π²ΡΡΠ²ΡΠΉΡΠ΅!
Π‘ΡΠΎΠ»ΠΊΠ½ΡΠ»ΡΡ Ρ ΠΏΡΠΎΠ±Π»Π΅ΠΌΠΎΠΉ, ΠΏΡΡΠ°ΡΡΡ ΡΡΡΠ°Π½ΠΎΠ²ΠΈΡΡ ΡΠ΅ΡΠ΅Π· ΠΊΠΎΠΌΠ°Π½Π΄Π½ΡΡ ΡΡΡΠΎΠΊΡ ΠΌΠΎΠ΄ΡΠ»Ρ tesseract-ocr. ΠΠΎΡΠ²Π»ΡΠ΅ΡΡΡ ΠΎΡΠΈΠ±ΠΊΠ° ΡΠ»Π΅Π΄ΡΡΡΠ΅Π³ΠΎ Ρ
Π°ΡΠ°ΠΊΡΠ΅ΡΠ°:
ΠΡΠΈΠ»ΠΎΠΆΡ ΡΠΊΡΠΈΠ½ ΠΈΠ· Visual Studio Installer, ΡΠ°ΠΊ ΠΏΠΎΡΠ΅ΠΌΡ-ΡΠΎ Π½Π΅Ρ Π³ΡΠ°ΡΡ Python, ΡΠ°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΡΠΌΠΎΡΡΠ΅ΡΡ Π²ΡΠ΅ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½ΡΡ ΡΡΡΠ°Π½ΠΎΠ²Π»Π΅Π½Π½ΡΠ΅, Π΅ΡΠ»ΠΈ ΡΡΠΎ ΠΊΠ°ΠΊ-ΡΠΎ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ Π΄Π΅Π»Ρ:
ΠΡΡΡΡΠ°ΠΉΡΠ΅, Π²ΡΠΎΡΠΎΠΉ Π΄Π΅Π½Ρ Π»ΠΎΠΌΠ°Ρ Π³ΠΎΠ»ΠΎΠ²Ρ, ΡΡΠΎ Π΅ΠΌΡ ΠΎΡ ΠΌΠ΅Π½Ρ Π½Π°Π΄ΠΎ,
ΠΠ°ΡΠ°Π½Π΅Π΅ Π±Π»Π°Π³ΠΎΠ΄Π°ΡΡ Π²ΡΠ΅Ρ
ΠΎΡΠΊΠ»ΠΈΠΊΠ½ΡΠ²ΡΠΈΡ
ΡΡ!
ΠΠ΄ΡΠ°Π²ΡΡΠ²ΡΠΉΡΠ΅!
ΠΠΎΠΏΡΠΎΠ±ΡΠΉΡΠ΅ Π΄ΡΡΠ³ΠΎΠΉ ΠΌΠ΅ΡΠΎΠ΄ Π΄Π»Ρ ΡΡΡΠ°Π½ΠΎΠ²ΠΊΠΈ ΡΠ΅ΡΠ΅Π· Anaconda
Π ΡΠΎΠΆΠ°Π»Π΅Π½ΠΈΡ Π½Π΅ ΠΏΠΎΠ»ΡΡΠΈΠ»ΠΎΡΡ, Π΅ΡΡΡ Ρ Π²Π°Ρ Π΅ΡΠ΅ Π²Π°ΡΠΈΠ°Π½ΡΡ, ΠΊΠ°ΠΊ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΡΠ°Π²ΠΈΡΡ? π
Π΄Π²Π°: pip install pytesseract pillow
Π£ΡΡΠ°Π½ΠΎΠ²ΠΈΠ» ΡΠ°ΠΉΠ», Π²ΡΠΏΠΎΠ»Π½ΠΈΠ» pip install pytesseract pillow Π² ΠΊΠΎΠΌΠ°Π½Π΄Π½ΠΎΠΉ ΡΡΡΠΎΠΊΠ΅, Π½ΠΎ ΠΏΡΠΎΠ±Π»Π΅ΠΌΠ° ΡΠ°ΠΊ ΠΈ Π½Π΅ ΠΈΡΡΠ΅Π·Π»Π°.
ΠΠ΅ ΡΠΎΠ²ΡΠ΅ΠΌ ΠΏΠΎΠ½ΡΠ», ΡΡΠΎ Π² ΠΊΠΎΠ΄ ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΡ Π΄ΠΎΠΏΠΈΡΡΠ²Π°ΡΡ?
from PIL import Image
import pytesseract
ΠΠΎΠΏΡΠΎΠ±ΠΎΠ²Π°Π» Π΄ΠΎΠΏΠΈΡΠ°ΡΡ Π² ΠΊΠΎΠ΄, ΡΠ° ΠΆΠ΅ ΠΈΡΡΠΎΡΠΈΡ. ΠΠΎΠΆΠ΅Ρ Π»ΠΈ ΡΡΠΎ Π±ΡΡΡ ΠΈΠ·-Π·Π° Π±ΠΎΠ»ΡΡΠΎΠ³ΠΎ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Π° Π½Π΅ΡΡΡΡΠΊΡΡΡΠΈΡΠΎΠ²Π°Π½Π½ΡΡ
ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½ΡΠΎΠ² Π‘++?
ΠΠΎΡ ΡΠΊΡΠΈΠ½ΡΠΎΡ ΠΈΠ· ΠΏΠ°Π½Π΅Π»ΠΈ ΡΠΏΡΠ°Π²Π»Π΅Π½ΠΈΡ, Π½ΠΎΡΠΌΠ°Π»ΡΠ½ΠΎ Π»ΠΈ ΡΡΠΎ? ΠΠ»ΠΈ ΠΆΠ΅ Π΄Π΅Π»ΠΎ Π½Π΅ Π² ΡΡΠΎΠΌ?
ΠΠ°ΡΠ°Π½Π΅Π΅ ΠΏΡΠΎΡΡ ΠΏΡΠΎΡΠ΅Π½ΠΈΡ, Π·Π° ΡΡΠΎΠ»Ρ Π½Π΅Π΄Π°Π»Π΅ΠΊΠΈΠ΅ Π²ΠΎΠΏΡΠΎΡΡ, ΠΏΠΎΠΊΠ° Ρ Π΅ΡΠ΅ Π·Π΅Π»Π΅Π½ΡΠΉ Π² ΡΡΠΎΠΌ Π΄Π΅Π»Π΅ π