Skip to content
파이썬
2022.11.26 10:31

Windows용 Tesseract 설치 및 사용법

조회 수 19535 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

Windows용 Tesseract 설치 및 사용법

 

Windows에 Tesseract 설치

 Windows용 Tesseract 설치 프로그램을 사이트로 이동하여 다운로드합니다.

 

 

설치방법은 https://yunwoong.tistory.com/51 자세히 나온다.

 

 

 

Matplotlib과 그 종속 항목 (Dependencies)은 Windows, macOS, Linux에 대해 wheel 패키지의 형태로 배포됩니다.

아래의 명령어로 공식 배포판을 설치하세요.

python -m pip install -U pip
python -m pip install -U matplotlib

 

 

Tesseract가 설치되어 있지 않다면, 이전 글을 참고하시여 설치를 진행해 주시기 바랍니다.

 
 
import pytesseract
 
import cv2
 
import matplotlib.pyplot as plt

테스트 하려는 이미지는 한글, 영어, 숫자가 혼합된 이미지 입니다.

 
 
path = 'asset/images/ocr_test.jpg'
 
image = cv2.imread(path)
 
rgb_image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

 

1.png

 

 

 

 

 
 
# use Tesseract to OCR the image
 
text = pytesseract.image_to_string(rgb_image, lang='kor+eng')
 
print(text)

결과>>

2.png

 

BLOG 우린친구닷컴에서 우린친구닷컴은 번역이 제대로 안되네요. THHI TEI 학습정보가 부족한가요????

 

그리고, 그 위에 

'Matplotlib is building the font cache; this may take a moment.'

 

해당 문구는 

원래 시간이 걸린다는 내용을 링크사이트에서 인지 할 수 있었습니다.

 

 

사진의 품질이 떨어지거나 인식하지 못하는 형태의 이미지들도 많이 있는것 같아욧.

 

처음설치시 테써렉트 kor.traineddata 파일이 1.4MB입니다.

 

링크사이트로 가면 좀 더 학습이 많이 된 파일(15MB)을 다운로드 받으실 수 있습니다.

 

kor.traineddata을 교체하고 나니

 

3.png

 

조금 더 나은 결과를 얻었습니다.

하지만 아직도 이상하네요.

 

 

완벽한 결과는 얻을 수 없지만, 

 

입력된 이미지를 이미지 전처리 과정을 통해 Scan한 이미지로 변경하여 OCR을 수행하는 방법이 있습니다.

 

사진이나 이미지의 원본이 불량한 상태라면 마치 포토샵 작업을 해서 컴퓨터가 문자로 인식하기 편하게 만드는 작업이죠.

 

 

 

pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information. 오류를 해결하는 방법은?

 

해당 오류는 Tesseract OCR 엔진이 설치되어 있지 않아 발생하는 오류입니다. Tesseract OCR은 이미지에서 텍스트를 추출하는 데 사용되는 오픈 소스 엔진입니다. 이를 설치하고 환경 변수에 추가해야 합니다.

Windows 환경에서 Tesseract OCR을 설치하는 방법은 다음과 같습니다.

  1. Tesseract OCR을 다운로드합니다. 공식 다운로드 페이지에서 다운로드할 수 있습니다. 링크: https://github.com/UB-Mannheim/tesseract/wiki

  2. 설치된 Tesseract OCR의 경로를 찾아 환경 변수에 추가합니다. 다음 단계를 수행합니다.

    • 제어판 > 시스템 > 고급 시스템 설정 > 환경 변수
    • 시스템 변수에서 "Path"를 찾아 클릭한 뒤, "편집" 버튼을 클릭합니다.
    • "새로 만들기" 버튼을 클릭하고 Tesseract OCR 설치 폴더의 경로를 입력합니다. 예를 들어, "C:\Program Files\Tesseract-OCR" 입니다.
    • 변경된 환경 변수를 저장하고 터미널을 새로 열어서 다시 시도해 봅니다.

만약 위의 방법으로 해결되지 않을 경우, pytesseract 모듈을 설치하는 동시에 Tesseract OCR 엔진도 같이 설치됩니다. 이때 설치 경로를 잘 기억하고, 환경 변수에 경로를 추가해주면 오류가 발생하지 않습니다.

 

 

 

 

 

 

로그인 후 댓글쓰기가 가능합니다.

?

  1. 06
    Sep 2021
    14:19

    파이썬 매수할 피라미드 매수전략

    Category파이썬 Views1854
    Read More
  2. 06
    Sep 2021
    13:34

    키움증권 OpenAPI 당황스러움

    Category파이썬 Views1769
    Read More
  3. 05
    Sep 2021
    19:53

    파이썬 키움증권 OPEN API 매수/매도/정정/취소 주문방법

    Category파이썬 Views4068
    Read More
  4. 05
    Sep 2021
    09:06

    파이썬 변수전달하기

    Category파이썬 Views1446
    Read More
  5. 04
    Sep 2021
    00:39

    파이썬 키움증권 open api 분할매매 수식구하기

    Category컴퓨터잡담 Views1346
    Read More
  6. 03
    Sep 2021
    08:37

    파이썬(python) 자주 사용하는 명령 모으기

    Category컴퓨터잡담 Views884
    Read More
  7. 02
    Sep 2021
    23:14

    [python] 윈도우 파이썬 모듈 설치 방법 (특정프로그램 설치 없이 기본프로그램 활용)

    Category컴퓨터잡담 Views1592
    Read More
  8. 02
    Sep 2021
    17:42

    아나콘다에서 모듈을 설치할 때에는?

    Category컴퓨터잡담 Views941
    Read More
  9. 02
    Sep 2021
    16:09

    파이썬 키움증권 open api 스크랩

    Category컴퓨터잡담 Views970
    Read More
  10. 31
    Aug 2021
    18:18

    python 문자열에서 모든 공백을 제거

    Category컴퓨터잡담 Views913
    Read More
  11. 31
    Aug 2021
    08:09

    Python Requests post() Method

    Category컴퓨터잡담 Views1343
    Read More
  12. 27
    Aug 2021
    17:16

    파이썬 JSON으로 받아온 데이터의 Key 값 가져오기

    Category컴퓨터잡담 Views10892
    Read More
  13. 24
    Aug 2021
    16:43

    파이썬으로 키움증권 open api 사용해보기

    Category컴퓨터잡담 Views1491
    Read More
  14. 22
    Aug 2021
    11:39

    파이썬 다음 증권의 주가 가져오기

    Category컴퓨터잡담 Views1453
    Read More
  15. 22
    Aug 2021
    10:19

    파이썬 네이버라인 메시지 보내기

    Category컴퓨터잡담 Views1482
    Read More
  16. 15
    Aug 2021
    17:42

    파이썬 파일로 읽어올 때 \n이 \\n으로 변경되는 현상 대처방법

    Category컴퓨터잡담 Views1342
    Read More
  17. 12
    Aug 2021
    19:39

    python pip 에러 line 193, line 197 해결방법

    Category컴퓨터잡담 Views4099
    Read More
  18. 08
    Aug 2021
    10:53

    카카오 인증관련 오류

    Category컴퓨터잡담 Views8004
    Read More
  19. 04
    Aug 2021
    08:56

    CCS 메뉴 스타일 링크

    CategoryHTMLPHPMSQL Views3891
    Read More
  20. 31
    Jul 2021
    12:53

    파이썬 FTP 업로드/다운로드 하기

    Category컴퓨터잡담 Views3400
    Read More
Board Pagination Prev 1 ... 3 4 5 6 7 ... 46 Next
/ 46

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소