Skip to content
조회 수 79248 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬에서 인식이 잘되는 OCR 종류


 

파이썬에서 텍스트 인식을 위한 다양한 OCR(광학 문자 인식) 라이브러리와 도구가 있습니다. 다음은 몇 가지 인기 있는 OCR 라이브러리와 도구를 추천해 드립니다:

  1. Tesseract OCR (pytesseract): Tesseract는 Google에서 개발한 강력한 오픈 소스 OCR 엔진입니다. 파이썬에서 Tesseract를 사용하려면 pytesseract 라이브러리를 사용할 수 있습니다. 이미지에서 텍스트를 추출하는 데 사용됩니다.

     
    python
    from PIL import Image
    import pytesseract
    # 이미지에서 텍스트 추출
    text = pytesseract.image_to_string(Image.open('image.png'))
  2. EasyOCR: EasyOCR은 다국어 지원을 제공하는 OCR 라이브러리로, 사용하기 쉬우며 높은 정확도를 제공합니다. 이미지에서 텍스트를 추출하는 데 사용할 수 있습니다.

     
    python
    import easyocr
    reader = easyocr.Reader(['en'])
    results = reader.readtext('image.jpg')
    1. OCR.space API: OCR.space는 온라인 OCR 서비스를 제공하며 파이썬에서 이를 사용할 수 있습니다. API 키를 발급받고 이미지를 업로드하여 텍스트를 추출할 수 있습니다.

       
      python
      import requests
      api_key = 'YOUR_API_KEY'
      image_path = 'image.png'

      response = requests.post(
            'https://api.ocr.space/parse/image',
            headers={'apikey': api_key},
            files={'image': (image_path, open(image_path, 'rb'))}
      )

      result = response.json()
      extracted_text = result['ParsedResults'][0]['ParsedText']
  3. Amazon Textract: Amazon Textract는 Amazon Web Services (AWS)의 서비스로, 클라우드 기반의 강력한 OCR 기능을 제공합니다. AWS SDK를 사용하여 파이썬에서 Textract를 호출할 수 있습니다.

     
    python
    import boto3

    client = boto3.client('textract')
    response = client.detect_document_text(Document={
          'S3Object': {'Bucket': 'your-bucket', 'Name': 'your-image.jpg'}}
    )

    # 추출된 텍스트에 접근
    for item in response['Blocks']:
          if item['BlockType'] == 'LINE':
                print(item['Text'])
    ​​​​​​​

이 OCR 도구 중에서 선택할 수 있는 것은 여러 가지이며, 문제의 텍스트와 이미지 품질, 사용 사례에 따라 가장 적합한 도구를 선택할 수 있습니다. OCR의 정확도는 이미지 품질, 언어, 글꼴 등에 영향을 받으므로 다양한 도구와 설정을 실험하여 가장 적합한 것을 찾아보세요.

로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
92 Server php) 엑셀로 저장하기 2013.05.24 22064
91 Server Google Chart API 이용하기 11 file 2013.04.10 20893
90 Server PHP) Web Proxy Server 만들기 소스 1 file 2013.03.04 15138
89 Server PHP Proxy 가져오기 2 2013.04.20 14181
88 Server 아파치 성능테스트 프로그램 1 file 2013.04.03 14034
87 Server Apache & Mysql 셋팅방법(httpd-mpm.conf / my.ini) 2013.05.13 13707
86 Server mysql 실행이 안되거나 테이블(사용중) 손상이 잃어난 경우 2 2012.07.14 13083
85 Server php) curl_setopt의 옵션 1 10 2013.04.02 12938
84 Server 아파치 ab 로 성능테스트 하기 2016.02.22 12357
83 Server Proxy and hide ip address problem 1 1 2013.04.03 11999
82 Server asp,jsp,php 아이피(ip) 가져오기/확인 file 2013.01.05 11867
81 Server V2824 User Manual 1 file 2016.12.06 11730
80 Server Windows 서버에서 XE 속도 대폭 개선 방법 3 2013.03.02 11612
79 Server php) 이미지 사이즈 구해서 0이면 게시물 내용 없애기 2013.07.05 11285
78 Server TIME_WAIT를 남기지 않는 세션종료 (Graceful Shutdown) 3 2013.03.02 11173
77 Server make ping with PHP(핑테스트) 11 2013.04.01 11144
76 Server 서버 다운시 알람 기능 사용방법(http ping port) file 2017.05.04 10364
75 Server html) 프레임 나누기 4 2013.03.02 10198
74 Server PHP) Example #1 HTML 엔티티 디코딩 13 2013.04.02 10179
73 Server APACHE PHP 에러 잡기 1 2016.03.23 9962
Board Pagination Prev 1 2 3 4 5 Next
/ 5

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소