Skip to content
조회 수 77615 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬에서 인식이 잘되는 OCR 종류


 

파이썬에서 텍스트 인식을 위한 다양한 OCR(광학 문자 인식) 라이브러리와 도구가 있습니다. 다음은 몇 가지 인기 있는 OCR 라이브러리와 도구를 추천해 드립니다:

  1. Tesseract OCR (pytesseract): Tesseract는 Google에서 개발한 강력한 오픈 소스 OCR 엔진입니다. 파이썬에서 Tesseract를 사용하려면 pytesseract 라이브러리를 사용할 수 있습니다. 이미지에서 텍스트를 추출하는 데 사용됩니다.

     
    python
    from PIL import Image
    import pytesseract
    # 이미지에서 텍스트 추출
    text = pytesseract.image_to_string(Image.open('image.png'))
  2. EasyOCR: EasyOCR은 다국어 지원을 제공하는 OCR 라이브러리로, 사용하기 쉬우며 높은 정확도를 제공합니다. 이미지에서 텍스트를 추출하는 데 사용할 수 있습니다.

     
    python
    import easyocr
    reader = easyocr.Reader(['en'])
    results = reader.readtext('image.jpg')
    1. OCR.space API: OCR.space는 온라인 OCR 서비스를 제공하며 파이썬에서 이를 사용할 수 있습니다. API 키를 발급받고 이미지를 업로드하여 텍스트를 추출할 수 있습니다.

       
      python
      import requests
      api_key = 'YOUR_API_KEY'
      image_path = 'image.png'

      response = requests.post(
            'https://api.ocr.space/parse/image',
            headers={'apikey': api_key},
            files={'image': (image_path, open(image_path, 'rb'))}
      )

      result = response.json()
      extracted_text = result['ParsedResults'][0]['ParsedText']
  3. Amazon Textract: Amazon Textract는 Amazon Web Services (AWS)의 서비스로, 클라우드 기반의 강력한 OCR 기능을 제공합니다. AWS SDK를 사용하여 파이썬에서 Textract를 호출할 수 있습니다.

     
    python
    import boto3

    client = boto3.client('textract')
    response = client.detect_document_text(Document={
          'S3Object': {'Bucket': 'your-bucket', 'Name': 'your-image.jpg'}}
    )

    # 추출된 텍스트에 접근
    for item in response['Blocks']:
          if item['BlockType'] == 'LINE':
                print(item['Text'])
    ​​​​​​​

이 OCR 도구 중에서 선택할 수 있는 것은 여러 가지이며, 문제의 텍스트와 이미지 품질, 사용 사례에 따라 가장 적합한 도구를 선택할 수 있습니다. OCR의 정확도는 이미지 품질, 언어, 글꼴 등에 영향을 받으므로 다양한 도구와 설정을 실험하여 가장 적합한 것을 찾아보세요.

로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
131 주식 수렴끝 확산시작 차트흐름 읽기 2 2009.07.06 11796
130 주식 솔고바이오의 상황진단 및 대응전략 3 file 2009.07.30 9382
129 주식 손명완 세광 대표(국영지앤엠) 2015.08.09 2161
128 주식 세계 5번째 준비통화는 위안화, SDR편입에 한국은? 2015.12.01 704
127 주식 설명만 장황한 가치투자 2 1 2010.12.22 7054
126 주식 선광 추가 매수시점 file 2017.10.26 4182
125 주식 선광 매수시점 2017.07.20 6513
124 주식 서킷브레이커 CB(circuit breakers) 발동 및 해제조건 1 2016.02.12 930
123 주식 상해A주식 상해자동차 기업정보 file 2015.12.17 1746
122 주식 삼성,마이크로소프트,알파벳과 한국의 일부 재벌들은 막대한 현금을 보유 secret 2020.08.09 478
121 주식 북한 수소폭탄과 장거리 미사일 실험에 주가는? 2016.01.27 852
120 주식 부채율 1000% 한진해운 결국 최은영 회장 일가 주식처분 1 file 2016.04.25 4047
119 주식 보유종목 점검 및 시장상황 체크 file 2016.11.24 1133
118 주식 보유종목 점검 file 2015.05.18 887
117 주식 보유종목 배당입금일 2014.04.10 3394
116 주식 버블과 붕괴 1 2010.12.22 13963
115 주식 바이오주의 들썩임은 황의 무제를 암시하는 것일까? 2009.08.10 7153
114 주식 문배철강에 대한 기대 file 2014.10.14 2129
113 주식 문배철강 일진다이아 한국내화 동우 실적발표 file 2017.05.15 5307
112 주식 문배철강 무기명식 이권부 무보증 사모 교환사채 발행 목적 2017.07.27 6042
Board Pagination Prev 1 ... 3 4 5 6 7 ... 11 Next
/ 11

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소