Skip to content
조회 수 91364 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬에서 인식이 잘되는 OCR 종류


 

파이썬에서 텍스트 인식을 위한 다양한 OCR(광학 문자 인식) 라이브러리와 도구가 있습니다. 다음은 몇 가지 인기 있는 OCR 라이브러리와 도구를 추천해 드립니다:

  1. Tesseract OCR (pytesseract): Tesseract는 Google에서 개발한 강력한 오픈 소스 OCR 엔진입니다. 파이썬에서 Tesseract를 사용하려면 pytesseract 라이브러리를 사용할 수 있습니다. 이미지에서 텍스트를 추출하는 데 사용됩니다.

     
    python
    from PIL import Image
    import pytesseract
    # 이미지에서 텍스트 추출
    text = pytesseract.image_to_string(Image.open('image.png'))
  2. EasyOCR: EasyOCR은 다국어 지원을 제공하는 OCR 라이브러리로, 사용하기 쉬우며 높은 정확도를 제공합니다. 이미지에서 텍스트를 추출하는 데 사용할 수 있습니다.

     
    python
    import easyocr
    reader = easyocr.Reader(['en'])
    results = reader.readtext('image.jpg')
    1. OCR.space API: OCR.space는 온라인 OCR 서비스를 제공하며 파이썬에서 이를 사용할 수 있습니다. API 키를 발급받고 이미지를 업로드하여 텍스트를 추출할 수 있습니다.

       
      python
      import requests
      api_key = 'YOUR_API_KEY'
      image_path = 'image.png'

      response = requests.post(
            'https://api.ocr.space/parse/image',
            headers={'apikey': api_key},
            files={'image': (image_path, open(image_path, 'rb'))}
      )

      result = response.json()
      extracted_text = result['ParsedResults'][0]['ParsedText']
  3. Amazon Textract: Amazon Textract는 Amazon Web Services (AWS)의 서비스로, 클라우드 기반의 강력한 OCR 기능을 제공합니다. AWS SDK를 사용하여 파이썬에서 Textract를 호출할 수 있습니다.

     
    python
    import boto3

    client = boto3.client('textract')
    response = client.detect_document_text(Document={
          'S3Object': {'Bucket': 'your-bucket', 'Name': 'your-image.jpg'}}
    )

    # 추출된 텍스트에 접근
    for item in response['Blocks']:
          if item['BlockType'] == 'LINE':
                print(item['Text'])
    ​​​​​​​

이 OCR 도구 중에서 선택할 수 있는 것은 여러 가지이며, 문제의 텍스트와 이미지 품질, 사용 사례에 따라 가장 적합한 도구를 선택할 수 있습니다. OCR의 정확도는 이미지 품질, 언어, 글꼴 등에 영향을 받으므로 다양한 도구와 설정을 실험하여 가장 적합한 것을 찾아보세요.

로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
131 주식 관심종목) 백광산업 1 1 2012.10.31 5767
130 주식 2012년 기준 3월 결산 배당주 2013.03.20 5764
129 주식 시골의사 박경철의 다시쓰는 기술적 분석 2014.04.01 5751
128 주식 도드람B&F - 돼지고기 가격 폭등에 따른 상승? 2009.07.15 5749
127 주식 문배철강 일진다이아 한국내화 동우 실적발표 file 2017.05.15 5328
126 주식 경기회복관련 종목 중 저평가 전년대비 고성장주 ㄱ ~ ㅅ 2009.09.01 5126
125 주식 테마주 file 2017.04.13 5108
124 주식 인터엠은 철도주, 자산주가 더 매력적이다. 1 2010.11.26 5030
123 주식 총선 대선 테마주 - 김무성/안철수/문재인/박원순/반기문 2016.01.03 4958
122 주식 일진다이아 매도시점 file 2017.07.18 4957
121 주식 한국주철관 배당금 수령일 등 1 file 2017.07.05 4897
120 주식 한국주철관 2016년 놀라운 실적발표에 2017년도 기대만발 file 2017.06.02 4698
119 주식 한국주철관 2017.10.13 4542
118 주식 여기서 2배 못먹으면 주식 그만둬라 = 홀딩해서 무증받으면 2배간다 2010.04.08 4363
117 주식 향후 눈여겨 봐야 할 10종목 1 2010.05.04 4302
116 주식 3월 한미 키리졸브 훈련관련 전쟁테마주 file 2016.01.03 4279
115 주식 동국알앤에스 1 file 2016.09.28 4261
114 주식 선광 추가 매수시점 file 2017.10.26 4187
113 주식 9년만에 재입성하는 문배철강 2014.03.11 4132
112 주식 부채율 1000% 한진해운 결국 최은영 회장 일가 주식처분 1 file 2016.04.25 4047
Board Pagination Prev 1 ... 3 4 5 6 7 ... 11 Next
/ 11

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소