Skip to content
조회 수 76274 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬에서 인식이 잘되는 OCR 종류


 

파이썬에서 텍스트 인식을 위한 다양한 OCR(광학 문자 인식) 라이브러리와 도구가 있습니다. 다음은 몇 가지 인기 있는 OCR 라이브러리와 도구를 추천해 드립니다:

  1. Tesseract OCR (pytesseract): Tesseract는 Google에서 개발한 강력한 오픈 소스 OCR 엔진입니다. 파이썬에서 Tesseract를 사용하려면 pytesseract 라이브러리를 사용할 수 있습니다. 이미지에서 텍스트를 추출하는 데 사용됩니다.

     
    python
    from PIL import Image
    import pytesseract
    # 이미지에서 텍스트 추출
    text = pytesseract.image_to_string(Image.open('image.png'))
  2. EasyOCR: EasyOCR은 다국어 지원을 제공하는 OCR 라이브러리로, 사용하기 쉬우며 높은 정확도를 제공합니다. 이미지에서 텍스트를 추출하는 데 사용할 수 있습니다.

     
    python
    import easyocr
    reader = easyocr.Reader(['en'])
    results = reader.readtext('image.jpg')
    1. OCR.space API: OCR.space는 온라인 OCR 서비스를 제공하며 파이썬에서 이를 사용할 수 있습니다. API 키를 발급받고 이미지를 업로드하여 텍스트를 추출할 수 있습니다.

       
      python
      import requests
      api_key = 'YOUR_API_KEY'
      image_path = 'image.png'

      response = requests.post(
            'https://api.ocr.space/parse/image',
            headers={'apikey': api_key},
            files={'image': (image_path, open(image_path, 'rb'))}
      )

      result = response.json()
      extracted_text = result['ParsedResults'][0]['ParsedText']
  3. Amazon Textract: Amazon Textract는 Amazon Web Services (AWS)의 서비스로, 클라우드 기반의 강력한 OCR 기능을 제공합니다. AWS SDK를 사용하여 파이썬에서 Textract를 호출할 수 있습니다.

     
    python
    import boto3

    client = boto3.client('textract')
    response = client.detect_document_text(Document={
          'S3Object': {'Bucket': 'your-bucket', 'Name': 'your-image.jpg'}}
    )

    # 추출된 텍스트에 접근
    for item in response['Blocks']:
          if item['BlockType'] == 'LINE':
                print(item['Text'])
    ​​​​​​​

이 OCR 도구 중에서 선택할 수 있는 것은 여러 가지이며, 문제의 텍스트와 이미지 품질, 사용 사례에 따라 가장 적합한 도구를 선택할 수 있습니다. OCR의 정확도는 이미지 품질, 언어, 글꼴 등에 영향을 받으므로 다양한 도구와 설정을 실험하여 가장 적합한 것을 찾아보세요.

로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
15 블로거질 [네이버 웹마스터 도구]에서  최적화 검증에 홈페이지 다운로드 속도 확인하기 file 2016.12.11 4127
14 블로거질 다음블로그 RSS 검색등록 방법 file 2016.08.24 5454
13 블로거질 HTTP 헤더 확인 - HTTP Viewer 2016.08.19 4310
12 블로거질 구글/네이버/다음 뉴스 검색 제휴 등록절차 2016.04.21 4867
11 블로거질 PageSpeed Insights 사용해보기 file 2016.03.23 4007
10 블로거질 웹페이지 속도측정 사이트 file 2016.03.08 4896
9 블로거질 XE에서 RSS 피드 오류발생시 해결방법 2016.03.08 4072
8 블로거질 html 주소 특수문자 쉽게 변환 해 볼수 있는 사이트 file 2016.02.14 4867
7 블로거질 검색노출에 필요한 사이트 2016.02.14 3932
6 블로거질 애드센스 국민은행 외화보통예금통장으로 입금하기 2015.12.01 5033
5 블로거질 애드센스 국민은행 외화보통예금통장으로 입금하기 file 2015.08.25 6417
4 블로거질 CPC 클릭광고로 제대로 수익내기 1 2013.02.28 19628
3 블로거질 웨스턴 유니온 지급 보류 해제 방법 3 1 2010.11.10 28295
2 블로거질 블로그 광고수익의 종류(애드센스, 애드클릭스, 애드포스트 등) 1 2009.06.30 46280
1 블로거질 설치형블로그 사용중 믹시에 등록이 되지 않을경우 해결방법 file 2009.06.29 55617
Board Pagination Prev 1 Next
/ 1

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소