Skip to content
조회 수 84651 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬에서 인식이 잘되는 OCR 종류


 

파이썬에서 텍스트 인식을 위한 다양한 OCR(광학 문자 인식) 라이브러리와 도구가 있습니다. 다음은 몇 가지 인기 있는 OCR 라이브러리와 도구를 추천해 드립니다:

  1. Tesseract OCR (pytesseract): Tesseract는 Google에서 개발한 강력한 오픈 소스 OCR 엔진입니다. 파이썬에서 Tesseract를 사용하려면 pytesseract 라이브러리를 사용할 수 있습니다. 이미지에서 텍스트를 추출하는 데 사용됩니다.

     
    python
    from PIL import Image
    import pytesseract
    # 이미지에서 텍스트 추출
    text = pytesseract.image_to_string(Image.open('image.png'))
  2. EasyOCR: EasyOCR은 다국어 지원을 제공하는 OCR 라이브러리로, 사용하기 쉬우며 높은 정확도를 제공합니다. 이미지에서 텍스트를 추출하는 데 사용할 수 있습니다.

     
    python
    import easyocr
    reader = easyocr.Reader(['en'])
    results = reader.readtext('image.jpg')
    1. OCR.space API: OCR.space는 온라인 OCR 서비스를 제공하며 파이썬에서 이를 사용할 수 있습니다. API 키를 발급받고 이미지를 업로드하여 텍스트를 추출할 수 있습니다.

       
      python
      import requests
      api_key = 'YOUR_API_KEY'
      image_path = 'image.png'

      response = requests.post(
            'https://api.ocr.space/parse/image',
            headers={'apikey': api_key},
            files={'image': (image_path, open(image_path, 'rb'))}
      )

      result = response.json()
      extracted_text = result['ParsedResults'][0]['ParsedText']
  3. Amazon Textract: Amazon Textract는 Amazon Web Services (AWS)의 서비스로, 클라우드 기반의 강력한 OCR 기능을 제공합니다. AWS SDK를 사용하여 파이썬에서 Textract를 호출할 수 있습니다.

     
    python
    import boto3

    client = boto3.client('textract')
    response = client.detect_document_text(Document={
          'S3Object': {'Bucket': 'your-bucket', 'Name': 'your-image.jpg'}}
    )

    # 추출된 텍스트에 접근
    for item in response['Blocks']:
          if item['BlockType'] == 'LINE':
                print(item['Text'])
    ​​​​​​​

이 OCR 도구 중에서 선택할 수 있는 것은 여러 가지이며, 문제의 텍스트와 이미지 품질, 사용 사례에 따라 가장 적합한 도구를 선택할 수 있습니다. OCR의 정확도는 이미지 품질, 언어, 글꼴 등에 영향을 받으므로 다양한 도구와 설정을 실험하여 가장 적합한 것을 찾아보세요.

로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
61 사건사고 2000년 이후 세계에서 발생한 대형 지진 2016.10.21 1323
60 사건사고 60대 한국인 목사 아동성폭행 8명 더 충격적인 것은 file 2016.10.21 3508
59 사건사고 JTBC 서복현 기자 단독 보도의 달인 file 2016.10.27 4731
58 사건사고 강정호 성폭행 사건 1 file 2016.07.06 7320
57 사건사고 갤럭시 노트7 사용 중지 권고 국토부 결정 file 2016.09.11 1991
56 사건사고 갤럭시 노트7 새 배터리 급속 방전과 발열, 또 불량 7 file 2016.09.23 8613
55 사건사고 갤럭시노트7 생산중단 보상규정은 어떻게? file 2016.10.10 1920
54 사건사고 거국중립내각 = 문재인 안철수 김무성 한 뜻 file 2016.10.27 2794
53 사건사고 경주 지진 규모 5.8에 드러난 재난시스템 문제점 2 file 2016.09.14 2697
52 사건사고 경주 지진 스스로 살아남아야 한다. file 2016.10.03 1899
51 사건사고 경주 지진 피해가 적었던 이유 2016.10.07 1432
50 사건사고 국민의당 김경진 김수민 사건사고 file 2016.06.13 7335
49 사건사고 김대중 북한 핵개발 발언 secret 2017.10.13 450
48 사건사고 김민수 윤빛가람 욕설논란 사건전말 7 file 2016.06.17 28100
47 사건사고 김병준 교수 새 국무총리 누구시더라? file 2016.11.02 7489
46 사건사고 김윤석 무릎담요 성희롱 논란 김윤석이 이상한건가? file 2016.12.05 7896
45 사건사고 김주하 앵커 대통령 두둔 논란 그럴 수 있지? file 2016.10.28 2117
44 사건사고 다스는 누구겁니까 2017.10.27 5599
43 사건사고 메디안 치약에 간암 발암물질 file 2016.09.27 4498
42 사건사고 모야모야병 여대생 빠른 쾌유를 기원합니다. file 2016.06.09 2526
Board Pagination Prev 1 2 3 4 Next
/ 4

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소