Skip to content
조회 수 80398 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬에서 인식이 잘되는 OCR 종류


 

파이썬에서 텍스트 인식을 위한 다양한 OCR(광학 문자 인식) 라이브러리와 도구가 있습니다. 다음은 몇 가지 인기 있는 OCR 라이브러리와 도구를 추천해 드립니다:

  1. Tesseract OCR (pytesseract): Tesseract는 Google에서 개발한 강력한 오픈 소스 OCR 엔진입니다. 파이썬에서 Tesseract를 사용하려면 pytesseract 라이브러리를 사용할 수 있습니다. 이미지에서 텍스트를 추출하는 데 사용됩니다.

     
    python
    from PIL import Image
    import pytesseract
    # 이미지에서 텍스트 추출
    text = pytesseract.image_to_string(Image.open('image.png'))
  2. EasyOCR: EasyOCR은 다국어 지원을 제공하는 OCR 라이브러리로, 사용하기 쉬우며 높은 정확도를 제공합니다. 이미지에서 텍스트를 추출하는 데 사용할 수 있습니다.

     
    python
    import easyocr
    reader = easyocr.Reader(['en'])
    results = reader.readtext('image.jpg')
    1. OCR.space API: OCR.space는 온라인 OCR 서비스를 제공하며 파이썬에서 이를 사용할 수 있습니다. API 키를 발급받고 이미지를 업로드하여 텍스트를 추출할 수 있습니다.

       
      python
      import requests
      api_key = 'YOUR_API_KEY'
      image_path = 'image.png'

      response = requests.post(
            'https://api.ocr.space/parse/image',
            headers={'apikey': api_key},
            files={'image': (image_path, open(image_path, 'rb'))}
      )

      result = response.json()
      extracted_text = result['ParsedResults'][0]['ParsedText']
  3. Amazon Textract: Amazon Textract는 Amazon Web Services (AWS)의 서비스로, 클라우드 기반의 강력한 OCR 기능을 제공합니다. AWS SDK를 사용하여 파이썬에서 Textract를 호출할 수 있습니다.

     
    python
    import boto3

    client = boto3.client('textract')
    response = client.detect_document_text(Document={
          'S3Object': {'Bucket': 'your-bucket', 'Name': 'your-image.jpg'}}
    )

    # 추출된 텍스트에 접근
    for item in response['Blocks']:
          if item['BlockType'] == 'LINE':
                print(item['Text'])
    ​​​​​​​

이 OCR 도구 중에서 선택할 수 있는 것은 여러 가지이며, 문제의 텍스트와 이미지 품질, 사용 사례에 따라 가장 적합한 도구를 선택할 수 있습니다. OCR의 정확도는 이미지 품질, 언어, 글꼴 등에 영향을 받으므로 다양한 도구와 설정을 실험하여 가장 적합한 것을 찾아보세요.

로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
56 파이썬 chatGPT file 2023.02.11 4399
55 파이썬 DiffusionWrapper has 859.52 M params. 2023.04.21 37460
54 파이썬 python AttributeError: 'WebDriver' object has no attribute 'find_element_by_css_selector' 해결방법 2023.05.07 47581
53 파이썬 python class def 2023.03.04 2368
52 파이썬 python html tag 제거 경로 금지 문자 제거 2021.10.26 3199
51 파이썬 Python 메타블로그 글쓰기(제로보드, xpressengine blog api) 2021.09.18 3433
50 파이썬 python 에서 구글 캘린더 api 이용하기(server to server) 2021.09.17 3277
49 파이썬 pytube 사용방법 2022.01.22 4190
48 파이썬 Visual Studio Code 파이썬 인터프리터 경로 변경하기 2022.03.09 9265
47 파이썬 Windows용 Tesseract 설치 및 사용법 2022.11.26 19486
46 파이썬 네이버 주식에서 종목의 투자정보 자료 가져오기 1 2023.03.10 2245
45 파이썬 네이버 주식의 기업정보와 펀더멘탈정보 소스 가져오기 2023.03.10 3387
44 파이썬 웹 페이지에서 동적으로 생성되는 데이터 가져오는 방법 2023.03.15 6960
43 파이썬 자바스크립트 종말각?! HTML에서 파이썬 실행하는 PyScript 등장! 2022.06.08 31260
42 파이썬 키움 증권 API를 이용하여 주식 자동 매매 프로그램 개발 3 2021.09.07 3930
41 파이썬 키움증권 OpenAPI 당황스러움 file 2021.09.06 1750
40 파이썬 키움증권 openAPI 지정가분할매수주문.py 2021.09.13 3533
39 파이썬 파이썬 any, all 사용하기(배열데이터 안에 값이 하나라도 있는지 또는 모두 있는지 비교) 2021.09.11 1956
38 파이썬 파이썬 datetime 모듈로 초간단 날짜 표현하기 2021.09.11 2714
37 파이썬 파이썬 dictionary 딕셔너리 조작 2021.09.13 2537
Board Pagination Prev 1 2 3 Next
/ 3

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소