Skip to content
조회 수 77443 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬에서 인식이 잘되는 OCR 종류


 

파이썬에서 텍스트 인식을 위한 다양한 OCR(광학 문자 인식) 라이브러리와 도구가 있습니다. 다음은 몇 가지 인기 있는 OCR 라이브러리와 도구를 추천해 드립니다:

  1. Tesseract OCR (pytesseract): Tesseract는 Google에서 개발한 강력한 오픈 소스 OCR 엔진입니다. 파이썬에서 Tesseract를 사용하려면 pytesseract 라이브러리를 사용할 수 있습니다. 이미지에서 텍스트를 추출하는 데 사용됩니다.

     
    python
    from PIL import Image
    import pytesseract
    # 이미지에서 텍스트 추출
    text = pytesseract.image_to_string(Image.open('image.png'))
  2. EasyOCR: EasyOCR은 다국어 지원을 제공하는 OCR 라이브러리로, 사용하기 쉬우며 높은 정확도를 제공합니다. 이미지에서 텍스트를 추출하는 데 사용할 수 있습니다.

     
    python
    import easyocr
    reader = easyocr.Reader(['en'])
    results = reader.readtext('image.jpg')
    1. OCR.space API: OCR.space는 온라인 OCR 서비스를 제공하며 파이썬에서 이를 사용할 수 있습니다. API 키를 발급받고 이미지를 업로드하여 텍스트를 추출할 수 있습니다.

       
      python
      import requests
      api_key = 'YOUR_API_KEY'
      image_path = 'image.png'

      response = requests.post(
            'https://api.ocr.space/parse/image',
            headers={'apikey': api_key},
            files={'image': (image_path, open(image_path, 'rb'))}
      )

      result = response.json()
      extracted_text = result['ParsedResults'][0]['ParsedText']
  3. Amazon Textract: Amazon Textract는 Amazon Web Services (AWS)의 서비스로, 클라우드 기반의 강력한 OCR 기능을 제공합니다. AWS SDK를 사용하여 파이썬에서 Textract를 호출할 수 있습니다.

     
    python
    import boto3

    client = boto3.client('textract')
    response = client.detect_document_text(Document={
          'S3Object': {'Bucket': 'your-bucket', 'Name': 'your-image.jpg'}}
    )

    # 추출된 텍스트에 접근
    for item in response['Blocks']:
          if item['BlockType'] == 'LINE':
                print(item['Text'])
    ​​​​​​​

이 OCR 도구 중에서 선택할 수 있는 것은 여러 가지이며, 문제의 텍스트와 이미지 품질, 사용 사례에 따라 가장 적합한 도구를 선택할 수 있습니다. OCR의 정확도는 이미지 품질, 언어, 글꼴 등에 영향을 받으므로 다양한 도구와 설정을 실험하여 가장 적합한 것을 찾아보세요.

로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
253 회로도전자부품 Joule thief 회로(저전압 승압회로) file 2013.10.02 64153
252 회로도전자부품 PWM이란? PWM 적용IC 및 구동방법 file 2013.09.10 52016
251 회로도전자부품 제너 다이오드(zener diode) 사용방법 file 2013.09.23 51025
250 회로도전자부품 인덕턴스란? 2013.09.23 50349
249 회로도전자부품 Step-up & Step-down & AC to DC 등의 다양한 회로도 2013.09.21 46439
248 회로도전자부품 인덕터 코일 자작하기 file 2013.10.01 44347
247 회로도전자부품 전기용어와 단어 2013.08.24 36973
246 회로도전자부품 Joule thief 회로(저전압 승압회로) 실험 결과 3 file 2013.10.10 34866
245 회로도전자부품 Arduino Frequency Counter Library file 2014.01.20 30807
244 회로도전자부품 전자기호 1 file 2013.08.11 30151
243 AVR 아두이노 전압측정(오실레이터가 없을때 활용) file 2013.10.18 27385
242 회로도전자부품 렉테나 실험 중 내몸에 대량의 유도전력 발생 2013.12.14 26800
241 회로도전자부품 tl431 - battery boost circuit file 2013.10.03 26020
240 회로도전자부품 AM/FM 라디오 구조(회로도 설명) 1 2014.04.02 25329
239 회로도전자부품 1.5V to 5V/12V DC/DC Converter with LT1073 2013.10.12 24693
238 회로도전자부품 전류,전압,저항의 관계 file 2013.08.24 24374
237 회로도전자부품 부스트 컨버터의 기본 원리 2013.09.30 24069
236 회로도전자부품 전압채배기(렉테나에 주로 이용) 2013.11.27 23769
235 AVR 555 TIMER AM TRANSMITTER CIRCUIT(AM 송신 회로) file 2014.09.20 23298
234 AVR ARDUINO 명령어 모음 3 2012.07.24 22847
Board Pagination Prev 1 2 3 4 5 ... 13 Next
/ 13

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소