Skip to content
조회 수 84442 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬에서 인식이 잘되는 OCR 종류


 

파이썬에서 텍스트 인식을 위한 다양한 OCR(광학 문자 인식) 라이브러리와 도구가 있습니다. 다음은 몇 가지 인기 있는 OCR 라이브러리와 도구를 추천해 드립니다:

  1. Tesseract OCR (pytesseract): Tesseract는 Google에서 개발한 강력한 오픈 소스 OCR 엔진입니다. 파이썬에서 Tesseract를 사용하려면 pytesseract 라이브러리를 사용할 수 있습니다. 이미지에서 텍스트를 추출하는 데 사용됩니다.

     
    python
    from PIL import Image
    import pytesseract
    # 이미지에서 텍스트 추출
    text = pytesseract.image_to_string(Image.open('image.png'))
  2. EasyOCR: EasyOCR은 다국어 지원을 제공하는 OCR 라이브러리로, 사용하기 쉬우며 높은 정확도를 제공합니다. 이미지에서 텍스트를 추출하는 데 사용할 수 있습니다.

     
    python
    import easyocr
    reader = easyocr.Reader(['en'])
    results = reader.readtext('image.jpg')
    1. OCR.space API: OCR.space는 온라인 OCR 서비스를 제공하며 파이썬에서 이를 사용할 수 있습니다. API 키를 발급받고 이미지를 업로드하여 텍스트를 추출할 수 있습니다.

       
      python
      import requests
      api_key = 'YOUR_API_KEY'
      image_path = 'image.png'

      response = requests.post(
            'https://api.ocr.space/parse/image',
            headers={'apikey': api_key},
            files={'image': (image_path, open(image_path, 'rb'))}
      )

      result = response.json()
      extracted_text = result['ParsedResults'][0]['ParsedText']
  3. Amazon Textract: Amazon Textract는 Amazon Web Services (AWS)의 서비스로, 클라우드 기반의 강력한 OCR 기능을 제공합니다. AWS SDK를 사용하여 파이썬에서 Textract를 호출할 수 있습니다.

     
    python
    import boto3

    client = boto3.client('textract')
    response = client.detect_document_text(Document={
          'S3Object': {'Bucket': 'your-bucket', 'Name': 'your-image.jpg'}}
    )

    # 추출된 텍스트에 접근
    for item in response['Blocks']:
          if item['BlockType'] == 'LINE':
                print(item['Text'])
    ​​​​​​​

이 OCR 도구 중에서 선택할 수 있는 것은 여러 가지이며, 문제의 텍스트와 이미지 품질, 사용 사례에 따라 가장 적합한 도구를 선택할 수 있습니다. OCR의 정확도는 이미지 품질, 언어, 글꼴 등에 영향을 받으므로 다양한 도구와 설정을 실험하여 가장 적합한 것을 찾아보세요.

로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
917 AutoHotKey #ifwinactive & #ifwinexist 윈도우창 마다 핫키의 용도를 다르게 사용하는 방법 2011.02.14 16526
916 Excel 'C:Documents.xlsx' 을(를) 찾을 수 없습니다. 라는 오류 메시지가 나오는 경우 대처방법 2015.01.28 4789
915 WindowsTip (nPDF) 프린터 인쇄 내용을 PDF 파일로 변환하기 2015.01.24 2273
914 컴퓨터잡담 -응답없음- 으로 멈춰버린 프로그램 대기시간 줄이는 방법 2010.10.01 7866
913 컴퓨터잡담 .htaccess와 워터마킹을 이용한 이미지 링크 방지 2009.06.30 34918
912 WindowsTip 100M Full 속도내기(레지스터리) file 2013.01.11 6528
911 컴퓨터잡담 16진수 헥사, 2진수, 10진수, 8진법 변환 계산기; Hex Calc 2012.02.22 7917
910 컴퓨터잡담 2021년 플래시 플레이어 웹사이트 크롬에서 접속하는 방법 2021.07.05 2561
909 컴퓨터잡담 2023-09-23 서버다운 후 복구완료 secret 2023.09.23 47830
908 컴퓨터잡담 50 개 이상의 Ajax 예제들 2 2010.03.29 18950
907 컴퓨터잡담 50 개 이상의 Ajax 예제들 2010.03.29 18179
906 Server 8기가 램에 맞는 Mysql config 셋팅 값 1 2016.02.22 3859
905 컴퓨터잡담 ACTIVE-X 의 무서움 file 2015.12.26 669
904 컴퓨터잡담 AHK & my Address of Pointer and my Offset 2011.10.11 13184
903 컴퓨터잡담 Ahk Standard Library Collection, 2010 Sep (+Gui) ~ Libs: 100 3 2011.10.11 14190
902 AutoHotKey ahk) autohotkey controlgettext 이름을 마우스커서에 졸졸 따라다니게 하기 file 2014.04.01 12207
901 AutoHotKey ahk) autohotkey 글자 자르기 방법 2013.10.30 34676
900 AutoHotKey ahk) autohotkey 엑셀(Excel)에서 행값 증가시키기 2013.10.30 37421
899 AutoHotKey AHK) AUTOKEY 웹페이지 열지않고 소스 가져오기 또는 로그인 하기 14 2012.05.12 52958
898 AutoHotKey Ahk) ip할당 진단프로그램 file 2011.12.26 12122
Board Pagination Prev 1 2 3 4 5 ... 46 Next
/ 46

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소