Skip to content
조회 수 18966 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬으로 captCha 분석하여 웹사이트 소스 가져오기

 

파이썬으로 captCha 분석 프로그램을 만들 수 있습니다.

그러나 captCha 분석은 비교적 복잡한 작업이며, 다양한 알고리즘과 기술이 필요합니다.

일반적으로 이미지 처리 및 인공지능 분야에서 활용되는 기술들을 사용하여 captCha 분석 프로그램을 개발합니다.

따라서, 만약 captCha 분석에 대한 경험이 부족하다면, 이미지 처리 및 인공지능 분야에서의 기술 및 알고리즘에 대한 학습이 필요할 수 있습니다.

그러나 Python은 이미지 처리 및 인공지능 분야에서 널리 사용되는 언어 중 하나이며, 다양한 라이브러리 및 프레임워크가 제공되고 있기 때문에 이러한 작업을 수행하는 데 사용할 수 있습니다.

이미지 처리에는 Pillow, OpenCV, Scikit-image 등의 라이브러리가 있으며, 인공지능 분야에는 TensorFlow, PyTorch, Keras 등의 프레임워크가 있습니다.

이러한 라이브러리 및 프레임워크를 사용하여 captCha 분석 프로그램을 구현할 수 있습니다.


 

import requests
from PIL import Image
import io
import pytesseract
 
# 테써렉트 위치
pytesseract.pytesseract.tesseract_cmd = r'G:/tesseract/tesseract.exe'
 
# 캡차 이미지 URL
captcha_url = 'https://chuksaro.nias.go.kr/hanwoori/captchaImg.do'
 
# 세션 생성
session = requests.Session()
 
# 인증서 다운로드
cert_url = 'https://www.nia.or.kr/common/key/nia-ca.crt'
cert_file = 'nia-ca.crt'
response = session.get(cert_url)
 
with open(cert_file, 'wb') as f:
    f.write(response.content)
 

# 캡차 이미지 다운로드
#response = session.get(captcha_url, verify=cert_file)

 
# 캡차 이미지 다운로드 개무시하기
 
response = session.get(captcha_url, verify=False) #인증서 검증을 비활성화하는 방법
 
# 캡차 이미지 다운로드 인증서 설치하기
#cert_file = "C:/python/py_code/automouse/ssl/_.nias.go.kr.crt"
#response = session.get(captcha_url, verify=cert_file)#신뢰할 수 있는 인증서를 설치하는 방법

captcha_img = Image.open(io.BytesIO(response.content))
 
# 캡차 이미지 처리
captcha_img = captcha_img.convert('L')
threshold = 127
table = []
for i in range(256):
    if i < threshold:
        table.append(0)
    else:
        table.append(1)
captcha_img = captcha_img.point(table, '1')
 
# pytesseract를 사용하여 캡차 이미지에서 텍스트 추출
captcha_text = pytesseract.image_to_string(captcha_img, config='--psm 10')

# 검색어 입력 폼에 값을 입력하여 검색
search_url = 'https://chuksaro.nias.go.kr/hanwoori/cowCntcInfo.do'
search_keyword = '002xxxxxxx'
response = session.post(search_url, data={'answer': captcha_text, 'search_keyword': search_keyword}, verify=cert_file)

with open('C:/python/py_code/automouse/result.txt', 'w', encoding='utf-8') as f:
    f.write(response.text)
   
# 검색 결과 출력
print(response.text)

 

 

 

 

로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
24 재미재미 수 0, 1, 3, 4, 6, 7, 8을 한 번씩만 사용하여 만든 일곱 자리 수입니다. 6750000보다 크고 6800000보다 작은 수 입니다. 일의 자리 숫자와 백의 자리 숫자의 합은 십의 자리 숫자와 같습니다. 조건4) 백의 자리 숫자는 일의 자리 숫자보다 작습니다. 위의 조건을 모두 만족하는 수를 구하시오. 2023.03.19 8854
23 [Docs]스프레드시트 구글 스프레드시트에서 O열=입금완료 가 있는 행은 행 전체가 노란색으로 변하게 하기 2023.03.24 10046
22 파이썬 파이썬에서 captCha 분석 프로그램을 만들 수 있을까? 2023.03.25 11714
21 컴퓨터잡담 윈도우10 운영체제에 크롬브라우저를 사용할 때 웹사이트 인증서 설치하는 방법 2023.03.25 15606
» 파이썬 파이썬으로 captCha 분석하여 웹사이트 소스 가져오기 2023.03.25 18966
19 [Docs]스프레드시트 구글 스프레드시트에서 셀값이 특정일에서 현재일과 3일 이내의 범위에 들어오면 이메일을 발송하는 방법 2023.03.26 40420
18 주식 최강 한동훈주 2023.04.13 36704
17 주식 한창산업 - 아연분말,인산아연,제올라이트,바나듐 생산업체 2023.04.13 38420
16 주식 티피씨글로벌 차트가 너무좋네. 2023.04.16 38419
15 파이썬 DiffusionWrapper has 859.52 M params. 2023.04.21 37312
Board Pagination Prev 1 ... 231 232 233 234 235 Next
/ 235

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소