Skip to content
조회 수 19471 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬으로 captCha 분석하여 웹사이트 소스 가져오기

 

파이썬으로 captCha 분석 프로그램을 만들 수 있습니다.

그러나 captCha 분석은 비교적 복잡한 작업이며, 다양한 알고리즘과 기술이 필요합니다.

일반적으로 이미지 처리 및 인공지능 분야에서 활용되는 기술들을 사용하여 captCha 분석 프로그램을 개발합니다.

따라서, 만약 captCha 분석에 대한 경험이 부족하다면, 이미지 처리 및 인공지능 분야에서의 기술 및 알고리즘에 대한 학습이 필요할 수 있습니다.

그러나 Python은 이미지 처리 및 인공지능 분야에서 널리 사용되는 언어 중 하나이며, 다양한 라이브러리 및 프레임워크가 제공되고 있기 때문에 이러한 작업을 수행하는 데 사용할 수 있습니다.

이미지 처리에는 Pillow, OpenCV, Scikit-image 등의 라이브러리가 있으며, 인공지능 분야에는 TensorFlow, PyTorch, Keras 등의 프레임워크가 있습니다.

이러한 라이브러리 및 프레임워크를 사용하여 captCha 분석 프로그램을 구현할 수 있습니다.


 

import requests
from PIL import Image
import io
import pytesseract
 
# 테써렉트 위치
pytesseract.pytesseract.tesseract_cmd = r'G:/tesseract/tesseract.exe'
 
# 캡차 이미지 URL
captcha_url = 'https://chuksaro.nias.go.kr/hanwoori/captchaImg.do'
 
# 세션 생성
session = requests.Session()
 
# 인증서 다운로드
cert_url = 'https://www.nia.or.kr/common/key/nia-ca.crt'
cert_file = 'nia-ca.crt'
response = session.get(cert_url)
 
with open(cert_file, 'wb') as f:
    f.write(response.content)
 

# 캡차 이미지 다운로드
#response = session.get(captcha_url, verify=cert_file)

 
# 캡차 이미지 다운로드 개무시하기
 
response = session.get(captcha_url, verify=False) #인증서 검증을 비활성화하는 방법
 
# 캡차 이미지 다운로드 인증서 설치하기
#cert_file = "C:/python/py_code/automouse/ssl/_.nias.go.kr.crt"
#response = session.get(captcha_url, verify=cert_file)#신뢰할 수 있는 인증서를 설치하는 방법

captcha_img = Image.open(io.BytesIO(response.content))
 
# 캡차 이미지 처리
captcha_img = captcha_img.convert('L')
threshold = 127
table = []
for i in range(256):
    if i < threshold:
        table.append(0)
    else:
        table.append(1)
captcha_img = captcha_img.point(table, '1')
 
# pytesseract를 사용하여 캡차 이미지에서 텍스트 추출
captcha_text = pytesseract.image_to_string(captcha_img, config='--psm 10')

# 검색어 입력 폼에 값을 입력하여 검색
search_url = 'https://chuksaro.nias.go.kr/hanwoori/cowCntcInfo.do'
search_keyword = '002xxxxxxx'
response = session.post(search_url, data={'answer': captcha_text, 'search_keyword': search_keyword}, verify=cert_file)

with open('C:/python/py_code/automouse/result.txt', 'w', encoding='utf-8') as f:
    f.write(response.text)
   
# 검색 결과 출력
print(response.text)

 

 

 

 

로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
897 컴퓨터잡담 농업경영에 이용하지 않는 농지의 처분 의무 2021.06.11 1226
896 Server XE 카카오톡 글전송 2015.07.08 1235
895 Server WAPM에서 Database 접속 속도 개선하기 2016.03.03 1243
894 컴퓨터잡담 자주쓰는 파이썬 명령어 2021.06.05 1251
893 Server Windows APM Install(Apache 2.4, PHP 6.0, Mysql) 최신버전 설치해보기 2015.11.27 1260
892 Server CSS, JS파일, gzip으로 한꺼번에 압축해서 전송하기 2016.03.08 1280
891 Server MySQL - 속도저하에 따른 웹페이지 접속 지연 2016.03.03 1325
890 Server PHP Opcache 적용 전과 후의 비교 1 2016.03.07 1332
889 컴퓨터잡담 파이썬 파일로 읽어올 때 \n이 \\n으로 변경되는 현상 대처방법 2021.08.15 1344
888 컴퓨터잡담 Python Requests post() Method 2021.08.31 1346
887 컴퓨터잡담 [오류해결방법] 200, Stream not found, NetStream.Play.StreamNotFound, clip: '[Clip] ... 2015.11.30 1360
886 컴퓨터잡담 파이썬 키움증권 open api 분할매매 수식구하기 2021.09.04 1361
885 Server 아파치 모듈 mod_deflate 압축하기 1 2016.03.17 1366
884 Server XE 어느날 갑자기 다운로드가 되지 않을때 해결방법 file 2016.04.07 1386
883 WindowsTip Windows XP 부팅속도 개선 팁 file 2015.01.24 1420
882 Server XE 리퍼러 모듈로 트래픽 발생에 대처방법 file 2016.04.17 1424
881 컴퓨터잡담 파이썬 find, select 사용법 2021.07.30 1444
880 컴퓨터잡담 파이썬 초보자가 접하기 쉬운 오류 메시지 2 2021.06.15 1447
879 Server XE 업데이트 후 모듈업데이트가 안될때 참고 file 2015.03.13 1451
878 컴퓨터잡담 파이썬 다음 증권의 주가 가져오기 2021.08.22 1455
Board Pagination Prev 1 2 3 4 5 ... 46 Next
/ 46

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소