Skip to content
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬 requestsbeautifulsoup 으로 웹 input에 입력값 대입한 뒤 결과값 파일로 저장하기

 

 


import requests
from bs4 import BeautifulSoup
 
url = "http://www.limc.co.kr/KpnInfo/KpnResultList_Rsult.asp?search_check=1"
 
# POST 요청을 위한 데이터 설정
payload = {
    'search_value': '1401',
}
 
# POST 요청 보내기
response = requests.post(url, data=payload)
 
# BeautifulSoup으로 HTML 파싱
soup = BeautifulSoup(response.text, 'html.parser')
 
#<----- 필요없는 부분 ----->
# 필요한 항목 추출
#title = soup.find('title').text
 
# description 추출 (None 체크)
#description_tag = soup.find('meta', {'name': 'description'})
#description = description_tag['content'] if description_tag else None
 
# 결과를 출력 또는 다른 작업 수행
#print("Title:", title)
#print("Description:", description)
#<----- 필요없는 부분 ----->





 
# 특정 부분의 th 태그들을 모두 찾기 (예시로 summary 속성이 '이 표는 혈통정보를 나타내는 테이블입니다.'인 표의 th 태그를 찾음)
th_elements = soup.find('div', class_='c6bg').find_all('th')
 
# th 태그들의 텍스트를 리스트에 저장
th_values = [th.text.strip() for th in th_elements]
 
# 특정 부분의 td 태그들을 모두 찾기 (예시로 클래스가 'c6bg'인 div 안의 td 태그를 찾음)
td_elements = soup.find('div', class_='c6bg').find_all('td')
 
# td 태그들의 텍스트를 리스트에 저장
td_values = [td.text.strip() for td in td_elements]
 
# 결과 출력
#print("TD Values:", td_values)
#print("TD Values:", td_values[1])
print(th_values[1], td_values[1])
 
# 특정 부분의 th 태그들을 모두 찾기 (예시로 summary 속성이 '이 표는 혈통정보를 나타내는 테이블입니다.'인 표의 th 태그를 찾음)
ta_elements = soup.find('table', class_='t04').find_all('th')
 
print()
# th 태그들의 텍스트를 리스트에 저장
ta_values = [ta.text.strip() for ta in ta_elements]
 
# 결과 출력
print("Table>th Values:", ta_values)
print("Table>th Values:", ta_values[1])
print(ta_values[1], ta_values[1])


 

#한글이 깨질때~~~~

# CP949로 디코딩하여 복원
restored_list = [s.encode('latin1').decode('cp949') for s in ta_values]
 
# 결과 출력
print("복원된 리스트:", restored_list)

 

# 결과값을 파일에 저장
with open("result.html", "w", encoding=response.encoding) as file:
    file.write(response.text)
로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
16 파이썬 파이썬 easyocr 이미지 문자 인식 2023.01.16 10308
15 파이썬 파이썬에서 captCha 분석 프로그램을 만들 수 있을까? 2023.03.25 11727
14 파이썬 파이썬 글자 인식, 파이썬 OCR, 파이썬 Tesseract 사용 2022.11.21 14641
13 파이썬 파이썬으로 captCha 분석하여 웹사이트 소스 가져오기 2023.03.25 19095
12 파이썬 파이썬 화면 캡쳐하기 2022.11.26 19343
11 파이썬 Windows용 Tesseract 설치 및 사용법 2022.11.26 19485
10 파이썬 파이썬 구글스프레드시트 값 불러오기 html로 변환작업 중! 2022.05.08 20186
9 파이썬 파이썬 파이인스톨러 설치하기 2022.05.08 21421
8 파이썬 자바스크립트 종말각?! HTML에서 파이썬 실행하는 PyScript 등장! 2022.06.08 31260
7 파이썬 DiffusionWrapper has 859.52 M params. 2023.04.21 37451
6 파이썬 python AttributeError: 'WebDriver' object has no attribute 'find_element_by_css_selector' 해결방법 2023.05.07 47573
» 파이썬 파이썬 requestsbeautifulsoup 으로 웹 input에 입력값 대입한 뒤 결과값 파일로 저장하기 2023.11.13 67847
4 파이썬 파이썬 랜덤으로 시험문제 풀기 file 2023.10.04 76005
3 파이썬 한우경매낙찰 유튜브 영상의 이미지에서 특정 문자 가져와서 저장하기 2023.09.14 79098
2 파이썬 파이썬에서 인식이 잘되는 OCR 종류 2023.09.15 79943
1 파이썬 파이썬 랜덤으로 문제풀기 #2 2023.10.04 79953
Board Pagination Prev 1 2 3 Next
/ 3

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소