파이썬 requestsbeautifulsoup 으로 웹 input에 입력값 대입한 뒤 결과값 파일로 저장하기
import requests
from bs4 import BeautifulSoup
url = "http://www.limc.co.kr/KpnInfo/KpnResultList_Rsult.asp?search_check=1"
# POST 요청을 위한 데이터 설정
payload = {
'search_value': '1401',
}
# POST 요청 보내기
response = requests.post(url, data=payload)
# BeautifulSoup으로 HTML 파싱
soup = BeautifulSoup(response.text, 'html.parser')
#<----- 필요없는 부분 ----->
# 필요한 항목 추출
#title = soup.find('title').text
# description 추출 (None 체크)
#description_tag = soup.find('meta', {'name': 'description'})
#description = description_tag['content'] if description_tag else None
# 결과를 출력 또는 다른 작업 수행
#print("Title:", title)
#print("Description:", description)
#<----- 필요없는 부분 ----->
# 특정 부분의 th 태그들을 모두 찾기 (예시로 summary 속성이 '이 표는 혈통정보를 나타내는 테이블입니다.'인 표의 th 태그를 찾음)
th_elements = soup.find('div', class_='c6bg').find_all('th')
# th 태그들의 텍스트를 리스트에 저장
th_values = [th.text.strip() for th in th_elements]
# 특정 부분의 td 태그들을 모두 찾기 (예시로 클래스가 'c6bg'인 div 안의 td 태그를 찾음)
td_elements = soup.find('div', class_='c6bg').find_all('td')
# td 태그들의 텍스트를 리스트에 저장
td_values = [td.text.strip() for td in td_elements]
# 결과 출력
#print("TD Values:", td_values)
#print("TD Values:", td_values[1])
print(th_values[1], td_values[1])
# 특정 부분의 th 태그들을 모두 찾기 (예시로 summary 속성이 '이 표는 혈통정보를 나타내는 테이블입니다.'인 표의 th 태그를 찾음)
ta_elements = soup.find('table', class_='t04').find_all('th')
print()
# th 태그들의 텍스트를 리스트에 저장
ta_values = [ta.text.strip() for ta in ta_elements]
# 결과 출력
print("Table>th Values:", ta_values)
print("Table>th Values:", ta_values[1])
print(ta_values[1], ta_values[1])
#한글이 깨질때~~~~
# CP949로 디코딩하여 복원
restored_list = [s.encode('latin1').decode('cp949') for s in ta_values]
# 결과 출력
print("복원된 리스트:", restored_list)
# 결과값을 파일에 저장
with open("result.html", "w", encoding=response.encoding) as file:
file.write(response.text)