Skip to content
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬 requestsbeautifulsoup 으로 웹 input에 입력값 대입한 뒤 결과값 파일로 저장하기

 

 


import requests
from bs4 import BeautifulSoup
 
url = "http://www.limc.co.kr/KpnInfo/KpnResultList_Rsult.asp?search_check=1"
 
# POST 요청을 위한 데이터 설정
payload = {
    'search_value': '1401',
}
 
# POST 요청 보내기
response = requests.post(url, data=payload)
 
# BeautifulSoup으로 HTML 파싱
soup = BeautifulSoup(response.text, 'html.parser')
 
#<----- 필요없는 부분 ----->
# 필요한 항목 추출
#title = soup.find('title').text
 
# description 추출 (None 체크)
#description_tag = soup.find('meta', {'name': 'description'})
#description = description_tag['content'] if description_tag else None
 
# 결과를 출력 또는 다른 작업 수행
#print("Title:", title)
#print("Description:", description)
#<----- 필요없는 부분 ----->





 
# 특정 부분의 th 태그들을 모두 찾기 (예시로 summary 속성이 '이 표는 혈통정보를 나타내는 테이블입니다.'인 표의 th 태그를 찾음)
th_elements = soup.find('div', class_='c6bg').find_all('th')
 
# th 태그들의 텍스트를 리스트에 저장
th_values = [th.text.strip() for th in th_elements]
 
# 특정 부분의 td 태그들을 모두 찾기 (예시로 클래스가 'c6bg'인 div 안의 td 태그를 찾음)
td_elements = soup.find('div', class_='c6bg').find_all('td')
 
# td 태그들의 텍스트를 리스트에 저장
td_values = [td.text.strip() for td in td_elements]
 
# 결과 출력
#print("TD Values:", td_values)
#print("TD Values:", td_values[1])
print(th_values[1], td_values[1])
 
# 특정 부분의 th 태그들을 모두 찾기 (예시로 summary 속성이 '이 표는 혈통정보를 나타내는 테이블입니다.'인 표의 th 태그를 찾음)
ta_elements = soup.find('table', class_='t04').find_all('th')
 
print()
# th 태그들의 텍스트를 리스트에 저장
ta_values = [ta.text.strip() for ta in ta_elements]
 
# 결과 출력
print("Table>th Values:", ta_values)
print("Table>th Values:", ta_values[1])
print(ta_values[1], ta_values[1])


 

#한글이 깨질때~~~~

# CP949로 디코딩하여 복원
restored_list = [s.encode('latin1').decode('cp949') for s in ta_values]
 
# 결과 출력
print("복원된 리스트:", restored_list)

 

# 결과값을 파일에 저장
with open("result.html", "w", encoding=response.encoding) as file:
    file.write(response.text)
로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
56 파이썬 파이썬에서 인식이 잘되는 OCR 종류 2023.09.15 76274
55 파이썬 파이썬 랜덤으로 문제풀기 #2 2023.10.04 75729
54 파이썬 한우경매낙찰 유튜브 영상의 이미지에서 특정 문자 가져와서 저장하기 2023.09.14 75584
53 파이썬 파이썬 랜덤으로 시험문제 풀기 file 2023.10.04 72109
» 파이썬 파이썬 requestsbeautifulsoup 으로 웹 input에 입력값 대입한 뒤 결과값 파일로 저장하기 2023.11.13 63551
51 파이썬 python AttributeError: 'WebDriver' object has no attribute 'find_element_by_css_selector' 해결방법 2023.05.07 47494
50 파이썬 DiffusionWrapper has 859.52 M params. 2023.04.21 37376
49 파이썬 자바스크립트 종말각?! HTML에서 파이썬 실행하는 PyScript 등장! 2022.06.08 31256
48 파이썬 파이썬 파이인스톨러 설치하기 2022.05.08 21421
47 파이썬 파이썬 구글스프레드시트 값 불러오기 html로 변환작업 중! 2022.05.08 20186
46 파이썬 Windows용 Tesseract 설치 및 사용법 2022.11.26 19467
45 파이썬 파이썬 화면 캡쳐하기 2022.11.26 19343
44 파이썬 파이썬으로 captCha 분석하여 웹사이트 소스 가져오기 2023.03.25 19020
43 파이썬 파이썬 글자 인식, 파이썬 OCR, 파이썬 Tesseract 사용 2022.11.21 14641
42 파이썬 파이썬에서 captCha 분석 프로그램을 만들 수 있을까? 2023.03.25 11722
41 파이썬 파이썬 easyocr 이미지 문자 인식 2023.01.16 10298
40 파이썬 파이썬 googleapiclient 모듈이 설치가 안될때 해결방법 1 2022.03.27 9838
39 파이썬 Visual Studio Code 파이썬 인터프리터 경로 변경하기 2022.03.09 9265
38 파이썬 파이썬을 이용하여 매크로 만들기 2023.01.13 9211
37 파이썬 웹 페이지에서 동적으로 생성되는 데이터 가져오는 방법 2023.03.15 6937
Board Pagination Prev 1 2 3 Next
/ 3

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소