Skip to content
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬 requestsbeautifulsoup 으로 웹 input에 입력값 대입한 뒤 결과값 파일로 저장하기

 

 


import requests
from bs4 import BeautifulSoup
 
url = "http://www.limc.co.kr/KpnInfo/KpnResultList_Rsult.asp?search_check=1"
 
# POST 요청을 위한 데이터 설정
payload = {
    'search_value': '1401',
}
 
# POST 요청 보내기
response = requests.post(url, data=payload)
 
# BeautifulSoup으로 HTML 파싱
soup = BeautifulSoup(response.text, 'html.parser')
 
#<----- 필요없는 부분 ----->
# 필요한 항목 추출
#title = soup.find('title').text
 
# description 추출 (None 체크)
#description_tag = soup.find('meta', {'name': 'description'})
#description = description_tag['content'] if description_tag else None
 
# 결과를 출력 또는 다른 작업 수행
#print("Title:", title)
#print("Description:", description)
#<----- 필요없는 부분 ----->





 
# 특정 부분의 th 태그들을 모두 찾기 (예시로 summary 속성이 '이 표는 혈통정보를 나타내는 테이블입니다.'인 표의 th 태그를 찾음)
th_elements = soup.find('div', class_='c6bg').find_all('th')
 
# th 태그들의 텍스트를 리스트에 저장
th_values = [th.text.strip() for th in th_elements]
 
# 특정 부분의 td 태그들을 모두 찾기 (예시로 클래스가 'c6bg'인 div 안의 td 태그를 찾음)
td_elements = soup.find('div', class_='c6bg').find_all('td')
 
# td 태그들의 텍스트를 리스트에 저장
td_values = [td.text.strip() for td in td_elements]
 
# 결과 출력
#print("TD Values:", td_values)
#print("TD Values:", td_values[1])
print(th_values[1], td_values[1])
 
# 특정 부분의 th 태그들을 모두 찾기 (예시로 summary 속성이 '이 표는 혈통정보를 나타내는 테이블입니다.'인 표의 th 태그를 찾음)
ta_elements = soup.find('table', class_='t04').find_all('th')
 
print()
# th 태그들의 텍스트를 리스트에 저장
ta_values = [ta.text.strip() for ta in ta_elements]
 
# 결과 출력
print("Table>th Values:", ta_values)
print("Table>th Values:", ta_values[1])
print(ta_values[1], ta_values[1])


 

#한글이 깨질때~~~~

# CP949로 디코딩하여 복원
restored_list = [s.encode('latin1').decode('cp949') for s in ta_values]
 
# 결과 출력
print("복원된 리스트:", restored_list)

 

# 결과값을 파일에 저장
with open("result.html", "w", encoding=response.encoding) as file:
    file.write(response.text)
로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
15 블로거질 [네이버 웹마스터 도구]에서  최적화 검증에 홈페이지 다운로드 속도 확인하기 file 2016.12.11 4127
14 블로거질 다음블로그 RSS 검색등록 방법 file 2016.08.24 5454
13 블로거질 HTTP 헤더 확인 - HTTP Viewer 2016.08.19 4310
12 블로거질 구글/네이버/다음 뉴스 검색 제휴 등록절차 2016.04.21 4867
11 블로거질 PageSpeed Insights 사용해보기 file 2016.03.23 4007
10 블로거질 웹페이지 속도측정 사이트 file 2016.03.08 4896
9 블로거질 XE에서 RSS 피드 오류발생시 해결방법 2016.03.08 4074
8 블로거질 html 주소 특수문자 쉽게 변환 해 볼수 있는 사이트 file 2016.02.14 4867
7 블로거질 검색노출에 필요한 사이트 2016.02.14 3932
6 블로거질 애드센스 국민은행 외화보통예금통장으로 입금하기 2015.12.01 5033
5 블로거질 애드센스 국민은행 외화보통예금통장으로 입금하기 file 2015.08.25 6417
4 블로거질 CPC 클릭광고로 제대로 수익내기 1 2013.02.28 19628
3 블로거질 웨스턴 유니온 지급 보류 해제 방법 3 1 2010.11.10 28295
2 블로거질 블로그 광고수익의 종류(애드센스, 애드클릭스, 애드포스트 등) 1 2009.06.30 46280
1 블로거질 설치형블로그 사용중 믹시에 등록이 되지 않을경우 해결방법 file 2009.06.29 55617
Board Pagination Prev 1 Next
/ 1

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소