컴퓨터잡담

파이썬 Beautifulsoup html의 특정 주소만 가져오기

by nanumi posted Jun 14, 2021
?

단축키

Prev이전 문서

Next다음 문서

ESC닫기

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬 Beautifulsoup html의 특정 주소만 가져오기

소스

import time
from unicodedata import lookup #time 명령어 사용하기 
from bs4 import BeautifulSoup # BeautifulSoup 불러오기
#파이썬 requests 모듈은 간편한 HTTP 요청처리를 위해 사용하는 모듈로 별도로 설치해 주어야 한다.
import requests #pip3 install requests
 
search_data = "039240"
#고시공고 농업정책과 1번 https://www.gyeongju.go.kr/open_content/ko/page.do?pageNo=1&srchEnable=1&srchKeyword=%EB%86%8D%EC%97%85%EC%A0%95%EC%B1%85%EA%B3%BC&srchSDate=1960-01-01&srchBgpUid=-1&mnu_uid=423&parm_mnu_uid=0&srchEDate=9999-12-31&srchColumn=con_name&srchVoteType=-1&
 
url = "https://www.gyeongju.go.kr/open_content/ko/page.do?pageNo=1&srchEnable=1&srchKeyword=%EB%86%8D%EC%97%85%EC%A0%95%EC%B1%85%EA%B3%BC&srchSDate=1960-01-01&srchBgpUid=-1&mnu_uid=423&parm_mnu_uid=0&srchEDate=9999-12-31&srchColumn=con_name&srchVoteType=-1&"
html = requests.get(url)
bs_html = BeautifulSoup(html.content,"html.parser")
 
first_ = bs_html.select("table tr")[1]
href = first_.find_all("td")[1].find("a")
print("https://www.gyeongju.go.kr" + href['href']) #테그의 a href url주소가 취득하기
 
first_num = first_.select("td")[1].text #제목 추출하기
print(first_num)

 

 

 

결과