Skip to content
컴퓨터잡담
2021.06.02 14:05

파이썬 웹페이지 기업정보 추출하기

조회 수 1823 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬 웹페이지 기업정보 추출하기

 

 
#kisline 주식 기업정보조회
 
import time #time 명령어 사용하기 
from selenium import webdriver #셀레니움 사용하기 
from selenium.webdriver.common.keys import Keys #키보드 입력하기 위한 설정
from bs4 import BeautifulSoup # BeautifulSoup 불러오기

#파이썬 requests 모듈은 간편한 HTTP 요청처리를 위해 사용하는 모듈로 별도로 설치해 주어야 한다.
import requests #pip3 install requests
from bs4 import BeautifulSoup #뷰티풀솝을 사용하기
#driver = webdriver.Chrome()  => 크롬드라이버 실행준비
#print (driver.current_url)  => 크롬창의 url 불러오기
 
#html = requests.get(driver.current_url)
html = requests.get("http://comp.fnguide.com/SVO2/asp/SVD_Invest.asp?pGB=1&gicode=A014530&cID=&MenuYn=Y&ReportGB=&NewMenuID=105&stkGb=701")
bs_html = BeautifulSoup(html.content,"html.parser")
 
#bs의 select 사용법
    #soup.select('태그')
    #soup.select('.클래스명') 혹은 ('태그.클래스명')
    #soup.select('#아이디명') 혹은 ('태그#아이디명')
    #soup.select('태그 > 자식태그')
    #soup.select('태그 자손태그')
 
# id가 headline0인 태그의 자손 중 li 크롤링
    #title = soup.select('#headline0 li')
 
# 원하는 정보가 있는 위치 찾기 
#soup.select('원하는 정보')  # select('원하는 정보') -->  단 하나만 있더라도, 복수 가능한 형태로 되어있음
#soup.select('태그명')
#soup.select('.클래스명')
#soup.select('상위태그명 > 하위태그명 > 하위태그명')
#soup.select('상위태그명.클래스명 > 하위태그명.클래스명')    # 바로 아래의(자식) 태그를 선택시에는 > 기호를 사용
#soup.select('상위태그명.클래스명 하~위태그명')              # 아래의(자손) 태그를 선택시에는   띄어쓰기 사용
#soup.select('상위태그명 > 바로아래태그명 하~위태그명')     
#soup.select('.클래스명')
#soup.select('#아이디명')                  # 태그는 여러개에 사용 가능하나 아이디는 한번만 사용 가능함! ==> 선택하기 좋음
#soup.select('태그명.클래스명)
#soup.select('#아이디명 > 태그명.클래스명)
#soup.select('태그명[속성1=값1]')
 
re_html = bs_html.select("div.corp_group2 dd")
 
per = bs_html.select("div.corp_group2 dd")[1].text
pbr = bs_html.select("div.corp_group2 dd")[7].text
allocation = bs_html.select("div.corp_group2 dd")[9].text
print('PER : 'per)
print('PBR : 'pbr)
print('배당률 : 'allocation)


 

로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
137 컴퓨터잡담 로블록스 스튜디오 파트속성 2021.09.28 3091
136 [Docs]스프레드시트 구글 스프레드시트 쿼리 사용하기 #2 2021.09.26 3052
135 파이썬 파이썬 키움openAPI 보유종목 종목리스트 피라미드 매수주문하기 2021.09.16 3035
134 컴퓨터잡담 파이썬 Beautifulsoup html의 특정 주소만 가져오기 file 2021.06.14 2986
133 Server XE 스케치북 모바일 비회원 댓글쓰기에서 홈페이지 이메일 기입란 삭제하기 2016.04.08 2981
132 파이썬 파이썬 변수내용 문자열 자르기 특이한 점 2021.09.27 2965
131 컴퓨터잡담 파이썬의 IF문 사용시 실행값에서 오류발생시 진행하는 예외처리 방법 2021.06.15 2879
130 Server XE PC에서 모바일화면 출력방법 file 2016.09.08 2855
129 컴퓨터잡담 한글입력이 안될때(how to hangul ...) file 2021.01.08 2839
128 Server [php.ini]XE 신디케이션 OpenSSL 오류문구 해결방법 file 2016.08.25 2816
127 Server ECS P43T-AD3, Asus C381GM, Driver(두번째 사용했던 서버 드라이버) file 2016.04.12 2804
126 Server 아파치 캐시 설정 이후 잦은 아파치 자동멈춤 현상 원인분석 3 2016.03.23 2774
125 파이썬 파이썬 datetime 모듈로 초간단 날짜 표현하기 2021.09.11 2714
124 컴퓨터잡담 크롬 캐시파일 삭제방법(Chrome cache file delete) file 2016.11.27 2708
123 컴퓨터잡담 동영상 자르기 프로그램 file 2014.04.14 2704
122 WindowsTip 응용 프로그램 구성 이 올바르지 않기 때문에 이 응용 프로그램 을 시작 하지 못했습니다 2015.02.06 2687
121 [Docs]스프레드시트 구글 스프레드시트 스크립트를 사용하여 지메일로 이메일을 보내기 2023.03.10 2680
120 WindowsTip 윈도우 하드에서 설치하기 2015.02.17 2667
119 컴퓨터잡담 파이썬 자주 발생되는 에러(오류) 대처방법 file 2021.06.05 2663
118 Server innodb_use_sys_malloc to FALSE 2016.08.24 2637
Board Pagination Prev 1 ... 38 39 40 41 42 ... 46 Next
/ 46

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소