Skip to content
컴퓨터잡담
2021.06.02 14:05

파이썬 웹페이지 기업정보 추출하기

조회 수 1825 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬 웹페이지 기업정보 추출하기

 

 
#kisline 주식 기업정보조회
 
import time #time 명령어 사용하기 
from selenium import webdriver #셀레니움 사용하기 
from selenium.webdriver.common.keys import Keys #키보드 입력하기 위한 설정
from bs4 import BeautifulSoup # BeautifulSoup 불러오기

#파이썬 requests 모듈은 간편한 HTTP 요청처리를 위해 사용하는 모듈로 별도로 설치해 주어야 한다.
import requests #pip3 install requests
from bs4 import BeautifulSoup #뷰티풀솝을 사용하기
#driver = webdriver.Chrome()  => 크롬드라이버 실행준비
#print (driver.current_url)  => 크롬창의 url 불러오기
 
#html = requests.get(driver.current_url)
html = requests.get("http://comp.fnguide.com/SVO2/asp/SVD_Invest.asp?pGB=1&gicode=A014530&cID=&MenuYn=Y&ReportGB=&NewMenuID=105&stkGb=701")
bs_html = BeautifulSoup(html.content,"html.parser")
 
#bs의 select 사용법
    #soup.select('태그')
    #soup.select('.클래스명') 혹은 ('태그.클래스명')
    #soup.select('#아이디명') 혹은 ('태그#아이디명')
    #soup.select('태그 > 자식태그')
    #soup.select('태그 자손태그')
 
# id가 headline0인 태그의 자손 중 li 크롤링
    #title = soup.select('#headline0 li')
 
# 원하는 정보가 있는 위치 찾기 
#soup.select('원하는 정보')  # select('원하는 정보') -->  단 하나만 있더라도, 복수 가능한 형태로 되어있음
#soup.select('태그명')
#soup.select('.클래스명')
#soup.select('상위태그명 > 하위태그명 > 하위태그명')
#soup.select('상위태그명.클래스명 > 하위태그명.클래스명')    # 바로 아래의(자식) 태그를 선택시에는 > 기호를 사용
#soup.select('상위태그명.클래스명 하~위태그명')              # 아래의(자손) 태그를 선택시에는   띄어쓰기 사용
#soup.select('상위태그명 > 바로아래태그명 하~위태그명')     
#soup.select('.클래스명')
#soup.select('#아이디명')                  # 태그는 여러개에 사용 가능하나 아이디는 한번만 사용 가능함! ==> 선택하기 좋음
#soup.select('태그명.클래스명)
#soup.select('#아이디명 > 태그명.클래스명)
#soup.select('태그명[속성1=값1]')
 
re_html = bs_html.select("div.corp_group2 dd")
 
per = bs_html.select("div.corp_group2 dd")[1].text
pbr = bs_html.select("div.corp_group2 dd")[7].text
allocation = bs_html.select("div.corp_group2 dd")[9].text
print('PER : 'per)
print('PBR : 'pbr)
print('배당률 : 'allocation)


 

로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
77 WindowsTip 윈도우 빠른종료 팁 file 2014.12.27 1824
76 Server xe 타이틀 게시판 이름 없애기 file 2016.06.28 1822
75 Server Apache에 대한 mod_proxy 지원 구성 2016.09.06 1801
74 컴퓨터잡담 KM Wakeup 절전모드 예약 및 깨우는 프로그램 file 2021.07.08 1784
73 컴퓨터잡담 파이썬 사이트 정보 가져와서 필요한 내용 추출하기 2021.05.31 1780
72 WindowsTip 컴퓨터가 많이 느리다면? 2015.01.08 1777
71 파이썬 키움증권 OpenAPI 당황스러움 file 2021.09.06 1769
70 WindowsTip 윈도우 XP SP3 와 Windows 8.1 두가지 부팅 메뉴얼 file 2015.02.11 1768
69 Server 서버 부하상태 체크 file 2016.04.30 1711
68 컴퓨터잡담 파이썬 리스트에 데이터 삽입하기 2021.06.22 1707
67 [Docs]스프레드시트 스프레드시트의 값의 변화에 따라 지메일로 메일을 보내는 스크립트 2023.03.10 1669
66 WindowsTip 익스플로러 ftp 정상화 시키기 file 2014.12.23 1660
65 Server [Apache] mod_expires .htaccess을 수정하여 브라우저 캐싱하기 2016.03.16 1658
64 Server XE file cache 활용 2016.08.19 1648
63 Server [아파치 error.log] Fatal Error Unable to reattach to base address file 2016.03.25 1645
62 WindowsTip IE 익스플로러 메뉴 바탕이 검정색으로 변했을경우 대처방법 2 2015.01.27 1644
61 컴퓨터잡담 파이썬 멀티라벨 소스 줄이기 2021.06.23 1634
60 컴퓨터잡담 파이썬 한우정액 정보 스프레드로 추출하기 file 2021.06.05 1625
59 컴퓨터잡담 Python 파일을 exe파일로 컴파일하기 2021.06.16 1611
58 컴퓨터잡담 [python] 윈도우 파이썬 모듈 설치 방법 (특정프로그램 설치 없이 기본프로그램 활용) 2021.09.02 1594
Board Pagination Prev 1 ... 41 42 43 44 45 46 Next
/ 46

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소