Skip to content
컴퓨터잡담
2021.06.02 14:05

파이썬 웹페이지 기업정보 추출하기

조회 수 1823 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬 웹페이지 기업정보 추출하기

 

 
#kisline 주식 기업정보조회
 
import time #time 명령어 사용하기 
from selenium import webdriver #셀레니움 사용하기 
from selenium.webdriver.common.keys import Keys #키보드 입력하기 위한 설정
from bs4 import BeautifulSoup # BeautifulSoup 불러오기

#파이썬 requests 모듈은 간편한 HTTP 요청처리를 위해 사용하는 모듈로 별도로 설치해 주어야 한다.
import requests #pip3 install requests
from bs4 import BeautifulSoup #뷰티풀솝을 사용하기
#driver = webdriver.Chrome()  => 크롬드라이버 실행준비
#print (driver.current_url)  => 크롬창의 url 불러오기
 
#html = requests.get(driver.current_url)
html = requests.get("http://comp.fnguide.com/SVO2/asp/SVD_Invest.asp?pGB=1&gicode=A014530&cID=&MenuYn=Y&ReportGB=&NewMenuID=105&stkGb=701")
bs_html = BeautifulSoup(html.content,"html.parser")
 
#bs의 select 사용법
    #soup.select('태그')
    #soup.select('.클래스명') 혹은 ('태그.클래스명')
    #soup.select('#아이디명') 혹은 ('태그#아이디명')
    #soup.select('태그 > 자식태그')
    #soup.select('태그 자손태그')
 
# id가 headline0인 태그의 자손 중 li 크롤링
    #title = soup.select('#headline0 li')
 
# 원하는 정보가 있는 위치 찾기 
#soup.select('원하는 정보')  # select('원하는 정보') -->  단 하나만 있더라도, 복수 가능한 형태로 되어있음
#soup.select('태그명')
#soup.select('.클래스명')
#soup.select('상위태그명 > 하위태그명 > 하위태그명')
#soup.select('상위태그명.클래스명 > 하위태그명.클래스명')    # 바로 아래의(자식) 태그를 선택시에는 > 기호를 사용
#soup.select('상위태그명.클래스명 하~위태그명')              # 아래의(자손) 태그를 선택시에는   띄어쓰기 사용
#soup.select('상위태그명 > 바로아래태그명 하~위태그명')     
#soup.select('.클래스명')
#soup.select('#아이디명')                  # 태그는 여러개에 사용 가능하나 아이디는 한번만 사용 가능함! ==> 선택하기 좋음
#soup.select('태그명.클래스명)
#soup.select('#아이디명 > 태그명.클래스명)
#soup.select('태그명[속성1=값1]')
 
re_html = bs_html.select("div.corp_group2 dd")
 
per = bs_html.select("div.corp_group2 dd")[1].text
pbr = bs_html.select("div.corp_group2 dd")[7].text
allocation = bs_html.select("div.corp_group2 dd")[9].text
print('PER : 'per)
print('PBR : 'pbr)
print('배당률 : 'allocation)


 

로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
857 컴퓨터잡담 파이썬 한우정액 정보 스프레드로 추출하기 file 2021.06.05 1625
856 Server [아파치 error.log] Fatal Error Unable to reattach to base address file 2016.03.25 1643
855 WindowsTip IE 익스플로러 메뉴 바탕이 검정색으로 변했을경우 대처방법 2 2015.01.27 1644
854 Server XE file cache 활용 2016.08.19 1648
853 Server [Apache] mod_expires .htaccess을 수정하여 브라우저 캐싱하기 2016.03.16 1658
852 WindowsTip 익스플로러 ftp 정상화 시키기 file 2014.12.23 1660
851 [Docs]스프레드시트 스프레드시트의 값의 변화에 따라 지메일로 메일을 보내는 스크립트 2023.03.10 1661
850 컴퓨터잡담 파이썬 리스트에 데이터 삽입하기 2021.06.22 1707
849 Server 서버 부하상태 체크 file 2016.04.30 1709
848 파이썬 키움증권 OpenAPI 당황스러움 file 2021.09.06 1749
847 컴퓨터잡담 KM Wakeup 절전모드 예약 및 깨우는 프로그램 file 2021.07.08 1763
846 WindowsTip 윈도우 XP SP3 와 Windows 8.1 두가지 부팅 메뉴얼 file 2015.02.11 1768
845 WindowsTip 컴퓨터가 많이 느리다면? 2015.01.08 1777
844 컴퓨터잡담 파이썬 사이트 정보 가져와서 필요한 내용 추출하기 2021.05.31 1779
843 Server Apache에 대한 mod_proxy 지원 구성 2016.09.06 1801
842 Server xe 타이틀 게시판 이름 없애기 file 2016.06.28 1803
841 [Docs]스프레드시트 스프레드시트에서 수정, 삭제 버튼 만들기 2023.03.09 1821
840 WindowsTip 윈도우 빠른종료 팁 file 2014.12.27 1823
» 컴퓨터잡담 파이썬 웹페이지 기업정보 추출하기 2021.06.02 1823
838 WindowsTip usb 쓰기가 금지되어 있습니다 해제방법 file 2015.01.22 1827
Board Pagination Prev 1 2 3 4 5 6 ... 46 Next
/ 46

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소