Skip to content
컴퓨터잡담
2021.06.02 14:05

파이썬 웹페이지 기업정보 추출하기

조회 수 1826 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

파이썬 웹페이지 기업정보 추출하기

 

 
#kisline 주식 기업정보조회
 
import time #time 명령어 사용하기 
from selenium import webdriver #셀레니움 사용하기 
from selenium.webdriver.common.keys import Keys #키보드 입력하기 위한 설정
from bs4 import BeautifulSoup # BeautifulSoup 불러오기

#파이썬 requests 모듈은 간편한 HTTP 요청처리를 위해 사용하는 모듈로 별도로 설치해 주어야 한다.
import requests #pip3 install requests
from bs4 import BeautifulSoup #뷰티풀솝을 사용하기
#driver = webdriver.Chrome()  => 크롬드라이버 실행준비
#print (driver.current_url)  => 크롬창의 url 불러오기
 
#html = requests.get(driver.current_url)
html = requests.get("http://comp.fnguide.com/SVO2/asp/SVD_Invest.asp?pGB=1&gicode=A014530&cID=&MenuYn=Y&ReportGB=&NewMenuID=105&stkGb=701")
bs_html = BeautifulSoup(html.content,"html.parser")
 
#bs의 select 사용법
    #soup.select('태그')
    #soup.select('.클래스명') 혹은 ('태그.클래스명')
    #soup.select('#아이디명') 혹은 ('태그#아이디명')
    #soup.select('태그 > 자식태그')
    #soup.select('태그 자손태그')
 
# id가 headline0인 태그의 자손 중 li 크롤링
    #title = soup.select('#headline0 li')
 
# 원하는 정보가 있는 위치 찾기 
#soup.select('원하는 정보')  # select('원하는 정보') -->  단 하나만 있더라도, 복수 가능한 형태로 되어있음
#soup.select('태그명')
#soup.select('.클래스명')
#soup.select('상위태그명 > 하위태그명 > 하위태그명')
#soup.select('상위태그명.클래스명 > 하위태그명.클래스명')    # 바로 아래의(자식) 태그를 선택시에는 > 기호를 사용
#soup.select('상위태그명.클래스명 하~위태그명')              # 아래의(자손) 태그를 선택시에는   띄어쓰기 사용
#soup.select('상위태그명 > 바로아래태그명 하~위태그명')     
#soup.select('.클래스명')
#soup.select('#아이디명')                  # 태그는 여러개에 사용 가능하나 아이디는 한번만 사용 가능함! ==> 선택하기 좋음
#soup.select('태그명.클래스명)
#soup.select('#아이디명 > 태그명.클래스명)
#soup.select('태그명[속성1=값1]')
 
re_html = bs_html.select("div.corp_group2 dd")
 
per = bs_html.select("div.corp_group2 dd")[1].text
pbr = bs_html.select("div.corp_group2 dd")[7].text
allocation = bs_html.select("div.corp_group2 dd")[9].text
print('PER : 'per)
print('PBR : 'pbr)
print('배당률 : 'allocation)


 

로그인 후 댓글쓰기가 가능합니다.

?

List of Articles
번호 분류 제목 날짜 조회 수
20 주식 3분기 한국내화 선광 문배철강 한국주철관 화성밸브 손익계산서 file 2017.11.15 6157
19 Server ECS P43T-AD3, Asus C381GM, Driver(두번째 사용했던 서버 드라이버) file 2016.04.12 2828
18 유용한상식 LG G3 무한부팅 배터리 구매방법 file 2017.05.06 4065
17 유용한상식 MP3 초간단 무료로 다운로드 받기 file 2016.04.30 1436
16 주식 게임처럼 주식투자하기 - 젠트로 #3 file 2009.08.17 8525
15 유용한상식 고위공직자 병역면제 비율 일반인의 33배 그럴 수 있지 file 2016.09.11 1649
14 연예정보 디마프 고현정 조인성 file 2016.04.29 21601
13 연예정보 박병호 2호 홈런에 3호 홈런 기대된다 file 2016.04.17 958
12 회로도전자부품 아이노트 FS-PB100SQ 보조배터리 퀵차지3.0 보조배터리 2019.07.20 6584
11 일상 저작권법 때문에 MP3가 무료화 될 수밖에 없는 이유 3 2009.07.25 22971
10 연예정보 차홍 마리텔 MLT-30 재도약 file 2016.06.19 3401
9 연예정보 최두호 VS 타바레스 UFC 하이라이트 경기모음 1 file 2016.07.10 7536
8 컴퓨터잡담 파이썬 Beautifulsoup html의 특정 주소만 가져오기 file 2021.06.14 2989
7 컴퓨터잡담 파이썬 for문으로 자동변수 생성하기 2021.06.24 3804
6 컴퓨터잡담 파이썬 게시물 검색으로 새로운 게시물 등록시 지메일로 파일 보내기 2021.06.14 2062
5 컴퓨터잡담 파이썬 사이트 정보 가져와서 필요한 내용 추출하기 2021.05.31 1781
» 컴퓨터잡담 파이썬 웹페이지 기업정보 추출하기 2021.06.02 1826
3 컴퓨터잡담 파이썬 한우정액 정보 스프레드로 추출하기 file 2021.06.05 1628
2 컴퓨터잡담 파이썬으로 네이버 증권정보 추출하기 2021.06.05 1877
1 연예정보 한강의 채식주의자 내용 file 2016.05.18 13814
Board Pagination Prev 1 Next
/ 1

http://urin79.com

우린친구블로그

sketchbook5, 스케치북5

sketchbook5, 스케치북5

나눔글꼴 설치 안내


이 PC에는 나눔글꼴이 설치되어 있지 않습니다.

이 사이트를 나눔글꼴로 보기 위해서는
나눔글꼴을 설치해야 합니다.

설치 취소