2. 로그인하기
둘러보기로 가기
검색하러 가기
1 개요
웹사이트를 돌아다닐 때 로그인해야만 접근할 수 있는 페이지가 있다.
2 전략
필요한 기능
- HTTP 요청하기
- 세션 다루기
- 페이지 분석하기
과정 | 설명 | 방법 |
---|---|---|
준비 | 작동에 필요한 모듈을 불러오고 변수들을 지정한다.
|
import requests # 요청 및 세션 다루기.
from bs4 import BeautifulSoup # HTML페이지 분석
login_info = {"id담는변수":"아이디", # 정보를 담는 변수는 사이트마다 다르다.
"password담는변수":"패스워드"
}
login_url = "http://주소./....php" # 로그인 요청을 보내는 경로를 지정한다.
|
로그인요청 | 세션을 시작하고 페이지에 요청을 보낸다. 위 정보들을 토대로 진행한다. | session = requests.session() # 세션을 시작한다.
res = session.post(login_url, data=login_info) # 위에서 작성한 내용을 Post 방식으로 요청하고 응답받는다.
res.raise_for_statue() # 오류가 발생하면 에러를 반환하게 한다.
|
세션이용 | 위에서 로그인된 상태를 이용하여 필요한 정보를 얻는다. | url = "http://주소"
res = session.get(url) # url로 get 요청을 보낸 후 응답을 받는다.
res.raise_for_status() # 오류가 발생하면 에러를 일으킨다.
soup = BeautifulSoup(res.text, "html.parser") # 필요에 따라 페이지를 분석한다.
|