바뀜

둘러보기로 가기 검색하러 가기
1,297 바이트 추가됨 ,  2021년 4월 3일 (토) 16:39
새 문서: == 개요 == 웹사이트를 돌아다닐 때 로그인해야만 접근할 수 있는 페이지가 있다. == 전략 == 필요한 기능 # HTTP 요청하기 # 세션 다루기 # 페...
== 개요 ==
웹사이트를 돌아다닐 때 로그인해야만 접근할 수 있는 페이지가 있다.

== 전략 ==
필요한 기능

# HTTP 요청하기
# 세션 다루기
# 페이지 분석하기

{| class="wikitable"
!과정
!설명
!방법
|-
|사전준비
|작동에 필요한 모듈을 불러오고 변수들을 지정한다.

# 필요한 모듈을 불러온다.
# 로그인에 필요한 정보들을 어떤 변수로 전달할지 입력한다.
# <blockquote>어떤 변수에 전달해야 할지는 개발자도구의 Network > doc 탭에서 정보의 이동을 보아야 한다.</blockquote>
# 요청할 주소를 지정한다.(이 또한 개발자도구로 데이터이동을 살펴 찾는다.)
|<syntaxhighlight lang="python">
import requests # 요청 및 세션 다루기.
from bs4 import BeautifulSoup # HTML페이지 분석

login_info = {"id담는변수":"아이디", # 정보를 담는 변수는 사이트마다 다르다.
"password담는변수":"패스워드"
}

login_url = "http://주소./....php" # 로그인 요청을 보내는 경로를 지정한다.
</syntaxhighlight>
|}

=== 사전준비 ===
<syntaxhighlight lang="python">


session = requests.session() # 세션을 시작한다.

</syntaxhighlight>
[[분류:웹 스크래핑]]

둘러보기 메뉴