52번째 줄: |
52번째 줄: |
| |} | | |} |
| | | |
| + | = 한 단계 더 나아가기 = |
| + | 최근엔 자바스크립트 등으로 로그인을 처리해서 실제 웹브라우저를 사용해야만 로그인되는 경우가 많다. 자바스크립트로 데이터를 가져오는 경우, request모듈 등으로 데이터를 추출할 수 없다. |
| + | |
| + | 이처럼 HTML외의 기능으로 정보를 불러오는 경우, 웹브라우저를 이용해야 하는데, 다행히 웹브라우저를 조작하는 방법이 마련되어 있다. |
| + | |
| + | === 준비물 === |
| + | Selenium : 웹 어플리케이션 테스트를 자동화 할 때 사용. 자동으로 URL을 열거나 클릭, 스크롤, 문자입력 등의 행동을 자동화할 수 있다. |
| + | |
| + | PhantomJS : 명령줄에서 사용하는 웹 브라우저. |
| [[분류:웹 스크래핑]] | | [[분류:웹 스크래핑]] |