1-1. 데이터 다운받기

Sam (토론 | 기여)님의 2021년 4월 3일 (토) 17:09 판 (새 문서: == 개요 == 웹에 올려져 있는 데이터를 다운받아 파일화, 혹은 변수에 올려 사용한다. === urllib를 이용한 방법 === <code>import urllib.request</code>...)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

1 개요

웹에 올려져 있는 데이터를 다운받아 파일화, 혹은 변수에 올려 사용한다.

1.1 urllib를 이용한 방법

import urllib.request 이후에 사용한다.

의도 설명 방법
파일 다운 http://........그림.png 형태의 파일주소를 통해 저장한다. urllib.request.urlretrieve(파일주소, 저장경로)
변수에 올리기 파일을 직접 다운받는 게 아니라 변수에 올려 다룰 수 있다. 변수에 저장한 후, 다음과 같이 저장할 수 있다.
with open(저장경로, mode="wb") as f:
    f.write(변수)
mode의 w는 읽기, b는 바이너리를 의미한다.
변수 = urllib.request.urlopen(파일주소).read()

#urlopen으로 URL리소스를 열고, read로 데이터를 읽는다.

1.2 requests를 이용한 방법

어떤 데이터를 저장하려면 바이너리형태여야 한다. 응답.content를 통해 바이너리 데이터를 다룰 수 있다.

import requests
res = requests.get("http://주소.png")  # 원하는 파일로 요청을 보내고 응답을 받는다.

with open("test.png", "wb") as f:  # 바이너리로 읽기 모드로 연다.
    f.write(res.content)  # 바이너리데이터로 바꾼 데이터를 파일에 쓴다.