1,454 바이트 추가됨
, 2021년 4월 3일 (토) 17:09
== 개요 ==
웹에 올려져 있는 데이터를 다운받아 파일화, 혹은 변수에 올려 사용한다.
=== urllib를 이용한 방법 ===
<code>import urllib.request</code> 이후에 사용한다.
{| class="wikitable"
!의도
!설명
!방법
|-
|파일 다운
|<nowiki>http://........그림.png</nowiki> 형태의 파일주소를 통해 저장한다.
|urllib.request.urlretrieve(파일주소, 저장경로)
|-
|변수에 올리기
|파일을 직접 다운받는 게 아니라 변수에 올려 다룰 수 있다. 변수에 저장한 후, 다음과 같이 저장할 수 있다.<syntaxhighlight lang="python">
with open(저장경로, mode="wb") as f:
f.write(변수)
</syntaxhighlight>mode의 w는 읽기, b는 바이너리를 의미한다.
|변수 = urllib.request.urlopen(파일주소).read()
<nowiki>#</nowiki>urlopen으로 URL리소스를 열고, read로 데이터를 읽는다.
|}
=== requests를 이용한 방법 ===
어떤 데이터를 저장하려면 바이너리형태여야 한다. <code>응답.content</code>를 통해 바이너리 데이터를 다룰 수 있다.<syntaxhighlight lang="python">
import requests
res = requests.get("http://주소.png") # 원하는 파일로 요청을 보내고 응답을 받는다.
with open("test.png", "wb") as f: # 바이너리로 읽기 모드로 연다.
f.write(res.content) # 바이너리데이터로 바꾼 데이터를 파일에 쓴다.
</syntaxhighlight>
[[분류:웹 스크래핑]]