바뀜

둘러보기로 가기 검색하러 가기
잔글
96번째 줄: 96번째 줄:  
</syntaxhighlight>
 
</syntaxhighlight>
 
|}
 
|}
 +
 +
= HTML =
 +
웹문서에서 읽어온 데이터를 바로 dataframe화 하는 경우도 필요하다.
 +
{| class="wikitable"
 +
! 의도
 +
!방법
 +
!설명
 +
|-
 +
|데이터 불러오기
 +
|객체 = pandas.read_html('''h<nowiki/>t<nowiki/>ml 문서''')'''<nowiki/><nowiki/><nowiki/><nowiki/><nowiki/><nowiki/><nowiki/><nowiki/><nowiki/><nowiki/>'''
 +
|'''<nowiki/>'''html 문서의 데이터타입은 str이어야 한다. requests 등으로 웹문서를 불러와 변환해 넣으면 된다.'''<nowiki/><nowiki/><nowiki/>'''
 +
|}표형 데이터는 쉽게 가져올 수 있다.<syntaxhighlight lang="python">
 +
page = requests.get(url)
 +
tables = pd.read_html(page.text)
 +
</syntaxhighlight>  [굳이 .text 속성에 접근해야 하네;;? 그냥 객체와 text속성은 어떻게 다른지 보자.]
 +
 +
여러 테이블이 있는 경우, 데이터프레임이 들어있는 리스트로 반환된다.
 
= mysql =
 
= mysql =
 
데이터프레임을 SQL에 저장하기.
 
데이터프레임을 SQL에 저장하기.

둘러보기 메뉴