96번째 줄: |
96번째 줄: |
| </syntaxhighlight> | | </syntaxhighlight> |
| |} | | |} |
| + | |
| + | = HTML = |
| + | 웹문서에서 읽어온 데이터를 바로 dataframe화 하는 경우도 필요하다. |
| + | {| class="wikitable" |
| + | ! 의도 |
| + | !방법 |
| + | !설명 |
| + | |- |
| + | |데이터 불러오기 |
| + | |객체 = pandas.read_html('''h<nowiki/>t<nowiki/>ml 문서''')'''<nowiki/><nowiki/><nowiki/><nowiki/><nowiki/><nowiki/><nowiki/><nowiki/><nowiki/><nowiki/>''' |
| + | |'''<nowiki/>'''html 문서의 데이터타입은 str이어야 한다. requests 등으로 웹문서를 불러와 변환해 넣으면 된다.'''<nowiki/><nowiki/><nowiki/>''' |
| + | |}표형 데이터는 쉽게 가져올 수 있다.<syntaxhighlight lang="python"> |
| + | page = requests.get(url) |
| + | tables = pd.read_html(page.text) |
| + | </syntaxhighlight> [굳이 .text 속성에 접근해야 하네;;? 그냥 객체와 text속성은 어떻게 다른지 보자.] |
| + | |
| + | 여러 테이블이 있는 경우, 데이터프레임이 들어있는 리스트로 반환된다. |
| = mysql = | | = mysql = |
| 데이터프레임을 SQL에 저장하기. | | 데이터프레임을 SQL에 저장하기. |