바뀜
둘러보기로 가기
검색하러 가기
← 이전 편집
Pandas:DataFrame:데이터 타입
(편집)
2023년 2월 1일 (수) 22:39 판
1,175 바이트 추가됨
,
2023년 2월 1일 (수) 22:39
→타입 관련
1번째 줄:
1번째 줄:
+
{{Pandas:DataFrame}}
+
== 개요 ==
== 개요 ==
특정한 데이터 타입으로 다루어야 할 때.
특정한 데이터 타입으로 다루어야 할 때.
+
===타입 관련===
+
{| class="wikitable"
+
!의도
+
!방법
+
!설명
+
|-
+
|데이터 타입 파악
+
|print(df.dtypes)
+
|각 행별로 데이터타입을 알 수 있다.
+
|-
+
|내부요소 타입 바꾸기
+
|
+
{| class="wikitable"
+
!의도
+
!방법
+
|-
+
|전체 타입 일괄변환
+
|데이터프레임 = 데이터프레임.astype('타입')
+
|-
+
|특정렬 변환
+
|데이터프레임.astype({'열이름:'타입'})
+
|}
+
|
+
|-
+
|날짜데이터 변환
+
|df.to_datetime(df['열이름'])
+
|텍스트형태로 들어온 데이터를 날짜형식으로 바꿔준다.
+
|}
== 타입 ==
== 타입 ==
{| class="wikitable"
{| class="wikitable"
26번째 줄:
56번째 줄:
|}
|}
−
== 타입에 따른 각종 함수 ==
+
=
==데이터 형식===
+
[다양한 형식이 있을 텐데.. 찾아 조금 채워보자.]
+
{| class="wikitable"
+
!의도
+
!방법
+
!설명
+
|-
+
|시계열 데이터로
+
|df.index = pd.to_datetime(df.index)
+
|20200322와 같은 숫자는 그냥 문자열로 취급된다. 이를 시계열로 인식되게 하려면 데이터 변환을 해주어야 한다.
+
|-
+
|숫자형데이터
+
|df['열이름'] = pd.to_numeric(df['열이름'])
+
|해당 데이터가 숫자임을 알려주는 것.
+
|}
+
= 타입에 따른 각종 함수
=
+
+
== 시계열 데이터
==
datetime 객체의 경우, df['열이름'].dt.year 처럼 해당 데이터에서 년도를 뽑아낼 수 있다.
datetime 객체의 경우, df['열이름'].dt.year 처럼 해당 데이터에서 년도를 뽑아낼 수 있다.
+
{| class="wikitable"
+
!의도
+
!방법
+
|-
+
|시계열의 연도
+
|df.dt.year
+
|-
+
|달
+
|df.dt.month
+
|-
+
|일
+
|df.dt.day
+
|}
[[분류:Pandas:DataFrame]]
[[분류:Pandas:DataFrame]]
Sam
사무관
,
인터페이스 관리자
,
관리자
, 교사
편집
1,408
번
둘러보기 메뉴
개인 도구
로그인하지 않음
토론
기여
계정 만들기
로그인
이름공간
문서
토론
변수
보기
읽기
편집
원본 편집
역사 보기
더 보기
검색
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
도구
특수 문서 목록
인쇄용 판