"Pandas:DataFrame:데이터 타입"의 두 판 사이의 차이

잔글
 
(같은 사용자의 중간 판 하나는 보이지 않습니다)
56번째 줄: 56번째 줄:
 
|}
 
|}
  
== 타입에 따른 각종 함수 ==
+
===데이터 형식===
 +
[다양한 형식이 있을 텐데.. 찾아 조금 채워보자.]
 +
{| class="wikitable"
 +
!의도
 +
!방법
 +
!설명
 +
|-
 +
|시계열 데이터로
 +
|df.index = pd.to_datetime(df.index)
 +
|20200322와 같은 숫자는 그냥 문자열로 취급된다. 이를 시계열로 인식되게 하려면 데이터 변환을 해주어야 한다.
 +
|-
 +
|숫자형데이터
 +
|df['열이름'] = pd.to_numeric(df['열이름'])
 +
|해당 데이터가 숫자임을 알려주는 것.
 +
|}
 +
= 타입에 따른 각종 함수 =
 +
 
 +
== 시계열 데이터 ==
 
datetime 객체의 경우, df['열이름'].dt.year 처럼 해당 데이터에서 년도를 뽑아낼 수 있다.
 
datetime 객체의 경우, df['열이름'].dt.year 처럼 해당 데이터에서 년도를 뽑아낼 수 있다.
 +
{| class="wikitable"
 +
!의도
 +
!방법
 +
|-
 +
|시계열의 연도
 +
|df.dt.year
 +
|-
 +
|달
 +
|df.dt.month
 +
|-
 +
|일
 +
|df.dt.day
 +
|}
 
[[분류:Pandas:DataFrame]]
 
[[분류:Pandas:DataFrame]]

2023년 2월 1일 (수) 22:39 기준 최신판

판다스에 관한 정보들을 틀:Pandas:DataFrame을 통해 체계화하여 관리한다.

  1. Pandas:DataFrame:개요
  2. Pandas:DataFrame:구조 파악
    1. Pandas:DataFrame:데이터에 접근하기
  3. Pandas:DataFrame:구조 조작
    1. Pandas:DataFrame:구조 조작. 열 관련
    2. Pandas:DataFrame:데이터 합치기
    3. Pandas:DataFrame:데이터 통계
    4. Pandas:DataFrame:데이터 타입
    5. Pandas:DataFrame:데이터 조작(파생변수)
      1. Pandas:DataFrame:행 연산
  4. Pandas:DataFrame:다른 형태로 저장하고 불러오기
    1. Pandas:DataFrame:DataBase
  5. Pandas:DataFrame:활용
    1. 결측치 다루기:pandas
    2. 이창치 다루기:pandas
  6. Pandas:DataFrame:관련 에러

1 개요편집

특정한 데이터 타입으로 다루어야 할 때.

1.1 타입 관련편집

의도 방법 설명
데이터 타입 파악 print(df.dtypes) 각 행별로 데이터타입을 알 수 있다.
내부요소 타입 바꾸기
의도 방법
전체 타입 일괄변환 데이터프레임 = 데이터프레임.astype('타입')
특정렬 변환 데이터프레임.astype({'열이름:'타입'})
날짜데이터 변환 df.to_datetime(df['열이름']) 텍스트형태로 들어온 데이터를 날짜형식으로 바꿔준다.

2 타입편집

타입 설명 방법
시계열 객체로 변환 특정 데이터를 시계열객체로 변환한다. df['열이름'] = pd.to_datetime(df['열이름'])
특정 기간으로 압축 특정 기간에 대한 형태로 압축한다.

datetime 변수에 대해서만 가능하다.

df = df.to_period(freq='D')  # 1일 단위로 남기고 하위 데이터는 지운다.
df = df.to_period(freq='M')  # 1달 단위로 남기고 하위 데이터는 지운다.
df = df.to_period(freq='A')  # 1년 단위로 남기고 하위 데이터는 지운다.

2.1 데이터 형식편집

[다양한 형식이 있을 텐데.. 찾아 조금 채워보자.]

의도 방법 설명
시계열 데이터로 df.index = pd.to_datetime(df.index) 20200322와 같은 숫자는 그냥 문자열로 취급된다. 이를 시계열로 인식되게 하려면 데이터 변환을 해주어야 한다.
숫자형데이터 df['열이름'] = pd.to_numeric(df['열이름']) 해당 데이터가 숫자임을 알려주는 것.

3 타입에 따른 각종 함수편집

3.1 시계열 데이터편집

datetime 객체의 경우, df['열이름'].dt.year 처럼 해당 데이터에서 년도를 뽑아낼 수 있다.

의도 방법
시계열의 연도 df.dt.year
df.dt.month
df.dt.day