"Pandas:DataFrame:구조 조작"의 두 판 사이의 차이

Pywiki
둘러보기로 가기 검색하러 가기
8번째 줄: 8번째 줄:
 
</syntaxhighlight>
 
</syntaxhighlight>
  
 +
== 붙이기 ==
 +
[아직 완성하지 않음;;;]
 +
{| class="wikitable"
 +
!의도
 +
!설명
 +
!방법
 +
|-
 +
|위아래로 붙이기
 +
|두 df를 아래로 이어붙이기.
 +
df 목록은 리스트로 준다.
 +
|df = pd.concat([df, df2])
 +
|-
 +
|옆으로 붙이기
 +
|
 +
|df = pd.concat([df, df2], axis=1)
 +
|-
 +
|기존 인덱스 무시하고 붙이기
 +
|
 +
|concat에 <code>ignore_index=True</code> 옵션을 준다.
 +
|}
 
== 행 선택 ==
 
== 행 선택 ==
 
{| class="wikitable"
 
{| class="wikitable"

2022년 2월 18일 (금) 16:34 판

1 개요

데이터의 전체 구조를 조작하는 방법에 대해.

2 자르기

데이터프레임을 df[:숫자] 형태로 자르고 나면, 인덱스가 그대로 남는다. 이 인덱스를 초기화하기 위해선 다음과 같이 진행한다.

df.reset_index(inplace=True, drop=True)  # drop을 안하면 기존 인덱스가 새로운 열로 남는다.

3 붙이기

[아직 완성하지 않음;;;]

의도 설명 방법
위아래로 붙이기 두 df를 아래로 이어붙이기.

df 목록은 리스트로 준다.

df = pd.concat([df, df2])
옆으로 붙이기 df = pd.concat([df, df2], axis=1)
기존 인덱스 무시하고 붙이기 concat에 ignore_index=True 옵션을 준다.

4 행 선택

의도 설명 방법
인덱스로 선택 인덱스가 순차적인 데이터인 경우. df.loc[시작인덱스:끝인덱스]
순서로 선택 인덱스가 아닌, df의 순서로 선택할 경우. df.iloc[시작번호:끝번호]