주 메뉴 열기
대문
임의의 문서로
로그인
설정
Pywiki 소개
면책 조항
Pywiki
검색
바뀜
← 이전 편집
Pandas:DataFrame:구조 파악
(편집)
2023년 2월 1일 (수) 12:07 판
877 바이트 추가됨
,
2023년 2월 1일 (수) 12:07
잔글
Sam님이
Pandas:DataFrame:구조파악
문서를
Pandas:DataFrame:구조 파악
문서로 이동했습니다
2번째 줄:
2번째 줄:
{| class="wikitable"
{| class="wikitable"
!의도
!의도
+
!설명
!방법
!방법
|-
|-
−
|df의 전체적인 데이터를
파악한다.
+
|df의 전체적인 데이터를
파악
−
|
객체명
.
describe()
+
|
요약통계
.
−
해당 칼럼의 갯수, 평균, std(standard deviation),
분표별 값 등을
알 수 있다.
+
해당 칼럼의 갯수, 평균, std(standard deviation),
사분위수, 최댓값, 최솟값을
알 수 있다.
+
+
문자에 대한 통계는 나오지 않는데, 옵션에 include='all'을 넣으면 문자에 대한 통계도 볼 수 있다.
+
|df.describe()
+
|-
+
|df의 변수(열)속성을 파악
+
|각 열의 데이터타입과 속한 데이터 갯수, df가 차지하는 메모리를 보여준다.
+
|df.info()
|-
|-
|df 대략적인 구조 파악
|df 대략적인 구조 파악
+
|df의 행과 열 갯수를 반환한다.
+
함수가 아니라 속성.
|df.shape
|df.shape
{| class="wikitable"
{| class="wikitable"
20번째 줄:
30번째 줄:
|df.shape[1]
|df.shape[1]
|}
|}
+
|-
+
|행 갯수
+
|
+
|len(df)
|-
|-
|칼럼목록
|칼럼목록
+
|칼럼목록을 얻는다.
|데이터프레임.columns
|데이터프레임.columns
−
칼럼목록을 얻는다.
|-
|-
|행목록
|행목록
+
|인덱스 목록을 얻는다.
|데이터프레임.index
|데이터프레임.index
−
인덱스 목록을 얻는다.
+
|}
+
+
=== dataframe 전체를 보고 싶을 때 ===
+
{| class="wikitable"
+
!의도
+
!방법
|-
|-
−
|행
갯수
+
|
df가 커지면 중간이 잘리는데, 다음의 옵션으로 전체를 볼 수 있다.
−
|len
(
df
)
+
|pd.set_option('display.max_columns', None) # 모든 열 보기
+
pd.set_option('display.max_rows', None) # 모든
행
보기
+
+
+
pd.set_option('display.max_columns') # 열 관련 설정 되돌리기.
+
+
pd.set_option('display.max_rows') # 행 관련 설정 되돌리기.
+
+
pd.set_option
(
'all'
)
# 모든 설정 되돌리기.
|}
|}
84번째 줄:
112번째 줄:
|-
|-
|인덱스를 데이터화
|인덱스를 데이터화
−
|
데이터프레임
.reset_index
+
|
df = df
.reset_index
|숫자 인덱스가 아닌 경우 사용. 인덱스 목록을 뽑아낼 때의 사전작업.
|숫자 인덱스가 아닌 경우 사용. 인덱스 목록을 뽑아낼 때의 사전작업.
(엑셀에서 불러왔을 때 필요하다.)
(엑셀에서 불러왔을 때 필요하다.)
95번째 줄:
123번째 줄:
|-
|-
|인덱스 이름 바꾸기
|인덱스 이름 바꾸기
−
|데이터프레임.rename(
columns
={'
index
':'신이름'})
+
|데이터프레임.rename(
index
={'
기존이름
':'신이름'})
|
|
|-
|-
Sam
사무관
,
인터페이스 관리자
,
관리자
, 교사
편집
1,408
번