바뀜

둘러보기로 가기 검색하러 가기
577 바이트 추가됨 ,  2023년 2월 1일 (수) 11:41
편집 요약 없음
2번째 줄: 2번째 줄:  
{| class="wikitable"
 
{| class="wikitable"
 
!의도
 
!의도
 +
!설명
 
!방법
 
!방법
 
|-
 
|-
|df의 전체적인 데이터를 파악한다.
+
|df의 전체적인 데이터를 파악
|객체명.describe()
+
|요약통계.
해당 칼럼의 갯수, 평균, std(standard deviation), 분표별 값 등을 알 수 있다.
+
해당 칼럼의 갯수, 평균, std(standard deviation), 사분위수, 최댓값, 최솟값을 알 수 있다.
 +
 
 +
문자에 대한 통계는 나오지 않는데, 옵션에 include='all'을 넣으면 문자에 대한 통계도 볼 수 있다.
 +
|df.describe()
 +
|-
 +
|df의 변수(열)속성을 파악
 +
|각 열의 데이터타입과 속한 데이터 갯수, df가 차지하는 메모리를 보여준다.
 +
|df.info()
 
|-
 
|-
 
|df 대략적인 구조 파악
 
|df 대략적인 구조 파악
 +
|df의 행과 열 갯수를 반환한다.
 +
함수가 아니라 속성.
 
|df.shape
 
|df.shape
 
{| class="wikitable"
 
{| class="wikitable"
20번째 줄: 30번째 줄:  
|df.shape[1]
 
|df.shape[1]
 
|}
 
|}
 +
|-
 +
|행 갯수
 +
|
 +
|len(df)
 
|-
 
|-
 
|칼럼목록
 
|칼럼목록
 +
|칼럼목록을 얻는다.
 
|데이터프레임.columns
 
|데이터프레임.columns
칼럼목록을 얻는다.
   
|-
 
|-
 
|행목록
 
|행목록
 +
|인덱스 목록을 얻는다.
 
|데이터프레임.index
 
|데이터프레임.index
인덱스 목록을 얻는다.
  −
|-
  −
|행 갯수
  −
|len(df)
   
|}
 
|}
   41번째 줄: 52번째 줄:  
|pd.set_option('display.max_columns', None)  # 모든 열 보기
 
|pd.set_option('display.max_columns', None)  # 모든 열 보기
 
pd.set_option('display.max_rows', None)  # 모든 행 보기
 
pd.set_option('display.max_rows', None)  # 모든 행 보기
 +
 +
 +
pd.set_option('display.max_columns')  # 열 관련 설정 되돌리기.
 +
 +
pd.set_option('display.max_rows')  # 행 관련 설정 되돌리기.
 +
 +
pd.set_option('all')  # 모든 설정 되돌리기.
 
|}
 
|}
  

둘러보기 메뉴