판다스에 관한 정보들을 틀:Pandas:DataFrame을 통해 체계화하여 관리한다.
1 개요편집
특정 행, 특정 열에 접근하기 혹은 특정 데이터에 접근하는 방법에 대해 다루는 문서.
1.1 데이터 접근(인덱싱)편집
의도 | 방법 | 설명 |
---|---|---|
칼럼 접근 | 데이터프레임["열이름"] | ["열1", "열2"] 형태의 리스트로 넣어주면 해당 열들을 선택한다. |
df.열이름 | . 문법으로 바로 접근할 수 있다. | |
행접근 | 데이터프레임.loc["인덱스"] | 데이터프레임.index['인덱스']형태로 접근도 가능하다.
loc을 쓰지 않으면 하위속성(칼럼)에서 해당 속성을 찾는다.(열 선택) |
행접근(정수인덱스) | df.iloc[정수] | 순서에 따른 정수인덱스를 사용할 수 있다. -1 따위의 값을 사용하기 위해선 iloc이 필수! |
특정 데이터 접근 | 데이터프레임['열이름'][숫자] | 열 이름의 '숫자'번째 요소에 접근한다.
한 줄일지라도 시리즈 형태로 반환한다. 그 시리즈에서 하위 속성에 접근하는 방식이다. |
특정 데이터 접근2 | df['열이름']['찾을내용'] | 열을 찾은 후 해당 내용을 찾는다. |
특정 데이터 접근3 | df.loc['행이름']['열이름'] | 행을 찾고 열을 찾는다. |
상위 5개 데이터 확인 | 데이터프레임.head() | |
조건 인덱싱1 | [데이터프레임['열이름'] > 숫자] | 숫자 이상의 값을 가진 값만 추출한다.
이외 == 등의 조건으로 인덱스를 추출할 수 있다. 인덱스가 조건을 통과했는지 여부를 True, False로 보여준다.
|
조건 인덱싱2 | 데이터프레임 = 데이터프레임[데이터프레임['열이름'] | 조건에 맞는 행만 살린다. |
1.2 데이터 검색편집
의도 | 방법 | 설명 |
---|---|---|
인덱스 찾기 | df[행이름 == 값] | 해당 검색결과에 해당하는 인덱스를 구할 수 있다.
df.열이름/ df.열이름['인덱스'] 형태의 연산도 가능하다. |
조건 추출 | df = df[df.열이름 >= 100] | 열이름에 해당하는 값이 100 이상인 행을 추출한다. |