"Pandas:DataFrame:데이터에 접근하기"의 두 판 사이의 차이
(새 문서: {{Pandas:DataFrame}} == 개요 == 특정 행, 특정 열에 접근하기 혹은 특정 데이터에 접근하는 방법에 대해 다루는 문서. ===데이터 접근(인덱싱)===...) |
잔글 |
||
(같은 사용자의 중간 판 하나는 보이지 않습니다) | |||
71번째 줄: | 71번째 줄: | ||
| | | | ||
| | | | ||
+ | |} | ||
+ | ===데이터 검색=== | ||
+ | {| class="wikitable" | ||
+ | !의도 | ||
+ | !방법 | ||
+ | !설명 | ||
+ | |- | ||
+ | |인덱스 찾기 | ||
+ | |df[행이름 == 값] | ||
+ | |해당 검색결과에 해당하는 인덱스를 구할 수 있다. | ||
+ | df.열이름/ df.열이름['인덱스'] 형태의 연산도 가능하다. | ||
+ | |- | ||
+ | |조건 추출 | ||
+ | |df = df[df.열이름 >= 100] | ||
+ | |열이름에 해당하는 값이 100 이상인 행을 추출한다. | ||
|} | |} |
2023년 2월 1일 (수) 12:27 기준 최신판
판다스에 관한 정보들을 틀:Pandas:DataFrame을 통해 체계화하여 관리한다.
1 개요편집
특정 행, 특정 열에 접근하기 혹은 특정 데이터에 접근하는 방법에 대해 다루는 문서.
1.1 데이터 접근(인덱싱)편집
의도 | 방법 | 설명 |
---|---|---|
칼럼 접근 | 데이터프레임["열이름"] | ["열1", "열2"] 형태의 리스트로 넣어주면 해당 열들을 선택한다. |
df.열이름 | . 문법으로 바로 접근할 수 있다. | |
행접근 | 데이터프레임.loc["인덱스"] | 데이터프레임.index['인덱스']형태로 접근도 가능하다.
loc을 쓰지 않으면 하위속성(칼럼)에서 해당 속성을 찾는다.(열 선택) |
행접근(정수인덱스) | df.iloc[정수] | 순서에 따른 정수인덱스를 사용할 수 있다. -1 따위의 값을 사용하기 위해선 iloc이 필수! |
특정 데이터 접근 | 데이터프레임['열이름'][숫자] | 열 이름의 '숫자'번째 요소에 접근한다.
한 줄일지라도 시리즈 형태로 반환한다. 그 시리즈에서 하위 속성에 접근하는 방식이다. |
특정 데이터 접근2 | df['열이름']['찾을내용'] | 열을 찾은 후 해당 내용을 찾는다. |
특정 데이터 접근3 | df.loc['행이름']['열이름'] | 행을 찾고 열을 찾는다. |
상위 5개 데이터 확인 | 데이터프레임.head() | |
조건 인덱싱1 | [데이터프레임['열이름'] > 숫자] | 숫자 이상의 값을 가진 값만 추출한다.
이외 == 등의 조건으로 인덱스를 추출할 수 있다. 인덱스가 조건을 통과했는지 여부를 True, False로 보여준다.
|
조건 인덱싱2 | 데이터프레임 = 데이터프레임[데이터프레임['열이름'] | 조건에 맞는 행만 살린다. |
1.2 데이터 검색편집
의도 | 방법 | 설명 |
---|---|---|
인덱스 찾기 | df[행이름 == 값] | 해당 검색결과에 해당하는 인덱스를 구할 수 있다.
df.열이름/ df.열이름['인덱스'] 형태의 연산도 가능하다. |
조건 추출 | df = df[df.열이름 >= 100] | 열이름에 해당하는 값이 100 이상인 행을 추출한다. |