"Pandas:DataFrame:데이터에 접근하기"의 두 판 사이의 차이

Pywiki
둘러보기로 가기 검색하러 가기
(새 문서: {{Pandas:DataFrame}} == 개요 == 특정 행, 특정 열에 접근하기 혹은 특정 데이터에 접근하는 방법에 대해 다루는 문서. ===데이터 접근(인덱싱)===...)
 
잔글
 
(같은 사용자의 중간 판 하나는 보이지 않습니다)
71번째 줄: 71번째 줄:
 
|
 
|
 
|
 
|
 +
|}
 +
===데이터 검색===
 +
{| class="wikitable"
 +
!의도
 +
!방법
 +
!설명
 +
|-
 +
|인덱스 찾기
 +
|df[행이름 == 값]
 +
|해당 검색결과에 해당하는 인덱스를 구할 수 있다.
 +
df.열이름/ df.열이름['인덱스'] 형태의 연산도 가능하다.
 +
|-
 +
|조건 추출
 +
|df = df[df.열이름 >= 100]
 +
|열이름에 해당하는 값이 100 이상인 행을 추출한다.
 
|}
 
|}

2023년 2월 1일 (수) 12:27 기준 최신판

판다스에 관한 정보들을 틀:Pandas:DataFrame을 통해 체계화하여 관리한다.

  1. Pandas:DataFrame:개요
  2. Pandas:DataFrame:구조 파악
    1. Pandas:DataFrame:데이터에 접근하기
  3. Pandas:DataFrame:구조 조작
    1. Pandas:DataFrame:구조 조작. 열 관련
    2. Pandas:DataFrame:데이터 합치기
    3. Pandas:DataFrame:데이터 통계
    4. Pandas:DataFrame:데이터 타입
    5. Pandas:DataFrame:데이터 조작(파생변수)
      1. Pandas:DataFrame:행 연산
  4. Pandas:DataFrame:다른 형태로 저장하고 불러오기
    1. Pandas:DataFrame:DataBase
  5. Pandas:DataFrame:활용
    1. 결측치 다루기:pandas
    2. 이창치 다루기:pandas
  6. Pandas:DataFrame:관련 에러

1 개요[편집 | 원본 편집]

특정 행, 특정 열에 접근하기 혹은 특정 데이터에 접근하는 방법에 대해 다루는 문서.

1.1 데이터 접근(인덱싱)[편집 | 원본 편집]

의도 방법 설명
칼럼 접근 데이터프레임["열이름"] ["열1", "열2"] 형태의 리스트로 넣어주면 해당 열들을 선택한다.
df.열이름 . 문법으로 바로 접근할 수 있다.
행접근 데이터프레임.loc["인덱스"] 데이터프레임.index['인덱스']형태로 접근도 가능하다.

loc을 쓰지 않으면 하위속성(칼럼)에서 해당 속성을 찾는다.(열 선택)

행접근(정수인덱스) df.iloc[정수] 순서에 따른 정수인덱스를 사용할 수 있다. -1 따위의 값을 사용하기 위해선 iloc이 필수!
특정 데이터 접근 데이터프레임['열이름'][숫자] 열 이름의 '숫자'번째 요소에 접근한다.

한 줄일지라도 시리즈 형태로 반환한다.

그 시리즈에서 하위 속성에 접근하는 방식이다.

특정 데이터 접근2 df['열이름']['찾을내용'] 열을 찾은 후 해당 내용을 찾는다.
특정 데이터 접근3 df.loc['행이름']['열이름'] 행을 찾고 열을 찾는다.
상위 5개 데이터 확인 데이터프레임.head()
조건 인덱싱1 [데이터프레임['열이름'] > 숫자] 숫자 이상의 값을 가진 값만 추출한다.

이외 == 등의 조건으로 인덱스를 추출할 수 있다.

인덱스가 조건을 통과했는지 여부를 True, False로 보여준다.


df['열이름']>100 을 하면 이에 해당되는 인덱스를 뱉어낸다. 때문에 df[df['열이름']>100] 형태로 해당하는 데이터를 뽑아낼 수 있다.

조건 인덱싱2 데이터프레임 = 데이터프레임[데이터프레임['열이름'] 조건에 맞는 행만 살린다.

1.2 데이터 검색[편집 | 원본 편집]

의도 방법 설명
인덱스 찾기 df[행이름 == 값] 해당 검색결과에 해당하는 인덱스를 구할 수 있다.

df.열이름/ df.열이름['인덱스'] 형태의 연산도 가능하다.

조건 추출 df = df[df.열이름 >= 100] 열이름에 해당하는 값이 100 이상인 행을 추출한다.