Pandas:DataFrame:개요

Sam (토론 | 기여)님의 2023년 2월 1일 (수) 13:01 판
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

판다스에 관한 정보들을 틀:Pandas:DataFrame을 통해 체계화하여 관리한다.

  1. Pandas:DataFrame:개요
  2. Pandas:DataFrame:구조 파악
    1. Pandas:DataFrame:데이터에 접근하기
  3. Pandas:DataFrame:구조 조작
    1. Pandas:DataFrame:구조 조작. 열 관련
    2. Pandas:DataFrame:데이터 합치기
    3. Pandas:DataFrame:데이터 통계
    4. Pandas:DataFrame:데이터 타입
    5. Pandas:DataFrame:데이터 조작(파생변수)
      1. Pandas:DataFrame:행 연산
  4. Pandas:DataFrame:다른 형태로 저장하고 불러오기
    1. Pandas:DataFrame:DataBase
  5. Pandas:DataFrame:활용
    1. 결측치 다루기:pandas
    2. 이창치 다루기:pandas
  6. Pandas:DataFrame:관련 에러

1 개요

2차원 구조의 데이터를 다루기 위한 도구. 데이터프레임에 대한 정보만 해도 굉장히 방대하다.

1.1 요약

다양한 기능을 가진 데이터프레임. 아래와 같이 요약본을 참고하기도 한다.

https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf

1.2 공식

http://pandas.pydata.org/docs/

2 사용

2.1 선언법

의도 설명 방법
사전으로 만들기 key를 열로 한다. 아래의 방식을 참고하자. df= pd.DataFrame(사전)
리스트로 선언하기
  • 각 열별로 리스트 데이터를 입력하거나,(결국 사전형태의 입력)
  • 2차원 리스트로 입력하거나.
데이터프레임 = pd.DataFrame({'열이름1':[1,2,3,4,5]
                '열이름2':[6,7,8,9,10]
                '열이름3':[10,9,8,7,6]
            index = 리스트 })
2차원 리스트를 매개변수로 전달해 선언한다.
데이터프레임 = pd.DataFrame([
    [1,2,3],
    [4,5,6],
    [7,8,9],
    ...
    ])
각자의 열은 시리즈 객체로 존재한다. index옵션은 없어도 된다.