2022년 11월 1일 (화) 14:54 판

1 개요

dataframe의 평균, 합을 구한다든가 특정 연산을 수행해야 할 때가 있다. for문으로 일일이 할 수도 있지만, 효율이 그닥 좋진 않다.

의도	설명	방법
행 평균 구하기	각 행 방향의 평균 구하기	df.mean(axis=1)
열 평균 구하기	각 열에 대한 평균을 구한다.	df.mean(axis=0)
특정 열 평균 구하기		df["열이름"].mean(axis=0)
특정 행의 특정 열에 대한 평균만 구하기	특정 행의 특정 데이터만 연산해서 새로운 열을 추가한다.	df['mean'] = df[['start', 'high', 'low', 'close']].mean(axis=1)

이외 다양한 함수를 제공하는데, 공식문서를 참고하자.

왜도 구하기. df.skew()

첨도 구하기. df.kurtosis()

의도

설명

방법

순위 구하기

ascending은 점수가 낮을 때 상위.

df.rank(method='옵션', ascending=False)

의도	설명	방법
특정 행 사이를 if연산	간단하게 하려면 numpy가 필요하다. 다중조건인 경우 &으로 연결한다.	df['over_5unit'] = np.where(df['1unit']>df['5unit'], True값, False값) # 1unit 행의 값이 5unit 행의 값보다 큰 때에만 True값을 넣는다.

@@ 58번째 줄: / 58번째 줄: @@
 이외 다양한 함수를 제공하는데, 공식문서를 참고하자.
-=== 분산 구하기 ===
+왜도 구하기. df.skew()
+첨도 구하기. df.kurtosis()
+== 행별 연산 ==
 {| class="wikitable"
 !의도
@@ 64번째 줄: / 68번째 줄: @@
 !방법
 |-
-|
+|순위 구하기
-|
+|ascending은 점수가 낮을 때 상위.
-|
+{| class="wikitable"
+|+method 옵션
+!옵션
+!설명
+|-
+|average
+|동점자들의 그룹 내 평균
+|-
+|min
+|그룹 내 최소순위
+|-
+|max
+|그룹 내 최대순위
+|-
+|first
+|동점자 없이, 관측되는 순서에 따라 순위 부여
 |-
-|
+|dense
-|
+|min에 1을 더한 값.
-|
+|}
+|df.rank(''method='옵션''', ascending=False)
 |}
-왜도 구하기. df.skew()
-첨도 구하기. df.kurtosis()
 = Dataframe 행간 연산 =