바뀜

둘러보기로 가기 검색하러 가기
32 바이트 추가됨 ,  2023년 2월 1일 (수) 12:10
1번째 줄: 1번째 줄:  
== 개요 ==
 
== 개요 ==
 +
파생변수에 대해 다루는 문서.
 +
 
dataframe의 평균, 합을 구한다든가 특정 연산을 수행해야 할 때가 있다. for문으로 일일이 할 수도 있지만, 효율이 그닥 좋진 않다.
 
dataframe의 평균, 합을 구한다든가 특정 연산을 수행해야 할 때가 있다. for문으로 일일이 할 수도 있지만, 효율이 그닥 좋진 않다.
   110번째 줄: 112번째 줄:  
|<code>df['over_5unit'] = np.where(df['1unit']>df['5unit'], True값, False값)</code>
 
|<code>df['over_5unit'] = np.where(df['1unit']>df['5unit'], True값, False값)</code>
 
<nowiki>#</nowiki> 1unit 행의 값이 5unit 행의 값보다 큰 때에만 True값을 넣는다.
 
<nowiki>#</nowiki> 1unit 행의 값이 5unit 행의 값보다 큰 때에만 True값을 넣는다.
      
<code>df['열'] = np.where(조건, 참, np.where(조건, 참2, 거짓))</code>
 
<code>df['열'] = np.where(조건, 참, np.where(조건, 참2, 거짓))</code>
118번째 줄: 119번째 줄:  
|<syntaxhighlight lang="python">
 
|<syntaxhighlight lang="python">
 
변수 = np.where(
 
변수 = np.where(
     (df['category'] == '값1') | (df['category'] == '값2') | ... , '참값', '거짓값'
+
     (df['category'] == '값1') | (df['category'] == '값2') | ... , '참값', '거짓값')
    )
   
</syntaxhighlight>위 형태로는 너무 코드가 길어져서... 아래와 같이 축약하곤 한다.<syntaxhighlight lang="python">
 
</syntaxhighlight>위 형태로는 너무 코드가 길어져서... 아래와 같이 축약하곤 한다.<syntaxhighlight lang="python">
 
변수 = np.where(
 
변수 = np.where(
     df['category'].isin([값1, 값2, ...]) , '참값', '거짓값'
+
     df['category'].isin([값1, 값2, ...]) , '참값', '거짓값')
    )
   
</syntaxhighlight>
 
</syntaxhighlight>
 
|}
 
|}
142번째 줄: 141번째 줄:  
|
 
|
 
* df.query('조건')  # 조건을 문자열 형태로 넣어야 한다. 조건은 일반 if문법을 따라간다.
 
* df.query('조건')  # 조건을 문자열 형태로 넣어야 한다. 조건은 일반 if문법을 따라간다.
* 예시) <code>df.query('열이름 == 1')</code>  # 해당 열에서 1 값을 갖는 행만 뽑아낸다.
+
*: 예시) <code>df.query('열이름 == 1')</code>  # 해당 열에서 1 값을 갖는 행만 뽑아낸다.
 
* 외부 변수를 조건에 활용하려면 <code>df.query('열이름 == @외부변수명')</code> 형태로 @를 사용한다.
 
* 외부 변수를 조건에 활용하려면 <code>df.query('열이름 == @외부변수명')</code> 형태로 @를 사용한다.
 
|}
 
|}
 
[[분류:Pandas:DataFrame]]
 
[[분류:Pandas:DataFrame]]

둘러보기 메뉴