바뀜

4 바이트 추가됨 ,  2022년 8월 10일 (수) 22:01
42번째 줄: 42번째 줄:  
|버리기
 
|버리기
 
|<syntaxhighlight lang="python">
 
|<syntaxhighlight lang="python">
 +
# 열 단위로 버리기
 
# 결측치가 하나라도 있는 열을 찾는다.
 
# 결측치가 하나라도 있는 열을 찾는다.
 
cols_with_missing = [col for col in X_train.columns if X_train[col].isnull().any()]
 
cols_with_missing = [col for col in X_train.columns if X_train[col].isnull().any()]
# 결측치가 하나라도 있는 행의 인덱스를 얻었다. 이 인덱스에 해당하는 행을 지운다.
+
# 해당 버리기
# 해당 버리기.
   
reduced_X_train = X_train.drop(cols_with_missing, axis=1)
 
reduced_X_train = X_train.drop(cols_with_missing, axis=1)
 
reduced_X_valid = X_valid.drop(cols_with_missing, axis=1)
 
reduced_X_valid = X_valid.drop(cols_with_missing, axis=1)
 +
</syntaxhighlight><syntaxhighlight lang="python">
 +
# 행 단위로 버리기
 +
df = df.dropna()
 
</syntaxhighlight>
 
</syntaxhighlight>
 
|}
 
|}