58번째 줄: |
58번째 줄: |
| !설명 | | !설명 |
| |- | | |- |
− | |결측치 채우기 | + | |DataFrame을 사용하는 경우 |
− | |<syntaxhighlight lang="python"> | + | |[[결측치 다루기:pandas]] 문서를 참고하자. |
− | from sklearn.impute import SimpleImputer
| |
− | | |
− | imputer = SimpleImputer()
| |
− | imputed_train_X = pd.DataFrame(imputer.fit_transform(train_X)) # 학습용 자료에 결측치 채워넣기.
| |
− | test_train_X = pd.DataFrame(imputer.transform(test_X)) # 테스트용 데이터에 결측치 채워넣기.(위에서 사용하는 메서드와 다르다. 무슨 차이일까..)
| |
− | | |
− | </syntaxhighlight>결측치를 채우는 것만으로도 정밀도가 올라가는 경우가 많다.
| |
− | SimpleImputer(strategy='median')
| |
| |} | | |} |
| = 모델 검증 = | | = 모델 검증 = |