결측치를 다루는 다양한 방법들에 대해 정리하기 위한 분류.
기본 방향
수집한 데이터 안에 결측치가 있는 경우가 있다. 이런 경우 어떻게 다룰 것인가?
- 버리기.
- 결측치가 있는 행을 버리거나 열을 버리는 것.
- 채우기.
- 결측치를 특정 값으로 채운다. 정확한 데이터는 아니지만, 열을 통째로 버리는 경우보단 유용.
- - 0으로 채워서 네트워크가 0이 누락된 값임을 학습하게 되면 이 값을 무시한다.
- 새로운 행 만들기.(채우고 표시하기)
- 위 두 과정의 절충. 특정 값으로 채우되, 결측값을 새로 채웠다는 정보를 알려주는 행을 새로 만든다.