"분류:결측치 다루기"의 두 판 사이의 차이

Pywiki
둘러보기로 가기 검색하러 가기
(새 문서: 결측치를 다루는 다양한 방법들에 대해 정리하기 위한 분류. 분류:데이터 전처리)
 
1번째 줄: 1번째 줄:
 
결측치를 다루는 다양한 방법들에 대해 정리하기 위한 분류.
 
결측치를 다루는 다양한 방법들에 대해 정리하기 위한 분류.
 +
 +
= 기본 방향 =
 +
수집한 데이터 안에 결측치가 있는 경우가 있다. 이런 경우 어떻게 다룰 것인가?
 +
#버리기.
 +
#:결측치가 있는 행을 버리거나 열을 버리는 것.
 +
#채우기.
 +
#:결측치를 특정 값으로 채운다. 정확한 데이터는 아니지만, 열을 통째로 버리는 경우보단 유용.
 +
#:- 0으로 채워서 네트워크가 0이 누락된 값임을 학습하게 되면 이 값을 무시한다.
 +
#새로운 행 만들기.
 +
#:위 두 과정의 절충. 특정 값으로 채우되, 결측값을 새로 채웠다는 정보를 알려주는 행을 새로 만든다.
 +
 +
 
[[분류:데이터 전처리]]
 
[[분류:데이터 전처리]]

2022년 8월 3일 (수) 10:08 판

결측치를 다루는 다양한 방법들에 대해 정리하기 위한 분류.

기본 방향

수집한 데이터 안에 결측치가 있는 경우가 있다. 이런 경우 어떻게 다룰 것인가?

  1. 버리기.
    결측치가 있는 행을 버리거나 열을 버리는 것.
  2. 채우기.
    결측치를 특정 값으로 채운다. 정확한 데이터는 아니지만, 열을 통째로 버리는 경우보단 유용.
    - 0으로 채워서 네트워크가 0이 누락된 값임을 학습하게 되면 이 값을 무시한다.
  3. 새로운 행 만들기.
    위 두 과정의 절충. 특정 값으로 채우되, 결측값을 새로 채웠다는 정보를 알려주는 행을 새로 만든다.

"결측치 다루기" 분류에 속하는 문서

다음은 이 분류에 속하는 문서 2개 가운데 2개입니다.