분류:데이터 전처리

Pywiki
Sam (토론 | 기여)님의 2021년 9월 14일 (화) 04:56 판 (→‎개요)
둘러보기로 가기 검색하러 가기

1 개요

결측치를 제거하거나 새로운 값을 부여하거나, 범주형 변수를 어떻게 처리할지에 대한 지식을 모아둔 분류.

2 데이터 분류

데이터는 일반적으로 다음의 3개로 분류한다.

  • 훈련데이터 : 가중치(매개변수)를 학습하는 데 쓰이는 데이터.
  • 시험데이터 : 신경망의 성능 평가.(하이퍼파라미터를 조정하는 데 쓰면 하이퍼파라미터가 여기에 오버피팅 되어버린다.)
  • 검증데이터 : 하이퍼파라미터의 성능을 평가하기 위한 데이터.

하위 분류

다음은 이 분류에 속하는 하위 분류 4개 가운데 4개입니다.

"데이터 전처리" 분류에 속하는 문서

다음은 이 분류에 속하는 문서 8개 가운데 8개입니다.