주 메뉴 열기
대문
임의의 문서로
로그인
설정
Pywiki 소개
면책 조항
Pywiki
검색
바뀜
← 이전 편집
다음 편집 →
분류:데이터 전처리
(편집)
2021년 9월 17일 (금) 10:43 판
516 바이트 추가됨
,
2021년 9월 17일 (금) 10:43
편집 요약 없음
1번째 줄:
1번째 줄:
== 개요 ==
== 개요 ==
결측치를 제거하거나 새로운 값을 부여하거나, 범주형 변수를 어떻게 처리할지에 대한 지식을 모아둔 분류.
결측치를 제거하거나 새로운 값을 부여하거나, 범주형 변수를 어떻게 처리할지에 대한 지식을 모아둔 분류.
+
+
== 전처리 ==
+
데이터마다 스케일의 크기가 다르다. 어떤 것은 1~5 사이인데, 어떤 것은 100~1000 사이이기도 하고.. 요소마다 스케일이 다르기도 한데, 크기가 큰 항목에 더 크게 영향을 받기 때문에 이들에 대한 전처리가 필요하다.
+
+
=== 표준화 ===
+
일반적으로 표준화를 거친다. 평균이 0이고, 분산이 1인 상태로 만들어 다루는 것이 일반적이다. 이는 사이킷런에서 기본적으로 제공하는 기능이다.
== 데이터 분류 ==
== 데이터 분류 ==
Sam
사무관
,
인터페이스 관리자
,
관리자
, 교사
편집
1,408
번