29번째 줄:
29번째 줄:
|훈련데이터와 테스트데이터 분리
|훈련데이터와 테스트데이터 분리
|귀찮은 일을 모듈이 해준다.
|귀찮은 일을 모듈이 해준다.
+
{| class="wikitable"
+
|+자주 사용하는 옵션
+
!의도
+
!설명
+
|-
+
|stratify=df['해당열']
+
|범주별 비율을 비슷하게 맞춰 데이터를 분리한다.
+
(원 데이터에서 하나의 범주만 너무 많거나 적은 경우 사용하여 비율을 지킨다.)
+
|}
|<syntaxhighlight lang="python">
|<syntaxhighlight lang="python">
from sklearn.model_selection import train_test_split
from sklearn.model_selection import train_test_split