31번째 줄:
31번째 줄:
train_x, test_x, train_y, test_y = train_test_split(data, label, random_state=1)
train_x, test_x, train_y, test_y = train_test_split(data, label, random_state=1)
−
</syntaxhighlight>random_state는 random함수의 seed값을 고정하여 매번 같은 데이터를 얻게 하기 위함.(test용, 교육용에서 채점 등에 사용.)
+
</syntaxhighlight>random_state는 random함수의 seed값을 고정하여 매번 같은 데이터를 얻게 하기 위함.(test용, 교육용에서 채점 등에 사용. 모델이 랜덤한 효과로 좋아지지 않도록.)
일반적으로 이 대신 test_size=0.2 를 사용한다.(20%가 test 데이터로)
일반적으로 이 대신 test_size=0.2 를 사용한다.(20%가 test 데이터로)