바뀜
→기초 사용법
115번째 줄:
115번째 줄:
</syntaxhighlight>
</syntaxhighlight>
|-
|-
−|학습
+|학습객체 지정 및 학습
|일반적으로 machine이라는 이름보다,
|일반적으로 machine이라는 이름보다,
176번째 줄:
176번째 줄:
|}
|}
이후 사용법은 위와 같다.
이후 사용법은 위와 같다.
+
+== 크로스 밸리데이션 ==
+{| class="wikitable"
+!절차
+!설명
+!방법
+|-
+|크로스밸리데이션 하기
+|검증한다.
+
+결과는 나누는 데이터 갯수만큼 배열(numpy.ndarray)로 나온다.
+|<syntaxhighlight lang="python">
+from sklearn import svm, model_selection # svm에 대한 벨리데리션을 실행해본다.
+
+clf = svm.SVC()
+scores = model_selection.cross_val_score(clf, data, label, cv=5) # 5개의 데이터로 나누어 진행.
+</syntaxhighlight>
+|}
+
+== 매개변수 찾기. 그리드 서치 ==
+각각의 학습방법에 대해 매개변수를 조절해야 할 필요가 있다. 관련된 변수의 최적값을 자동으로 찾아주는 기능. 정답률을 개선시켜준다.
+
+단지, 시간이 더 오래걸린다.
+{| class="wikitable"
+!절차
+!설명
+!방법
+|-
+|모델 부르기 및 그리드서치 매개변수 설정
+|매개변수의 후보들을 등록한다.
+|<syntaxhighlight lang="python">
+from sklearn import svm # svm에 대해 실행.
+from sklearn.grid_search import GridSearchCV
+
+params = [
+ {"C":[1,10,100,1000], "kernel":['linear']},
+ {"C":[1,10,100,1000], "kernel":['rbf'], "gamma":[0.001, 0.0001]}
+]
+</syntaxhighlight>
+|-
+|그리드서치 수행
+|n_jobs는 병렬계산할 프로세스 지정. -1은 자동으로 진행한다는 의미.
+|<syntaxhighlight lang="python">
+clf = GridSearchCV(svm.SVC(), params, n_jobs=-1) # 그리드서치 관련내용이 담긴 객체를 생성.
+clf.fit(train_data, train_label) # 이 객체를 학습시킨다.
+</syntaxhighlight>
+|}
[[분류:머신러닝 프레임워크]]
[[분류:머신러닝 프레임워크]]