바뀜
둘러보기로 가기
검색하러 가기
115번째 줄:
115번째 줄:
− +
176번째 줄:
176번째 줄:
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
→기초 사용법
</syntaxhighlight>
</syntaxhighlight>
|-
|-
|학습
|학습객체 지정 및 학습
|일반적으로 machine이라는 이름보다,
|일반적으로 machine이라는 이름보다,
|}
|}
이후 사용법은 위와 같다.
이후 사용법은 위와 같다.
== 크로스 밸리데이션 ==
{| class="wikitable"
!절차
!설명
!방법
|-
|크로스밸리데이션 하기
|검증한다.
결과는 나누는 데이터 갯수만큼 배열(numpy.ndarray)로 나온다.
|<syntaxhighlight lang="python">
from sklearn import svm, model_selection # svm에 대한 벨리데리션을 실행해본다.
clf = svm.SVC()
scores = model_selection.cross_val_score(clf, data, label, cv=5) # 5개의 데이터로 나누어 진행.
</syntaxhighlight>
|}
== 매개변수 찾기. 그리드 서치 ==
각각의 학습방법에 대해 매개변수를 조절해야 할 필요가 있다. 관련된 변수의 최적값을 자동으로 찾아주는 기능. 정답률을 개선시켜준다.
단지, 시간이 더 오래걸린다.
{| class="wikitable"
!절차
!설명
!방법
|-
|모델 부르기 및 그리드서치 매개변수 설정
|매개변수의 후보들을 등록한다.
|<syntaxhighlight lang="python">
from sklearn import svm # svm에 대해 실행.
from sklearn.grid_search import GridSearchCV
params = [
{"C":[1,10,100,1000], "kernel":['linear']},
{"C":[1,10,100,1000], "kernel":['rbf'], "gamma":[0.001, 0.0001]}
]
</syntaxhighlight>
|-
|그리드서치 수행
|n_jobs는 병렬계산할 프로세스 지정. -1은 자동으로 진행한다는 의미.
|<syntaxhighlight lang="python">
clf = GridSearchCV(svm.SVC(), params, n_jobs=-1) # 그리드서치 관련내용이 담긴 객체를 생성.
clf.fit(train_data, train_label) # 이 객체를 학습시킨다.
</syntaxhighlight>
|}
[[분류:머신러닝 프레임워크]]
[[분류:머신러닝 프레임워크]]