바뀜

둘러보기로 가기 검색하러 가기
1,551 바이트 추가됨 ,  2021년 4월 21일 (수) 23:19
115번째 줄: 115번째 줄:  
</syntaxhighlight>
 
</syntaxhighlight>
 
|-
 
|-
|학습
+
|학습객체 지정 및 학습
 
|일반적으로 machine이라는 이름보다,
 
|일반적으로 machine이라는 이름보다,
   176번째 줄: 176번째 줄:  
|}
 
|}
 
이후 사용법은 위와 같다.
 
이후 사용법은 위와 같다.
 +
 +
== 크로스 밸리데이션 ==
 +
{| class="wikitable"
 +
!절차
 +
!설명
 +
!방법
 +
|-
 +
|크로스밸리데이션 하기
 +
|검증한다.
 +
 +
결과는 나누는 데이터 갯수만큼 배열(numpy.ndarray)로 나온다.
 +
|<syntaxhighlight lang="python">
 +
from sklearn import svm, model_selection  # svm에 대한 벨리데리션을 실행해본다.
 +
 +
clf = svm.SVC()
 +
scores = model_selection.cross_val_score(clf, data, label, cv=5)  # 5개의 데이터로 나누어 진행.
 +
</syntaxhighlight>
 +
|}
 +
 +
== 매개변수 찾기. 그리드 서치 ==
 +
각각의 학습방법에 대해 매개변수를 조절해야 할 필요가 있다. 관련된 변수의 최적값을 자동으로 찾아주는 기능. 정답률을 개선시켜준다.
 +
 +
단지, 시간이 더 오래걸린다.
 +
{| class="wikitable"
 +
!절차
 +
!설명
 +
!방법
 +
|-
 +
|모델 부르기 및 그리드서치 매개변수 설정
 +
|매개변수의 후보들을 등록한다.
 +
|<syntaxhighlight lang="python">
 +
from sklearn import svm  # svm에 대해 실행.
 +
from sklearn.grid_search import GridSearchCV
 +
 +
params = [
 +
    {"C":[1,10,100,1000], "kernel":['linear']},
 +
    {"C":[1,10,100,1000], "kernel":['rbf'], "gamma":[0.001, 0.0001]}
 +
]
 +
</syntaxhighlight>
 +
|-
 +
|그리드서치 수행
 +
|n_jobs는 병렬계산할 프로세스 지정. -1은 자동으로 진행한다는 의미.
 +
|<syntaxhighlight lang="python">
 +
clf = GridSearchCV(svm.SVC(), params, n_jobs=-1)  # 그리드서치 관련내용이 담긴 객체를 생성.
 +
clf.fit(train_data, train_label)  # 이 객체를 학습시킨다.
 +
</syntaxhighlight>
 +
|}
 
[[분류:머신러닝 프레임워크]]
 
[[분류:머신러닝 프레임워크]]
익명 사용자

둘러보기 메뉴