바뀜

Scikit-learn (편집)

2021년 4월 21일 (수) 23:19 판

1,551 바이트 추가됨 , 2021년 4월 21일 (수) 23:19

→‎기초 사용법

115번째 줄: 115번째 줄:

</syntaxhighlight>

|-

−

|학습

+

|학습객체 지정 및 학습

|일반적으로 machine이라는 이름보다,

176번째 줄: 176번째 줄:

|}

이후 사용법은 위와 같다.

+

== 크로스 밸리데이션 ==

+

{| class="wikitable"

+

!절차

+

!설명

+

!방법

+

|-

+

|크로스밸리데이션 하기

+

|검증한다.

+

결과는 나누는 데이터 갯수만큼 배열(numpy.ndarray)로 나온다.

+

|<syntaxhighlight lang="python">

+

from sklearn import svm, model_selection # svm에 대한 벨리데리션을 실행해본다.

+

clf = svm.SVC()

+

scores = model_selection.cross_val_score(clf, data, label, cv=5) # 5개의 데이터로 나누어 진행.

+

</syntaxhighlight>

+

|}

+

== 매개변수 찾기. 그리드 서치 ==

+

각각의 학습방법에 대해 매개변수를 조절해야 할 필요가 있다. 관련된 변수의 최적값을 자동으로 찾아주는 기능. 정답률을 개선시켜준다.

+

단지, 시간이 더 오래걸린다.

+

{| class="wikitable"

+

!절차

+

!설명

+

!방법

+

|-

+

|모델 부르기 및 그리드서치 매개변수 설정

+

|매개변수의 후보들을 등록한다.

+

|<syntaxhighlight lang="python">

+

from sklearn import svm # svm에 대해 실행.

+

from sklearn.grid_search import GridSearchCV

+

params = [

+

{"C":[1,10,100,1000], "kernel":['linear']},

+

{"C":[1,10,100,1000], "kernel":['rbf'], "gamma":[0.001, 0.0001]}

+

]

+

</syntaxhighlight>

+

|-

+

|그리드서치 수행

+

|n_jobs는 병렬계산할 프로세스 지정. -1은 자동으로 진행한다는 의미.

+

|<syntaxhighlight lang="python">

+

clf = GridSearchCV(svm.SVC(), params, n_jobs=-1) # 그리드서치 관련내용이 담긴 객체를 생성.

+

clf.fit(train_data, train_label) # 이 객체를 학습시킨다.

+

</syntaxhighlight>

+

|}

[[분류:머신러닝 프레임워크]]

익명 사용자

192.168.219.100