바뀜

Scikit-learn (편집)

2021년 9월 1일 (수) 10:17 판

946 바이트 제거됨 , 2021년 9월 1일 (수) 10:17

잔글

→‎랜덤 포레스트

16번째 줄: 16번째 줄:

|데이터를 다룰 때 사용할 도구.

|pip install pandas

−

|-

−

|

−

|

−

|

|}

140번째 줄: 136번째 줄:

</syntaxhighlight>

|}

−

~~== 랜덤 포레스트 ==~~

−

~~{| class="wikitable"~~

−

~~!절차~~

−

~~!설명~~

−

~~!방법~~

−

|-

−

~~|패키지 불러오기 및 데이터 정리~~

−

|

−

~~|<syntaxhighlight lang="python">~~

−

~~from sklearn.enssemble import RandomForestClassifier~~

−

~~data = [~~

−

~~[1,2,4],~~

−

~~[1,5,3],~~

−

~~[1,5,2]~~

−

]

−

~~# 데이터와 레이블 정리~~

−

~~data = []~~

−

~~label = []~~

−

~~for row in data:~~

−

~~data.append(row[0], row[1]) # 판단의 기초가 되는 데이터리스트를 만든다.~~

−

~~label.append(row[2]) # 판단의 결과를 모은다.~~

−

~~</syntaxhighlight>데이터프레임을 활용하는 경우.(열 이름을 사용해 분리하는 게 가장 간단하고 직관적이다.)~~

−

|-

−

~~|학습~~

−

~~|일반적으로 machine이라는 이름보다,~~

−

~~classifier의 약자인 clf를 주로 쓴다.~~

−

~~|<syntaxhighlight lang="python">~~

−

~~machine = RandomForestClassifier() # 객체 지정~~

−

~~machine.fit(data, label) # 데이터와 레이블 지정~~

−

~~</syntaxhighlight>~~

−

|}

−

~~이후 사용법은 위와 같다.~~

== 크로스 밸리데이션 ==

Sam

사무관, 인터페이스 관리자, 관리자, 교사

편집

1,419

번