바뀜

둘러보기로 가기 검색하러 가기
946 바이트 제거됨 ,  2021년 9월 1일 (수) 10:17
잔글
16번째 줄: 16번째 줄:  
|데이터를 다룰 때 사용할 도구.
 
|데이터를 다룰 때 사용할 도구.
 
|pip install pandas
 
|pip install pandas
|-
  −
|
  −
|
  −
|
   
|}
 
|}
   140번째 줄: 136번째 줄:  
</syntaxhighlight>
 
</syntaxhighlight>
 
|}
 
|}
  −
== 랜덤 포레스트 ==
  −
{| class="wikitable"
  −
!절차
  −
!설명
  −
!방법
  −
|-
  −
|패키지 불러오기 및 데이터 정리
  −
|
  −
|<syntaxhighlight lang="python">
  −
from sklearn.enssemble import RandomForestClassifier
  −
  −
data = [
  −
    [1,2,4],
  −
    [1,5,3],
  −
    [1,5,2]
  −
    ]
  −
   
  −
# 데이터와 레이블 정리
  −
data = []
  −
label = []
  −
for row in data:
  −
    data.append(row[0], row[1])  # 판단의 기초가 되는 데이터리스트를 만든다.
  −
    label.append(row[2])  # 판단의 결과를 모은다.
  −
</syntaxhighlight>데이터프레임을 활용하는 경우.(열 이름을 사용해 분리하는 게 가장 간단하고 직관적이다.)
  −
|-
  −
|학습
  −
|일반적으로 machine이라는 이름보다,
  −
  −
classifier의 약자인 clf를 주로 쓴다.
  −
|<syntaxhighlight lang="python">
  −
machine = RandomForestClassifier()  # 객체 지정
  −
machine.fit(data, label)  # 데이터와 레이블 지정
  −
</syntaxhighlight>
  −
|}
  −
이후 사용법은 위와 같다.
      
== 크로스 밸리데이션 ==
 
== 크로스 밸리데이션 ==

둘러보기 메뉴