랜덤포레스트(with Scikit-learn)

Pywiki
Sam (토론 | 기여)님의 2021년 9월 1일 (수) 10:19 판 (새 문서: ==개요== 사이킷런으로 랜덤포레스트를 만들 수 있다. ==랜덤 포레스트== {| class="wikitable" !절차 !설명 !방법 |- |패키지 불러오기 및 데이터...)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
둘러보기로 가기 검색하러 가기

1 개요

사이킷런으로 랜덤포레스트를 만들 수 있다.

2 랜덤 포레스트

절차 설명 방법
패키지 불러오기 및 데이터 정리
from sklearn.enssemble import RandomForestClassifier

data = [
    [1,2,4],
    [1,5,3],
    [1,5,2]
    ]
    
# 데이터와 레이블 정리
data = []
label = []
for row in data:
    data.append(row[0], row[1])  # 판단의 기초가 되는 데이터리스트를 만든다.
    label.append(row[2])  # 판단의 결과를 모은다.
데이터프레임을 활용하는 경우.(열 이름을 사용해 분리하는 게 가장 간단하고 직관적이다.)
학습 일반적으로 machine이라는 이름보다,

classifier의 약자인 clf를 주로 쓴다.

machine = RandomForestClassifier()  # 객체 지정
machine.fit(data, label)  # 데이터와 레이블 지정

이후 사용법은 위와 같다.