| 16번째 줄: |
16번째 줄: |
| | |데이터를 다룰 때 사용할 도구. | | |데이터를 다룰 때 사용할 도구. |
| | |pip install pandas | | |pip install pandas |
| − | |-
| |
| − | |
| |
| − | |
| |
| − | |
| |
| | |} | | |} |
| | | | |
| 140번째 줄: |
136번째 줄: |
| | </syntaxhighlight> | | </syntaxhighlight> |
| | |} | | |} |
| − |
| |
| − | == 랜덤 포레스트 ==
| |
| − | {| class="wikitable"
| |
| − | !절차
| |
| − | !설명
| |
| − | !방법
| |
| − | |-
| |
| − | |패키지 불러오기 및 데이터 정리
| |
| − | |
| |
| − | |<syntaxhighlight lang="python">
| |
| − | from sklearn.enssemble import RandomForestClassifier
| |
| − |
| |
| − | data = [
| |
| − | [1,2,4],
| |
| − | [1,5,3],
| |
| − | [1,5,2]
| |
| − | ]
| |
| − |
| |
| − | # 데이터와 레이블 정리
| |
| − | data = []
| |
| − | label = []
| |
| − | for row in data:
| |
| − | data.append(row[0], row[1]) # 판단의 기초가 되는 데이터리스트를 만든다.
| |
| − | label.append(row[2]) # 판단의 결과를 모은다.
| |
| − | </syntaxhighlight>데이터프레임을 활용하는 경우.(열 이름을 사용해 분리하는 게 가장 간단하고 직관적이다.)
| |
| − | |-
| |
| − | |학습
| |
| − | |일반적으로 machine이라는 이름보다,
| |
| − |
| |
| − | classifier의 약자인 clf를 주로 쓴다.
| |
| − | |<syntaxhighlight lang="python">
| |
| − | machine = RandomForestClassifier() # 객체 지정
| |
| − | machine.fit(data, label) # 데이터와 레이블 지정
| |
| − | </syntaxhighlight>
| |
| − | |}
| |
| − | 이후 사용법은 위와 같다.
| |
| | | | |
| | == 크로스 밸리데이션 == | | == 크로스 밸리데이션 == |