텍스트 분류

Pywiki
둘러보기로 가기 검색하러 가기

1 개요[편집 | 원본 편집]

해당 텍스트가 스팸인지, 어떤 카테고리에 속하는지 등 글 전체의 주제를 분석하는 작업

2 전략[편집 | 원본 편집]

전략 설명
베이즈 분류 단어뭉치를 카테고리와 함께 분석하여 해당 카테고리에 나오는 단어의 등장비율을 통해 분류한다.

베이즈 정리를 이용하여 어떤 단어가 나왔을 때 해당 카테고리일 확률을 구해 분류하는 방법이다.

MLP로 분류