바뀜

96 바이트 추가됨 ,  2023년 2월 6일 (월) 18:03
4번째 줄: 4번째 줄:  
== KoNLPy ==
 
== KoNLPy ==
 
http://konlpy.org/ko/latest
 
http://konlpy.org/ko/latest
  −
=== 설치 ===
  −
{| class="wikitable"
  −
!과정
  −
!설명
  −
!방법
  −
|-
  −
|사전설치
  −
|형태소분석에 필요한 것들을 설치한다.
  −
자바도 버전에 맞게 설치하자.
  −
|apt-get install g++ python-dev python3-dev openjdk-8-jdk
  −
|-
  −
|라이브러리설치
  −
|
  −
|pip install konlpy
  −
|}
      
=== 사용 ===
 
=== 사용 ===
40번째 줄: 24번째 줄:  
|stem
 
|stem
 
|단어의 원형을 찾아준다. '나가'라는 단어를 '나가다'라고 변환.
 
|단어의 원형을 찾아준다. '나가'라는 단어를 '나가다'라고 변환.
 +
|}
 +
{| class="wikitable"
 +
|+결과
 +
!결과
 +
!설명
 +
|-
 +
|word[1]
 +
|
 +
{| class="wikitable"
 +
!결과
 +
!설명
 +
|-
 +
|'Josa'
 +
|조사
 +
|-
 +
|'Eomi'
 +
|어미
 +
|-
 +
|'Punctuation'
 +
|구두점
 +
|}
 
|}
 
|}
 
|<syntaxhighlight lang="python">
 
|<syntaxhighlight lang="python">
46번째 줄: 51번째 줄:  
twitter = Twitter()
 
twitter = Twitter()
 
word_list = twitter.pos('분석할 텍스트', norm=True, stem=True)
 
word_list = twitter.pos('분석할 텍스트', norm=True, stem=True)
</syntaxhighlight>
+
</syntaxhighlight>리스트 안의 요소의 1번 인덱스는 해당 단어가 조사인지, 어미인지 알려준다.
 
|-
 
|-
 
|에러가 나는 경우
 
|에러가 나는 경우
52번째 줄: 57번째 줄:  
|pip install jpype1
 
|pip install jpype1
 
|}
 
|}
 +
아직 정리가 안되었는데... 형태소분석기 이용에 대해선 [[Wordcloud]]를 참고하자.
 
[[분류:텍스트 분석]]
 
[[분류:텍스트 분석]]