바뀜

96 바이트 추가됨 , 2023년 2월 6일 (월) 18:03

→‎KoNLPy

4번째 줄: 4번째 줄:

== KoNLPy ==

http://konlpy.org/ko/latest

−

~~=== 설치 ===~~

−

~~{| class="wikitable"~~

−

~~!과정~~

−

~~!설명~~

−

~~!방법~~

−

|-

−

~~|사전설치~~

−

~~|형태소분석에 필요한 것들을 설치한다.~~

−

~~자바도 버전에 맞게 설치하자.~~

−

~~|apt-get install g++ python-dev python3-dev openjdk-8-jdk~~

−

|-

−

~~|라이브러리설치~~

−

|

−

~~|pip install konlpy~~

−

|}

=== 사용 ===

40번째 줄: 24번째 줄:

|stem

|단어의 원형을 찾아준다. '나가'라는 단어를 '나가다'라고 변환.

+

|}

+

{| class="wikitable"

+

|+결과

+

!결과

+

!설명

+

|-

+

|word[1]

+

|

+

{| class="wikitable"

+

!결과

+

!설명

+

|-

+

|'Josa'

+

|조사

+

|-

+

|'Eomi'

+

|어미

+

|-

+

|'Punctuation'

+

|구두점

+

|}

|<syntaxhighlight lang="python">

46번째 줄: 51번째 줄:

twitter = Twitter()

word_list = twitter.pos('분석할 텍스트', norm=True, stem=True)

−

</syntaxhighlight>

+

</syntaxhighlight>리스트 안의 요소의 1번 인덱스는 해당 단어가 조사인지, 어미인지 알려준다.

|-

|에러가 나는 경우

52번째 줄: 57번째 줄:

|pip install jpype1

|}

+

아직 정리가 안되었는데... 형태소분석기 이용에 대해선 [[Wordcloud]]를 참고하자.

[[분류:텍스트 분석]]

Sam

사무관, 인터페이스 관리자, 관리자, 교사

편집

1,419

번

바뀜

형태소 분석 (편집)

2023년 2월 6일 (월) 18:03 판