바뀜
둘러보기로 가기
검색하러 가기
← 이전 편집
형태소 분석
(편집)
2023년 2월 6일 (월) 18:03 판
96 바이트 추가됨
,
2023년 2월 6일 (월) 18:03
→KoNLPy
4번째 줄:
4번째 줄:
== KoNLPy ==
== KoNLPy ==
http://konlpy.org/ko/latest
http://konlpy.org/ko/latest
−
−
=== 설치 ===
−
{| class="wikitable"
−
!과정
−
!설명
−
!방법
−
|-
−
|사전설치
−
|형태소분석에 필요한 것들을 설치한다.
−
자바도 버전에 맞게 설치하자.
−
|apt-get install g++ python-dev python3-dev openjdk-8-jdk
−
|-
−
|라이브러리설치
−
|
−
|pip install konlpy
−
|}
=== 사용 ===
=== 사용 ===
40번째 줄:
24번째 줄:
|stem
|stem
|단어의 원형을 찾아준다. '나가'라는 단어를 '나가다'라고 변환.
|단어의 원형을 찾아준다. '나가'라는 단어를 '나가다'라고 변환.
+
|}
+
{| class="wikitable"
+
|+결과
+
!결과
+
!설명
+
|-
+
|word[1]
+
|
+
{| class="wikitable"
+
!결과
+
!설명
+
|-
+
|'Josa'
+
|조사
+
|-
+
|'Eomi'
+
|어미
+
|-
+
|'Punctuation'
+
|구두점
+
|}
|}
|}
|<syntaxhighlight lang="python">
|<syntaxhighlight lang="python">
46번째 줄:
51번째 줄:
twitter = Twitter()
twitter = Twitter()
word_list = twitter.pos('분석할 텍스트', norm=True, stem=True)
word_list = twitter.pos('분석할 텍스트', norm=True, stem=True)
−
</syntaxhighlight>
+
</syntaxhighlight>
리스트 안의 요소의 1번 인덱스는 해당 단어가 조사인지, 어미인지 알려준다.
|-
|-
|에러가 나는 경우
|에러가 나는 경우
52번째 줄:
57번째 줄:
|pip install jpype1
|pip install jpype1
|}
|}
+
아직 정리가 안되었는데... 형태소분석기 이용에 대해선 [[Wordcloud]]를 참고하자.
[[분류:텍스트 분석]]
[[분류:텍스트 분석]]
Sam
사무관
,
인터페이스 관리자
,
관리자
, 교사
편집
1,419
번
둘러보기 메뉴
개인 도구
로그인하지 않음
토론
기여
계정 만들기
로그인
이름공간
문서
토론
변수
보기
읽기
편집
원본 편집
역사 보기
더 보기
검색
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
도구
특수 문서 목록
인쇄용 판