바뀜
둘러보기로 가기
검색하러 가기
1번째 줄:
1번째 줄:
+
+
16번째 줄:
18번째 줄:
+
+
+
+
+
+
+
40번째 줄:
49번째 줄:
+
+
+
+
+
+
+
+
편집 요약 없음
== 개요 ==
== 개요 ==
컴퓨터는 단어, 단어와 단어 사이의 관계를 이해하지 못한다. 단지 숫자를 이해할 수 있을 뿐인데, 이를 위하여 단어를 벡터로 변환하는 과정이 필요하다.
컴퓨터는 단어, 단어와 단어 사이의 관계를 이해하지 못한다. 단지 숫자를 이해할 수 있을 뿐인데, 이를 위하여 단어를 벡터로 변환하는 과정이 필요하다.
이 과정이 제대로 거쳐진다면 '아빠'-'남자'+'여자' = '엄마' 등의 재미난 연산도 가능해진다.(일반적으로 Gensim 따위의 언어분석도구를 사용한다.)
== Gensim ==
== Gensim ==
|텍스트 읽고 모델 만들고 저장하기
|텍스트 읽고 모델 만들고 저장하기
|
|
{| class="wikitable"
!매개변수
!설명
|-
|size
|몇 차원으로 할 것인가.
|}
|<syntaxhighlight lang="python">
|<syntaxhighlight lang="python">
from gensim.models import word2vec
from gensim.models import word2vec
model.most_similar(positive=['단어'])
model.most_similar(positive=['단어'])
</syntaxhighlight>
|-
|단어관계 확인
| +와 -개념으로 연산을 수행할 수도 있다.
|아빠-남자+여자 = ???? 을 알아보는 코드이다. <syntaxhighlight lang="python">
from gensim.models import word2vec
model.most_similar(positive=['아빠', '여자'], negative=['남자'])
</syntaxhighlight>
</syntaxhighlight>
|}
|}
[[분류:텍스트 분석]]
[[분류:텍스트 분석]]