45번째 줄: |
45번째 줄: |
| |명사만 추출 | | |명사만 추출 |
| |조사를 제거한다. | | |조사를 제거한다. |
| + | |
| + | |
| + | 형태소분석기 종류에 따라 결과가 조금씩 달라지니, 필요에 따라 선택하여 사용. |
| + | |
| + | 분석기에 대해선 [https://konlpy.org/ko/latest/morph/ 링크] 참조 |
| |<syntaxhighlight lang="python"> | | |<syntaxhighlight lang="python"> |
| import konlpy | | import konlpy |
− | hannanum = konlpy.tag.Hannanum() # 형태소 분석기 중 하나. | + | hannanum = konlpy.tag.Hannanum() # tag 하위에 제공되는 형태소 분석기 중 하나. |
| nouns = hannanum.nouns(text_data) # 명사만 추출한다. 리스트로 반환. | | nouns = hannanum.nouns(text_data) # 명사만 추출한다. 리스트로 반환. |
| </syntaxhighlight> | | </syntaxhighlight> |
85번째 줄: |
90번째 줄: |
| # 파워포인트 따위를 이용해 배경을 지운 후(그림서식>배경제거), | | # 파워포인트 따위를 이용해 배경을 지운 후(그림서식>배경제거), |
| # 검게 만들어 사용하자.(밝기 -100%) | | # 검게 만들어 사용하자.(밝기 -100%) |
| + | 컬러맵의 종류에 대한 것은 [https://matplotlib.org/stable/tutorials/colors/colormaps.html 링크]에서 확인하자. |
| |<syntaxhighlight lang="python"> | | |<syntaxhighlight lang="python"> |
| # 선택사항. 워드클라우드 모양 만들기. | | # 선택사항. 워드클라우드 모양 만들기. |
90번째 줄: |
96번째 줄: |
| back_img = PIL.Image.open('파일경로.png') # 워드클라우드는 기본적으로 사각형인데, 모양을 지정해줄 수 있다. | | back_img = PIL.Image.open('파일경로.png') # 워드클라우드는 기본적으로 사각형인데, 모양을 지정해줄 수 있다. |
| import numpy as np | | import numpy as np |
− | img = PIL.Image.net('RGB', back_img.size, (255,255,255))
| + | img_array = np.array(back_img) # 그림을 배열처리. |
− | img.paste(back_img, back_img)
| |
− | img = np.array(img) # 그림을 배열처리.
| |
| | | |
| from wordcloud import WordCloud | | from wordcloud import WordCloud |
| # 생성기. 생성에 필요한 옵션을 선언할 때 지정한다.(기본적으로 랜덤생성) | | # 생성기. 생성에 필요한 옵션을 선언할 때 지정한다.(기본적으로 랜덤생성) |
− | wc = WordCloud(mast = img, | + | wc = WordCloud(mast = img_array, |
| font_path = 'NanumGothic', # 설치된 글꼴 지정. 속은 .ttf 경로 지정. | | font_path = 'NanumGothic', # 설치된 글꼴 지정. 속은 .ttf 경로 지정. |
− | ) | + | colormap = 'inferno', |
| + | ...) |
| img_cloud = wc.generate_from_frequencies(word_dict) # 사전을 토대로 워드클라우드 생성. | | img_cloud = wc.generate_from_frequencies(word_dict) # 사전을 토대로 워드클라우드 생성. |
| plt.axis('off') # 테두리선 없애기. | | plt.axis('off') # 테두리선 없애기. |