"분류:텍스트 분석"의 두 판 사이의 차이

Pywiki
둘러보기로 가기 검색하러 가기
 
3번째 줄: 3번째 줄:
 
== 자료획득 ==
 
== 자료획득 ==
 
{| class="wikitable"
 
{| class="wikitable"
!
+
!소스
 
!설명
 
!설명
 
|-
 
|-
9번째 줄: 9번째 줄:
 
|국립국어원 언어정보 나눔터 말뭉치 데이터베이스.
 
|국립국어원 언어정보 나눔터 말뭉치 데이터베이스.
 
|-
 
|-
 +
|[http://dumps.wikimedia.org/kowiki/latest/ 위키디피아 한국어판]
 
|
 
|
|
+
|}
 +
 
 +
=== 자료 정규화 ===
 +
{| class="wikitable"
 +
!의도
 +
!방법
 +
|-
 +
|XML을 텍스트로
 +
|wp2txt를 설치하여 사용한다.
 
|}
 
|}

2021년 4월 29일 (목) 22:40 기준 최신판

인공지능을 이용하여 텍스트를 분석하는 전략에 대해 모아둔 분류.

1 자료획득[편집 | 원본 편집]

소스 설명
국립국어원 국립국어원 언어정보 나눔터 말뭉치 데이터베이스.
위키디피아 한국어판

1.1 자료 정규화[편집 | 원본 편집]

의도 방법
XML을 텍스트로 wp2txt를 설치하여 사용한다.

"텍스트 분석" 분류에 속하는 문서

다음은 이 분류에 속하는 문서 5개 가운데 5개입니다.