"데이터를 다룰 때 유의사항"의 두 판 사이의 차이

Pywiki
둘러보기로 가기 검색하러 가기
(새 문서: == 문자데이터를 다룰 때 == 문자데이터를 다룰 때 단순하게 숫자로 문자를 나열한다면 연속변수가 되어버린다. 인공지능 입장에선 앞단어...)
 
(차이 없음)

2021년 4월 21일 (수) 08:06 기준 최신판

문자데이터를 다룰 때[편집 | 원본 편집]

문자데이터를 다룰 때 단순하게 숫자로 문자를 나열한다면 연속변수가 되어버린다. 인공지능 입장에선 앞단어와 뒷단어가 연관되어 있는 것처럼 처리한다.

만약 데이터끼리 관련이 없는 거라면 차원을 달리하여 0 0 0 1 과 1 0 0 0 처럼 다른 차원의 벡터로 표현하는 게 맞다. 용량은 늘어날지언정, 데이터를 독립적으로 처리할 수 있다.