Sam (토론 | 기여)님의 2021년 4월 21일 (수) 08:06 판
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
문자데이터를 다룰 때[편집 | 원본 편집]
문자데이터를 다룰 때 단순하게 숫자로 문자를 나열한다면 연속변수가 되어버린다. 인공지능 입장에선 앞단어와 뒷단어가 연관되어 있는 것처럼 처리한다.
만약 데이터끼리 관련이 없는 거라면 차원을 달리하여 0 0 0 1 과 1 0 0 0 처럼 다른 차원의 벡터로 표현하는 게 맞다. 용량은 늘어날지언정, 데이터를 독립적으로 처리할 수 있다.