분류:LSTM
둘러보기로 가기
검색하러 가기
1 개요[편집 | 원본 편집]
Long Short-Term Memory. RNN에 기반한 아키텍쳐. 연속적인 맥락에서 주로 사용된다. RNN의 기울기 소실(vanishing gradient)문제를 해결하기 위해 만들어졌다.
중간의 결과데이터를 따로 저장하여 과거의 데이터도 연산에 반영하는 전략.
1.1 역사[편집 | 원본 편집]
1997년 제안됨.
1.2 사용[편집 | 원본 편집]
비디오 예측, 대화, 금융거래 등 연속적 데이터에서 강점.
서로 연관되며 연속적인 데이터 형태에 사용.
1.3 유의[편집 | 원본 편집]
과거로부터 미래를 예측하려 한다면 데이터가 무작위로 섞이지 않게끔.(미래의 정보가 누설된다.) 훈련세트의 데이터보다 테스트세트의 데이터가 미래의 것이어야 한다.