분류:LSTM
1 개요편집
Long Short-Term Memory. RNN에 기반한 아키텍쳐. 연속적인 맥락에서 주로 사용된다. RNN의 기울기 소실(vanishing gradient)문제를 해결하기 위해 만들어졌다.
중간의 결과데이터를 따로 저장하여 과거의 데이터도 연산에 반영하는 전략.
1.1 역사편집
1997년 제안됨.
1.2 사용편집
비디오 예측, 대화, 금융거래 등 연속적 데이터에서 강점.
서로 연관되며 연속적인 데이터 형태에 사용.
1.3 유의편집
과거로부터 미래를 예측하려 한다면 데이터가 무작위로 섞이지 않게끔.(미래의 정보가 누설된다.) 훈련세트의 데이터보다 테스트세트의 데이터가 미래의 것이어야 한다.