분류:LSTM
둘러보기로 가기
검색하러 가기
1 개요
Long Short-Term Memory. RNN에 기반한 아키텍쳐. 연속적인 맥락에서 주로 사용된다. RNN의 기울기 소실(vanishing gradient)문제를 해결하기 위해 만들어졌다.
중간의 결과데이터를 따로 저장하여 과거의 데이터도 연산에 반영하는 전략.
1.1 역사
1997년 제안됨.
1.2 사용
비디오 예측, 대화, 금융거래 등 연속적 데이터에서 강점.
서로 연관되며 연속적인 데이터 형태에 사용.
1.3 유의
과거로부터 미래를 예측하려 한다면 데이터가 무작위로 섞이지 않게끔.(미래의 정보가 누설된다.) 훈련세트의 데이터보다 테스트세트의 데이터가 미래의 것이어야 한다.