분류:LSTM

Pywiki
Sam (토론 | 기여)님의 2022년 1월 20일 (목) 16:56 판 (→‎개요)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
둘러보기로 가기 검색하러 가기

1 개요[편집 | 원본 편집]

Long Short-Term Memory. RNN에 기반한 아키텍쳐. 연속적인 맥락에서 주로 사용된다. RNN의 기울기 소실(vanishing gradient)문제를 해결하기 위해 만들어졌다.

중간의 결과데이터를 따로 저장하여 과거의 데이터도 연산에 반영하는 전략.

1.1 역사[편집 | 원본 편집]

1997년 제안됨.

1.2 사용[편집 | 원본 편집]

비디오 예측, 대화, 금융거래 등 연속적 데이터에서 강점.

서로 연관되며 연속적인 데이터 형태에 사용.

1.3 유의[편집 | 원본 편집]

과거로부터 미래를 예측하려 한다면 데이터가 무작위로 섞이지 않게끔.(미래의 정보가 누설된다.) 훈련세트의 데이터보다 테스트세트의 데이터가 미래의 것이어야 한다.

2 응용[편집 | 원본 편집]

"LSTM" 분류에 속하는 문서

다음은 이 분류에 속하는 문서 2개 가운데 2개입니다.