기계학습에선 여러 모델의 출력을 평균내어 답을 내는 앙상블학습이 정확도가 높다는 것이 실험적으로 알려져 있는데, 드롭아웃은 여러 모델을 만드는 효과를 한 모델에서 구현한 것이라 보아도 되겠다.
기계학습에선 여러 모델의 출력을 평균내어 답을 내는 앙상블학습이 정확도가 높다는 것이 실험적으로 알려져 있는데, 드롭아웃은 여러 모델을 만드는 효과를 한 모델에서 구현한 것이라 보아도 되겠다.
+
+
= 하이퍼파라미터 =
+
훈련률, 가중치 감소 계수 등에서 어떤 값이 잘 들어맞을지는 직접 돌려봐야 알 수 있다. 각각의 훈련에서 수천번 이상의 훈련이 이루어지니, 하이퍼파라미터를 찾는 과정은 로그스케일로 널찍널찍하게 정해 연산을 수행한다. 굉장히 오랜시간이 걸리므로 가능성이 없는 값은 초기에 포기하는 편이 효율적이다. 가장 적절한 값이 있는 범위를 좁혀나가면서 최적의 값을 찾아나간다.