바뀜
둘러보기로 가기
검색하러 가기
← 이전 편집
다음 편집 →
오차역전파법
(편집)
2021년 9월 15일 (수) 21:21 판
998 바이트 추가됨
,
2021년 9월 15일 (수) 21:21
→softmax
8번째 줄:
8번째 줄:
= 사용예 =
= 사용예 =
각 층을 클래스로 만들고, 해당 레이어의 전방전파, 후방전파 메서드를 만들어 구현한다.
각 층을 클래스로 만들고, 해당 레이어의 전방전파, 후방전파 메서드를 만들어 구현한다.
+
+
처음 출발하는 수는 1이다. <math>\frac{\partial L}{\partial L} =1</math>이므로.
== Relu ==
== Relu ==
59번째 줄:
61번째 줄:
== softmax ==
== softmax ==
원리는 다음 affine 계층에서의 역전파를 참고하자.
원리는 다음 affine 계층에서의 역전파를 참고하자.
+
+
일반적으로 Cross entropy error층과 함께 사용된다. 교차 엔트로피의 수식은 <math>L=-\sum_{k}t_k \ln y_k</math>이다. 역전파가 들어오면
+
+
=== 크로스엔트로피의 역전파 ===
+
+
* +의 역전파 -1을 그대로 전달하고,
+
* 위에 곱해 *의 역전파 두 입력을 바꾸어 각 노드에 <math>-t_k</math>가 전달되고,
+
* 위에 곱해 log의 역전파 <math>-\frac{t_k}{y_k}</math>를 전달한다.
+
+
=== 소프트맥스의 역전파 ===
+
+
* 입력값으로 <math>-\frac{t_k}{y_k}</math>가 들어오고,
+
* 나누어주는 값으론 <math>\frac{t_1+t_2+...}{S}</math>인데, t_k는 정답레이블이므로 다 더하면 1이 된다. 즉, 분모의 시그마로 나누는 과정의 역전파는 <math>\frac{1}{S}</math>
+
* 각각의 분자에는 <math>-\frac{t_k}{S y_k}</math>가 들어오고 exp연산에서 <math>y_k -t_k</math>가 결과로 나오게 된다.
=== 구현 ===
=== 구현 ===
Sam
사무관
,
인터페이스 관리자
,
관리자
, 교사
편집
1,408
번
둘러보기 메뉴
개인 도구
로그인하지 않음
토론
기여
계정 만들기
로그인
이름공간
문서
토론
변수
보기
읽기
편집
원본 편집
역사 보기
더 보기
검색
둘러보기
대문
최근 바뀜
임의의 문서로
미디어위키 도움말
도구
특수 문서 목록
인쇄용 판