밑바닥부터 시작하는 딥러닝(활성화함수, 인공신경망, MNIST)

딥러닝

ROSEV 2021. 10. 21. 17:42

말그대로, 입력 신호의 총합이 활성화를 일으키는지를 정하는 역할을 합니다. 즉, 입력된 데이터의 가중 합을 출력 신호로 변환하는 함수를 뜻합니다.

위는 활성화 함수의 처리과정을 나타내며, 가중치 신호를 조합한 결과가 a라는 노드가 되고, 활성화함수 h()를 통과하여 y라는 노드로 변환되는 과정입니다.

시그모이드 함수
- h(x)식에 값을 대입했을 때, 아래와 같은 그래프가 나타납니다.
- 계단함수를 사용하지않고, 시그모이드를 사용하는 이유는 기계가 학습할 때 미분을 통해 학습을 하는데 계단함수의 경우 0을 제외하고 미분계수가 0이므로 신경망에서는 계단함수를 사용하지 않습니다.

벡터를, 지수함수를 적용하고 normalize하여 확률벡터로 변환합니다.
전체 벡터의 같은 수를 합치거나 뻬는 경우에도 동일한 확률 값이 나오므로, 이를 이용하여 너무 큰 수의 벡터에 대해 가장 큰 값을 동일하게 빼서, overflow를 방지할 수 있습니다.

그래서 위와 같이 신경망이 학습을 합니다.

밑바닥부터 시작하는 딥러닝(오차역전파법, affine층 역전파, simoid, Relu) (1)	2021.11.11
퍼셉트론과 인공신경망 (0)	2021.09.23

원론

Retry as Sudo, FlashBack, 특정시점, r, BigQuery, DB복구, 시간이동, sudo,

원론