퍼셉트론이란, 다수의 신호를 입력받아 하나의 신호를 출력하는 것을 의미한다. 이는 딥러닝의 기원이 되는 알고리즘이며, 입력층과 출력층만 존재하는 단층 퍼셉트론과 입력층과 출력층 외에 층을 추가한 다층 퍼셉트론으로 나뉘어진다.
각 원을 뉴런 또는 노드라고 부르는데, xi 값들을 입력신호라고 부르고 wi 값들을 가중치, output (y) 값을 출력신호라고 부른다. 이 때, 가중치가 클수록 해당 신호는 더 중요하다는 의미로도 해석할 수 있다.
퍼셉트론의 동작 원리를 수식으로 나타낸다면, 아래와 같다.
y = 0 (w1*x1 + wx*x2 + ... + wi*xi <= 𝜽)
1 (w1*x1 + wx*x2 + ... + wi*xi > 𝜽)
입력신호와 가중치의 곱들을 합한 값이 임의로 설정한 𝜽 (임계값) 보다 크다면, 다음 신호로 흘려보낸다는 의미이고 그렇지 않다면, 다음 신호로 흘려보내지 않는다는 의미이다.
하지만, 이 때 𝜽를 설정하는 것은 인간이므로 적절한 매개변수 값을 정하는 작업이 매우 중요하다.
위의 퍼셉트론 수식을 아래와 같이 바꿔서도 표현할 수 있다.
y = 0 (b + w1*x1 + wx*x2 + ... + wi*xi <= 0)
1 (b + w1*x1 + wx*x2 + ... + wi*xi > 0)
퍼셉트론이 입력신호에 가중치를 곱한 값과 편향을 합하여, 그 값이 0을 넘으면 1을 출력하고 그렇지 않다면, 0을 출력한다는 의미이다.
wi(가중치)는 각 입력 신호가 결과에 주는 영향력(중요도)을 조절하는 매개변수이고, b(편향)은 뉴련이 얼마나 쉽게 활성화하느냐를 조정하는 매개변수이다.
단층 퍼셉트론으로는 비선형을 구분할 수 없다는 한계가 존재한다. 이를 극복하기 위해서 층을 하나 더 쌓는 다층 퍼셉트론을 사용한다.
다층 퍼셉트론은 단층 퍼셉트론과 다르게 중간에 층이 하나 이상 존재한다. 이를 은닉층이라고 부른다.
<사진 출처>
'Data Science > DL' 카테고리의 다른 글
[DL] - 딥러닝 강의 정리 (0) | 2021.08.20 |
---|