본문 바로가기
Data Science/DL

[밑바닥부터 시작하는 딥러닝1] 퍼셉트론

by 호찌민 2021. 6. 30.

퍼셉트론이란, 다수의 신호를 입력받아 하나의 신호를 출력하는 것을 의미한다. 이는 딥러닝의 기원이 되는 알고리즘이며, 입력층과 출력층만 존재하는 단층 퍼셉트론과 입력층과 출력층 외에 층을 추가한 다층 퍼셉트론으로 나뉘어진다.

 

<단층 퍼셉트론 구조>

각 원을 뉴런 또는 노드라고 부르는데, xi 값들을 입력신호라고 부르고 wi 값들을 가중치, output (y) 값을 출력신호라고 부른다. 이 때, 가중치가 클수록 해당 신호는 더 중요하다는 의미로도 해석할 수 있다.

 

퍼셉트론의 동작 원리를 수식으로 나타낸다면, 아래와 같다.

 

y = 0 (w1*x1 + wx*x2 + ... + wi*xi <= 𝜽)

     1 (w1*x1 + wx*x2 + ... + wi*xi > 𝜽) 

 

입력신호와 가중치의 곱들을 합한 값이 임의로 설정한 𝜽 (임계값) 보다 크다면, 다음 신호로 흘려보낸다는 의미이고 그렇지 않다면, 다음 신호로 흘려보내지 않는다는 의미이다.

하지만, 이 때 𝜽를 설정하는 것은 인간이므로 적절한 매개변수 값을 정하는 작업이 매우 중요하다.

 

위의 퍼셉트론 수식을 아래와 같이 바꿔서도 표현할 수 있다.

 

y = 0 (b + w1*x1 + wx*x2 + ... + wi*xi <= 0)

     1 (b + w1*x1 + wx*x2 + ... + wi*xi > 0) 

 

퍼셉트론이 입력신호에 가중치를 곱한 값과 편향을 합하여, 그 값이 0을 넘으면 1을 출력하고 그렇지 않다면, 0을 출력한다는 의미이다.

wi(가중치)는 각 입력 신호가 결과에 주는 영향력(중요도)을 조절하는 매개변수이고, b(편향)은 뉴련이 얼마나 쉽게 활성화하느냐를 조정하는 매개변수이다.

 

단층 퍼셉트론으로는 비선형을 구분할 수 없다는 한계가 존재한다. 이를 극복하기 위해서 층을 하나 더 쌓는 다층 퍼셉트론을 사용한다.

 

<다층 퍼셉트론 구조>

다층 퍼셉트론은 단층 퍼셉트론과 다르게 중간에 층이 하나 이상 존재한다. 이를 은닉층이라고 부른다. 

 

<사진 출처>

https://wikidocs.net/24958

'Data Science > DL' 카테고리의 다른 글

[DL] - 딥러닝 강의 정리  (0) 2021.08.20