본문 바로가기
모두의 연구소 AIFFEL 교육

모델 파라미터와 하이퍼 파라미터

by robotgo 2021. 2. 4.
  • 모델 파라미터는 모델이 학습을 하면서 점차 최적화되는, 그리고 최적화가 되어야 하는 파라미터입니다.
    예를 들어 선형 회귀의 경우 y_pred = W*x + b 라는 식으로 예측값을 만들어 낼 텐데, 여기에서 모델 파라미터는 W 입니다. 모델은 학습 과정을 거치면서 최적의 y_pred 값, 즉 y_true에 가장 가까운 값을 출력해낼 수 있는 최적의 W를 찾아나갈 것입니다.
  • 반면, 하이퍼 파라미터는 모델이 학습을 하기 위해서 사전에 사람이 직접 입력해 주는 파라미터입니다.
    이는 모델이 학습하는 과정에서 변하지 않습니다. 예를 들어 학습 횟수에 해당하는 epoch 수, 가중치를 업데이트할 학습률(learning rate), 또는 선형 규제를 담당하는 labmda 값 등이 이에 해당합니다.

'모두의 연구소 AIFFEL 교육' 카테고리의 다른 글

cs231 7장  (0) 2021.02.15
2021년 2월 15일  (0) 2021.02.15
시그모이드 지그재그  (0) 2021.02.01
2월 1일 cs231n 6강 메모  (0) 2021.02.01
pooling 이란  (0) 2021.02.01