카테고리 없음

training neural networks part2 cs231 7강 PART2 복습 2월 22일

robotgo 2021. 2. 22. 14:23

training neural networks part2

내용이 많이 압축되어있다.

파트원에서 액티베이션 함수 배웠는데 렐루를 가장많이 쓴다.

노말라이제이션으로 차원축소 (정규분포화)

배치노말라이제이션 배치별로 노말라이제이션 하는것

 

옵티마이제이션

sgd문제 : 매우느리게 진행되고 지그재그로간다. 로컬미니마, 새들포인트

모멘텀 :  속력을 주어 로컬미니마와 새들포인트를 빠져나갈 수 있게 한다.

네스트로브 모멘텀 : 선 벨로시티 후 모멘텀. 문제 - 뉴럴네트워크 문제가 있다. 

아다그라드 방식 : 스텝을 조금씩 줄이는

알엠에스 프롭 :  문제 : 오버슈팅이 일어난다.

아담도 오버슈팅이 일어난다.

러닝레이트는 첨에 크게 주고 조금씩 줄이는게 좋다 !

RESNET에서도 이렇게 썼는데 

SGD MOMENTOM에서 이방법을 많이 쓰는데 아담에선 딱히 쓰진 않는다.

 

트레인정확도와 테스트정확도 거리가 멀어지는 것을 어떻게 해결할까?

앙상블이 좋다. 스냅샷을 찍는다.

 

하지만 앙상블도 잘 안쓴다.

드랍아웃을 하거나 데이터 어그멘테이션( 트레인데이터 이미지 회전, 부분 컷팅, 밝기조절 등)

드랍아웃은 모델들의 큰 앙상블이라 볼 수 있다. 랜덤하게 없어지기 때문에 

 

트렌스퍼 러닝 - 전이학습 - 전이학습은 데이터가 많이 필요하다

이미지넷은 엄청 큰 데이터 이다.

처음에 플리 커넥티드를 붙여준다.

데이터를 보면 FC레이어가 딥해질수록 스텍시픽 하다

데이터가 적으면 FC레이어만 튜닝

데이터가 많으면 몇몇개 더 파인튜닝해라

 

ex 9 과제를 할때 앙상블을 썼는데 머신러닝 XGBOOST ,LGBM, RANDOTFOREST 각각 다란 모델을 앙상블을 했는데

cnn 7개 앙상블을 했다는건 어떤 방식으로 앙상블을 한건지, 그러니깐 머신러닝 앙상블 기법은 알겠는데 딥러닝 앙상블 기법은 뭔지