학부 수업 내용 정리/인공지능심화

#19 CNN Architecture (2)

supersumin 2024. 11. 26. 00:01

1. VGG

Conv layer: 3x3 filters, stride 1, pad 1

Pooling layer: max pooling in 2x2, stride 2

 

얘는 코드 보면서 공부 18장도 마찬가지

 

filter의 tensor는 사이즈 제곱*이전채널수*필터의개수

FC는 모든 pixel곱하기 다음 채널수

 

2. ResNet

degradation problem을 해결하기 위해 Residual을 더하게 되며 이는 모델 학습을 더 쉽게 만들어준다.

입력 신호를 그대로 전달하여 정보 손실을 방지하고 학습의 안정성을 높인다.

잔차를 학습함으로써 전체 변환함수보다 더 간단하고 효율적인 학습을 가능하게 한다.