반응형
안녕하세요 ~
VGG에서 사용한 5x5 Conv를 3x3Conv 2개로 대체했을 때 왜 파라미터가 수가 적어진다고 하는지 알아보겠습니다.
우선 가정을 해보십다~
output Feature map size: HXW,
input Channel, output Channel = 1 라고 생각하면 쉬울거 같아요.
파라미터 및 곱셈 연산량 비교
5x5 Conv | 3x3 Conv + 3x3 Conv | |
Params | 25 | 18 |
Multiplication | 25HW | 18(HW + H + W +2) |
계산을 해보면 다음과 같은 결과를 얻을 수 있습니다.
따라서 항상 5x5 Conv가 3x3 Conv + 3x3 Conv보다 파라미터수는 적음을 확인 할 수 있지만, 연산량에 있어서는 항상 3x3Conv + 3x3Conv가 더 좋다고 말할 수는 없습니다.
따라서 output Feature map의 사이즈가 6x6보다 크다면, 5x5 Conv를 3x3 Conv 2개로 교체를 해주면 좋다는 결과를 얻을 수 있습니다!
추가적으로 이를 바탕으로 3x3 Conv가 1x3 Conv + 3x1 Conv로 대채되기도하는데 , 다음과 같이 대체했을 때 얼마나 파라미터면에서 또는 연사량면에서 이득이 되는지 직접 해보시는것도 좋을거 같습니다.
감사합니다~
반응형
'AI' 카테고리의 다른 글
RuntimeError: The size of tensor a (4) must match the size of tensor b (3) at non-singleton dimension 0 (0) | 2021.11.09 |
---|---|
torch.nn 과 torch.nn.functional 차이점! (0) | 2021.11.08 |
[논문리뷰] DropBlock: A regularization method forconvolutional networks (0) | 2021.11.02 |
Distance-IOU Loss (DIOU) 논문 리뷰 (0) | 2021.07.12 |
오차역전파-1 (딥러닝) 곱셉노드, 덧셈노드 (0) | 2021.06.20 |