반응형
Class Activation Map(CAM), Learning Deep Features for Discriminative Localization
https://arxiv.org/abs/1512.04150
마지막 Conv layer의 출력값을 Fully-connected layer로 전달하려 예측을 수행한다. 이 conv의 마지막 출력값에 모델이 카테고리를 예측하는 데에 영향력이 높은 region 정보를 갖고 있다는 가정하에 이를 활용한다.
마지막 conv 출력값의 각 채널은 서로 다른 visual pattern 정보를 갖고 있다. 이 각 채널에 class에 영향력을 갖는 정도를 나타내는 weight를 가하고 더해서 class activation map을 만든다.
w는 feature map에 GAP 적용해서 얻은 벡터에 softmax로 구하는듯? 자세하게는 모르겠당
w를 계산하는 과정에서 GAP이 필요하므로 GAP(global average pooling)이 존재하는 모델에만 적용할 수 있다는 한계점이 존재한다.
반응형