안녕하세요, 오늘 읽은 논문은 Learning Data Augmentation Strategies for Object Detection 입니다.
classification에서 사용하는 augmentation(horizontal flip, resize)을 object detection에 적용하는 것은 성능 향상에 한계가 존재합니다. 해당 논문은 Object Detection을 위한 data augmentation을 연구합니다.
Method
최적의 augmentation 방법을 찾기 위해서 search space를 구성합니다. 여러개의 sub-policy를 생성하며, 각 sub-policy에는 2개의 operation이 적용됩니다. operation에는 2개의 hyper parameter가 존재합니다. (1) L magnitude of the operation. (2) M probability parameter. 입니다. L과 M은 uniformly space value에서 sample 합니다.
22개의 operation에서 2개 operation을 골라 sub-policy를 구성합니다. operation 예시는 다음과 같습니다.
sub-policy를 구성한 후에 RL로 최적의 policy를 탐색합니다. 또한 COCO dataset을 사용하는데 모든 data sample을 사용하는 것은 연산량이 너무 많아 5K coco image만을 사용하여 policy를 탐색합니다.
Result
5개의 top sub-policy를 찾아내어 dataset에 적용하여 실험합니다. 그리고 이 policy들을 learned augmentation policy라고 부릅니다. 위 그림이 선택된 5개의 sub-policy입니다.
good policy에서 가장 흔하게 사용한 operation은 Rotate와 Equalize, BBox_only_TranslateY 입니다. rotate는 이미지 회전, Equalize는 pixel value의 histogram을 flatten, BBox_only_TranslateY는 bbox내의 이미지를 translation한것을 의미합니다.
위 그림은 learned augmentation policy가 dataset의 크기가 적은 경우에 큰 효과를 보인다는 실험결과입니다.
learned augmentation policy는 small dataset과 small object에서 좋은 효과를 보입니다.
map75 평가지표에서 효과가 증가합니다. 즉, learned augmentation policy를 적용하면 모델이 정교하게 바운딩 박스를 예측할 수 있습니다.
learend augmentation policy는 정교화효과도 갖습니다.
참고문헌