논문 읽기/Object Detection

[논문 읽기] YOLOv4(2020), Optimal Speed and Accuracy of Object Detection

AI 꿈나무 2021. 5. 12. 10:11
반응형

 안녕하세요, 오늘 읽은 논문은 YOLOv4, Optimal Speed and Acuracy of Object Detection 입니다.

 

 YOLOv4는 빠른 실행 속도와 병렬 연산 최적화를 목표로 최신 기법을 적용하여 SOTA를 달성한 모델입니다. 다양한 최신 기법을 소개하고, 목적에 맞는 기법들을 선택합니다. 모르는 최신 기법들이 많이 보였습니다. 아직 공부가 많이 부족한 것 같네요...ㅎㅎ 추후에 하나하나 리뷰할 계획입니다. YOLOv4는 최종적으로 어떤 방법을 선택했는지 살펴보겠습니다.

 

YOLOv4

 YOLOv4는 다음과 같이 구성됩니다.

 

 사용하는 기법은 다음과 같습니다.

 

 Bag of Freebies는 inference cost를 증가시키지 않고, training strategy 또는 training cost만을 변화시키는 것을 의미합니다. 예를 들어, data augmentation, dataset 분포 조정(label smoothin), 손실 함수 등을 의미합니다.

 

 Bag of Specials는 inference cost를 증가시키는 모델 내부에 사용하는 모듈 또는 후처리 방법을 의미합니다. 예를 들어, NMS, M2Det에서 제안하는 SPMs, residual unit, 활성화 함수 등을 의미합니다.

 

 YOLOv4는 SAM과 PAN을 수정해서 사용합니다. 왜 이런 수정을 했는지에 대해서는 언급하고 있지 않습니다.

 

 

 YOLOv4에서 사용하는 기법을 리뷰한 포스팅입니다.

 

CSPNet

 

[논문 읽기] CSPNet(2020), A new backbone that can enhance learning capability of cnn

 안녕하세요, 오늘 읽은 논문은 'CPSNet: A new backbone that can enhance learning capability of cnn' 입니다.  이번 논문은 모델 구조를 gradient information 관점에서 설명하므로, 이해하는데에 오랜 시간..

deep-learning-study.tistory.com

 

SPPNet

 

 

[논문 리뷰] SPPnet (2014) 리뷰, Spatial Pyramid Pooling Network

 이번에 리뷰할 논문은 SPPnet 'Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition' 입니다. SPPnet 등장 배경  SPPnet은 CNN 구조가 고정된 입력 이미지 크기를 입력으로 취하는..

deep-learning-study.tistory.com

 

PAN

 

[논문 읽기] PANet(2018), Path Aggregation Network for Instance Segmentation

 안녕하세요, 오늘 읽은 논문은 PANet, Path Aggregation Network for Instance Segmentation 입니다.  PANet은 Mask R-CNN을 기반으로 Instance Segmentation을 위한 모델입니다. 이 논문에서 제안하는 Bottom-..

deep-learning-study.tistory.com

 

YOLOv3

 

[논문 읽기] YOLOv3(2018) 리뷰

이번에 읽어볼 논문은 'YOLOv3: An Incermetal Improvement' 입니다.  YOLOv3은 YOLOv2에서 개선된 버전입니다. 예를 들어, FPN을 사용하여 multi-scale에서 feature을 추출하고, shortcut connection을 활용한 D..

deep-learning-study.tistory.com

 

CutMix

 

[논문 읽기] CutMix(2019), Regularization Strategy to Train Strong Classifiers with Localizable Features

 안녕하세요, 오늘 읽은 논문은 CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features 입니다.  CutMix는 모델이 객체의 차이를 식별할 수 있는 부분에 집중하지 않고, 덜..

deep-learning-study.tistory.com

 

DropBlock

 

[논문 읽기] DropBlock(2018), A regularization method for convolutional networks

 안녕하세요, 오늘 읽은 논문은 DropBlock, A regularization method for convolutional networks 입니다.  딥러닝 모델은 훈련 데이터에 과적합 하지 않도록 어느 정도 학습을 방해하는 요소가 필요합니다. 예..

deep-learning-study.tistory.com

 

CIoU Loss, DIoU Loss, DIoU nms

 

[논문 읽기] DIoU Loss(2020), Distance-IoU Loss, Faster and Better Learning for Bounding Box Regression

 안녕하세요, 오늘 읽은 논문은 Distance-IoU Loss Fater and Better Learning for Bounding Box Regression 입니다.  이 논문에서는 bounding box regression loss인 CIoU Loss와 DIoU Loss를 제안합니다.  DI..

deep-learning-study.tistory.com

 

Mish

 

[논문 읽기] Mish(2019), A Self Regularized Non-Monotonic Activation Function

 안녕하세요, 오늘 읽은 논문은 Mish, A Self Regularized Non-Monotonic Activation Function 입니다.  Mish는 Computer Vision 딥러닝 구조에서 Swish, ReLU, Leaky ReLU 보다 좋은 성능을 타나냅니다. Mi..

deep-learning-study.tistory.com

 

Performance

 

 

 


참고자료

[1] arxiv.org/abs/2004.10934

반응형