반응형

논문 읽기 27

[논문 읽기] DIoU Loss(2020), Distance-IoU Loss, Faster and Better Learning for Bounding Box Regression

안녕하세요, 오늘 읽은 논문은 Distance-IoU Loss Fater and Better Learning for Bounding Box Regression 입니다. 이 논문에서는 bounding box regression loss인 CIoU Loss와 DIoU Loss를 제안합니다. DIoU Loss는 target box와 predicted box 사이의 IoU와 중심점을 요소로 Loss를 계산합니다. DIoU Loss는 NMS의 threshold로 사용합니다. IoU를 threshold로 사용하는 것보다 중심점과 IoU를 고려하는 DIoU를 threshold로 사용한다면 class가 동일한 ground-truth box가 겹쳐있는 경우에 supression 하는 것을 방지할 수 있습니다. CIoU ..

[논문 읽기] EfficientDet(2020), Scalable and Efficient Object Detection

안녕하세요, 오늘 읽은 논문은 EfficientDet: Scalabel and Efficient Object Detection 입니다. EfficientDet은 backbone으로 efficient net을 사용하며, weighted bi-directional feature pyramid network(BiFPN)과 compound scaling을 제안합니다. BiFPN BiFPN은 Cross-Scale Connection과 weighted feature fusion을 사용합니다. (1) Cross-Scale Connection 기존의 FPN은 한 방향으로만 정보가 흐른다는 단점이 존재합니다. 이를 해결하기 위해 PANet은 bottom-up path를 추가합니다. NAS-FPN은 architecture..

[논문 읽기] Hourglass(2016), Stacked Hourglass Networks for Human Pose Estimation

오늘 읽은 논문은 'Stacked Hourglass Networks for Human Pose Estimation' 입니다. pose estimation 논문은 처음 읽어보네요ㅎㅎ hourglass network를 첫 논문으로 선택한 이유는 detection 분야에서 CornerNet이 hourglass을 backbone으로 사용하기 때문입니다. hourglass로 찾아낸 특징점을 바운딩 박스를 생성하는데 사용하는데요ㅎㅎ hourglass network가 무엇인지 호기심이 생겨 읽게 되었습니다! 논문을 읽고 아쉬웠던 점은, loss function이 정확하게 나와있지 않았었습니다. pose estimation 분야는 어떻게 loss를 계산하는지 궁금했었는데, 단순히 mse loss를 사용한다고만 나와있었..

[논문 읽기] Soft-NMS(2017), Improving Object Detection With One Line of Code

안녕하세요! 이번에 읽어볼 논문은 Soft-NMS, Improving Object Detection With One Line of Code 입니다. NMS 문제점 [Object Detection] 비-최대 억제(NMS, Non-maximum Suppression)를 이해하고 파이토치로 구현하기 안녕하세요! 이번 포스팅에서는 비-최대 억제(NMS,Non-maximum Suppression)을 알아보도록 하겠습니다. 비최대 억제를 이해하기 위해서는 IoU(intersection over unio)에 대한 개념을 알아야합니다. IoU에.. deep-learning-study.tistory.com Soft-NMS는 NMS의 문제점을 개선하기 위해 제안되었습니다. NMS에는 어떤 문제점이 존재할까요?? 동일한 클..

[논문 읽기] CoupleNet(2017), Coupling Global Structure with Local Parts for Object

안녕하세요! 거의 한달 만에 논문을 읽어보네요..ㅎㅎ 그동안 다른 공부를 하느라 논문 읽기에 소흘했었습니다! 다시 열심히 논문을 읽도록 하겠습니다ㅎㅎ! 이번에 읽어볼 논문은 Object Detection 분야에서 2017년에 제안된 CoupleNet입니다! 2017년까지 Object Detection의 발전 방향을 보면, Faster R-CNN과 R-FCN이 좋은 결과를 성취합니다. CoupleNet은 R-FCN에서 제안하는 position-sensitive RoI Pooling(PSRoI)의 문제점을 지적합니다. PSRoI는 region proposals에서 local 정보를 활용하여 성능을 향상시키지만, 이는 Global 정보와 context를 훼손시킨다고 말합니다. CoupleNet은 local과 ..

[논문 읽기] DeepLabV1(2014) 리뷰, Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs

두 번째 semantic segmentation 논문입니다. semantic segmentation 논문은 읽어도 이해가 잘 안되네요. 배경지식이 부족해서 그런 것 같습니다. 논문을 많이 읽을수록 배경지식이 쌓이므로, 열심히 읽도록 하겠습니다. Astract Deep Convolutional Neural Networks(DCNNs)를 pixel-level classification 문제를 해결하기 위해 사용합니다. DCNNs의 마지막 레이어에서의 특징은 정확한 object segmentation을 포착하기에 부족합니다. 이것은 DCNNs의 invariance 특징 때문입니다. 부정확한 localization문제를 DCNNs의 마지막 레이어에서의 responses와 fully connected Condit..

[논문 읽기] FCN(2015) 리뷰, Fully Convolutional Networks for Semantic Segmentation

공부 목적으로 FCN 논문을 읽어보았습니다. Abstract FCN은 end-to-end, pixels-to-pixels 학습이 되는 convolutional network입니다. 핵심 아이디어는 임의의 크기로 입력 값을 받고, 그에 해당하는 출력값을 생성하는 'fully convolutional network' 입니다. AlexNet, GoogLeNet, VGGnet과 같은 classification 신경망을 사용하고, 이들을 segmentation task에 맞게 fine-tunning 합니다. 그리고나서 shallow의 정보와 deep의 정보를 결합하는 새로운 구조를 정의합니다. 1. Introduction Semantic segmentation은 coarse부터 fine까지 inference를 통..

반응형