반응형

object detection 48

[논문 읽기] CenterNet(2019), Keypoint Triplets for Object Detection

안녕하세요! 오늘 읽은 논문은 CenterNet, Keypoint Triplets for Object Detection 입니다. CenterNet은 두 쌍의 특징점으로 바운딩 박스를 예측하는 CornerNet의 단점을 개선하기 위해 세 쌍의 특징점을 활용합니다. 좌측 상단, 우측 하단, 중앙점 정보를 활용하여 바운딩 박스를 예측하며, 이를 위해 Center pooling과 Cascade corner pooling을 제안합니다. [논문 읽기] CornerNet(2018), Detecting Objects as Paired Keypoints 안녕하세요! 오늘 읽은 논문은 CornerNet, Detecting Objects as Paired Keypoints 입니다. CornerNet은 두 쌍의 특징점(key..

[논문 읽기] M2Det(2019), A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network

안녕하세요! 오늘 읽은 논문은 M2Det, A Single-Shor Object Detector based on Multi-Level Feature Pyramid Network 입니다. M2Det은 1-stage object detection model이며, FPN을 개선한 MLFPN을 제안합니다. MLFPN은 FFM, TUM, SFAM 세 가지 모듈로 구성되어 있습니다. M2Det은 왜 등장하게 되었을까요?? M2Det의 등장 배경 M2Det은 FPN의 한계을 개선한 MLFPN을 제안합니다. FPN의 한계는 다음과 같습니다. FPN의 한계 (1) FPN은 Object detection을 수행할만큼의 충분한 표현력을 갖고있지 못합니다. FPN은 backbone에서 생성한 feature map을 이용합니다..

[논문 구현] PyTorch로 RetinaNet(2017) 구현하고 학습하기

RetinaNet을 파이토치로 구현하고, VOC dataset으로 전이 학습까지 진행해보도록 하겠습니다. Computer Vision을 공부하시는 분들에게 많은 도움이 됬으면 합니다. 저도 공부하는 과정에 있어, 구현이 완벽하지 않습니다. 개선점이 있다면 지적 바랍니다. 논문 리뷰는 아래에서 확인하실 수 있습니다. [논문 읽기] RetinaNet(2017) 리뷰, Focal Loss for Dense Object Detection RetinaNet 논문은 모델이 예측하기 어려운 hard example에 집중하도록 하는 Focal Loss를 제안합니다. ResNet과 FPN을 활용하여 구축된 one-stage 모델인 RetinaNet은 focal loss를 사용하여 two-stage 모델 Fas.. dee..

논문 구현 2021.05.06

[논문 읽기] CornerNet(2018), Detecting Objects as Paired Keypoints

안녕하세요! 오늘 읽은 논문은 CornerNet, Detecting Objects as Paired Keypoints 입니다. CornerNet은 두 쌍의 특징점(keypoints)를 사용하여 객체의 바운딩 박스를 예측하는 모델입니다. 두 쌍의 특징점은 좌촉 상단 모서리, 우측 하단 모서리를 의미합니다. 특징점을 기반으로 바운딩 박스를 생성하기 때문에 앵커 박스를 사용할 필요가 없습니다. 앵커 박스가 없는 detection 모델이라니..!! 신기하네요. ㅎㅎ CornerNet은 앵커박스를 사용하지 않고도 다른 모델을 뛰어넘는 성능을 보여줍니다. 특징점을 검출하기 위해 pose estimation에서 사용하는 hourglass를 backbone으로 사용합니다. hourglass의 출력값에 좌측 상단 특징점..

[PyTorch] PyTorch에서 제공하는 VOC dataset 불러와서 사용하기

voc dataset을 pytorch에서 제공하는 사실을 알고 계셨나요?! 저는 최근에 알게 되었는데요..ㅎㅎ 알기 전까지 많은 삽질을 했습니다..! pytorch에서 제공하는 voc dataset을 활용하는 방법에 대해 정리한 게시글이 없어서 한번 정리해보도록 하겠습니다! object detection을 공부하시는 분들에게 많은 도움이 됬으면 합니다. dataset을 불러오고, transforms를 적용한 뒤에 dataloader를 생성해보도록 하겠습니다. 필요한 라이브러리를 import 합니다. from torchvision.datasets import VOCDetection from PIL import Image, ImageDraw, ImageFont from torchvision.transform..

[논문 읽기] RefineDet(2018), Single-Shot Refinement Neural Network for Object Detection

안녕하세요! 오늘 읽은 논문은 RefineDet, Single-Shot Refinement Neural Network for Object Detection 입니다. RefineDet은 1-stage 모델과 2-stage 모델의 장점을 모두 활용한 모델입니다. 실제 모델 구조를 보면, 1-stage 로 식별해야 할지 2-stage로 식별해야 할지 상당히 애매한 구조를 갖고 있습니다. 논문 저자는 1-stage 모델이라고 표현하네요. 대신에 Two-Step Cascaded Regression이라는 표현을 사용합니다. RefineDet RefineDet은 2가지 모듈로 구성되어 있으며, 이 두 모듈을 연결해줄 block이 존재합니다. 첫 번째 모듈은 ARM(anchor refinement module)이며 A..

[논문 읽기] Soft-NMS(2017), Improving Object Detection With One Line of Code

안녕하세요! 이번에 읽어볼 논문은 Soft-NMS, Improving Object Detection With One Line of Code 입니다. NMS 문제점 [Object Detection] 비-최대 억제(NMS, Non-maximum Suppression)를 이해하고 파이토치로 구현하기 안녕하세요! 이번 포스팅에서는 비-최대 억제(NMS,Non-maximum Suppression)을 알아보도록 하겠습니다. 비최대 억제를 이해하기 위해서는 IoU(intersection over unio)에 대한 개념을 알아야합니다. IoU에.. deep-learning-study.tistory.com Soft-NMS는 NMS의 문제점을 개선하기 위해 제안되었습니다. NMS에는 어떤 문제점이 존재할까요?? 동일한 클..

[논문 읽기] Cascade R-CNN(2018), Delving into High Quality Object Detection

안녕하세요! 이번에 읽어볼 논문은 Cascade R-CNN, Delving into High Quality Object Detection 입니다. Object Detection을 수행할 때, IoU는 RPN에서 생성한 region proposals가 positive인지 negative인지 결정하는 하이퍼 파라미터로 이용합니다. 일반적으로 낮은 IoU를 설정하면 detection 바운딩 박스 위치 결과값이 부정확하고, 높은 IoU를 설정하면, 바운딩 박스 위치 결과값이 정확한 대신에 detection의 전체 성능이 감소합니다.(많은 proposals를 검출하지 못하기 때문에, recall이 감소해 AP가 감소합니다.) 이처럼 IoU는 detection의 성능에 큰 영향을 미칩니다. Cascade R-CNN..

[논문 읽기] CoupleNet(2017), Coupling Global Structure with Local Parts for Object

안녕하세요! 거의 한달 만에 논문을 읽어보네요..ㅎㅎ 그동안 다른 공부를 하느라 논문 읽기에 소흘했었습니다! 다시 열심히 논문을 읽도록 하겠습니다ㅎㅎ! 이번에 읽어볼 논문은 Object Detection 분야에서 2017년에 제안된 CoupleNet입니다! 2017년까지 Object Detection의 발전 방향을 보면, Faster R-CNN과 R-FCN이 좋은 결과를 성취합니다. CoupleNet은 R-FCN에서 제안하는 position-sensitive RoI Pooling(PSRoI)의 문제점을 지적합니다. PSRoI는 region proposals에서 local 정보를 활용하여 성능을 향상시키지만, 이는 Global 정보와 context를 훼손시킨다고 말합니다. CoupleNet은 local과 ..

[논문 읽기] DCN(2017) 리뷰, Deformable Convolution Networks

안녕하세요! 이번에 읽어볼 논문은 DCN, Deformable Convolution Networks 입니다! DCN은 (1) deformable convolution, (2) deformable RoI pooling 두 가지 방법을 제시합니다. 기존 CNN 구조 모델은 고정된 구조만을 사용했었습니다. 예를 들어, 3x3 conv filter를 사용하면 3x3 수용 영역에서만 특징을 추출하는 것입니다. 이 경우에 translation-invariance가 생겨 object detection과 segmentation에 안좋은 영향을 줍니다. 이 논문은 고정된 수용 영역에서만 특징을 추출하는 것이 아니라, 좀 더 flexible한 영역에서 특징을 추출하는 방법을 제안합니다. 즉, 피쳐맵에서 규직적인 grid ..

반응형