딥러닝 공부방

[논문 읽기] FCOS(2019), Fully Convolutional One-Stage Object Detection

안녕하세요, 오늘 읽은 논문은 FCOS, Fully Convolutional One-Stage Object Detection 입니다. FCOS는 앵커 박스를 사용하지 않는 one-stage detector 입니다. 바운딩 박스의 4면으로부터 중심점 까지의 거리(l, t, r, b)를 예측하고, FPN의 각 level마다 거리 (l,t,r,b)를 제한하여 multi-level prediction을 합니다. 또한 낮은 퀄리티의 바운딩 박스를 제거하기 위해 center-ness를 제안합니다. anchor-based detector의 단점 FCOS는 anchor-based detector에서 발생하는 단점을 개선하기 위해 제안되었습니다. (1) 디텍션 성능이 앵커 박스의 크기, 종횡비, 개수에 예민합니다. 앵커..

논문 읽기/Object Detection 2021.05.11

[논문 읽기] Gaussian YOLOv3(2019), An Accurate and Fast Object Detection Using Localization Uncertainty for Autonomous Driving

안녕하세요! 오늘 읽은 논문은 Gaussian YOLOv3, An Accurate and Fast Object Detection Using Localization Uncertainty for Autonomous Driving 입니다. YOLOv3을 기반으로 한 Gaussian YOLOv3은 바운딩 박스 좌표의 불확실성을 측정하여 불확실성, object score, class을 기준으로 최종 바운딩 박스를 선택합니다. 기존의 YOLOv3은 object score와 class만을 최종 바운딩 박스를 선택했기 때문에, 불확실성이 추가된 Gaussian YOLOv3이 더 좋은 정확도를 나타냅니다. 실제로 YOLOv3보다 FP(False Positive)를 낮추고 TP(True Positive)를 높이는 결과를 ..

논문 읽기/Object Detection 2021.05.10

[ISLR] 교차검증(Cross-validation), K-Fold, LOOCV

Resampling Methods Resampling Methods는 training data의 서로 다른 부분 집합을 사용하여 동일한 통계 모델을 여러번 fitting 하는 것을 의미합니다. 모델 평가(model assessment), 모델 선택(model selection)을 위해 사용합니다. 1. Validation Set Approach 전체 데이터 셋을 동일한 크기를 가진 2개의 집합으로 분할하여 training set, validation set을 만듭니다. 영향력이 큰 관측지가 어느 set에 속하느냐에 따라 MSE가 달라집니다. 관측치의 일부만 train에 속하여 높은 bias를 갖습니다. 2. LOOCV(Leave-One-Out Cross-Validation) 단 하나의 관측값(x1, y1..

수학/Statistical Learning 2021.05.09

[논문 읽기] CenterNet(2019), Keypoint Triplets for Object Detection

안녕하세요! 오늘 읽은 논문은 CenterNet, Keypoint Triplets for Object Detection 입니다. CenterNet은 두 쌍의 특징점으로 바운딩 박스를 예측하는 CornerNet의 단점을 개선하기 위해 세 쌍의 특징점을 활용합니다. 좌측 상단, 우측 하단, 중앙점 정보를 활용하여 바운딩 박스를 예측하며, 이를 위해 Center pooling과 Cascade corner pooling을 제안합니다. [논문 읽기] CornerNet(2018), Detecting Objects as Paired Keypoints 안녕하세요! 오늘 읽은 논문은 CornerNet, Detecting Objects as Paired Keypoints 입니다. CornerNet은 두 쌍의 특징점(key..

논문 읽기/Object Detection 2021.05.09

[ISLR] Classification - Logistic Regression, LDA, QDA, KNN

Classification 분류는 범주형 자료를 다룹니다. 더미 변수를 활용하면 범주형 자료를 선형 회귀로도 풀 수 있지만, X의 범위가 제한되지 않고 Y값을 확률로 출력하지 않는 문제점이 있습니다. 1. 로지스틱 회귀(Logistic Regression) p(X) 확률을 logistic function을 사용합니다. 최대 가능도가 높은 값을 갖는 계수 B0, B1을 추정합니다. X가 2개 이상일 때는 다음과 같이 확장할 수 있습니다. 특징 결정 경계를 선형으로 예측합니다. X의 분포가 가우시안이 아닌 경우에 LDA보다 좋은 성능을 나타냅니다. 출력값을 확률로 나타낼 수 있습니다. Y가 2개 이상인 경우에 LDA를 주로 사용합니다. 2. 선형 판별 분석(LDA, Linear Discriminant Ana..

수학/Statistical Learning 2021.05.08

[논문 읽기] M2Det(2019), A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network

안녕하세요! 오늘 읽은 논문은 M2Det, A Single-Shor Object Detector based on Multi-Level Feature Pyramid Network 입니다. M2Det은 1-stage object detection model이며, FPN을 개선한 MLFPN을 제안합니다. MLFPN은 FFM, TUM, SFAM 세 가지 모듈로 구성되어 있습니다. M2Det은 왜 등장하게 되었을까요?? M2Det의 등장 배경 M2Det은 FPN의 한계을 개선한 MLFPN을 제안합니다. FPN의 한계는 다음과 같습니다. FPN의 한계 (1) FPN은 Object detection을 수행할만큼의 충분한 표현력을 갖고있지 못합니다. FPN은 backbone에서 생성한 feature map을 이용합니다..

논문 읽기/Object Detection 2021.05.08

[백준 파이썬] 14502번 연구소 - DFS, 브루트 포스

14502번 연구소 - DFS, 브루트 포스 www.acmicpc.net/problem/14502 14502번: 연구소 인체에 치명적인 바이러스를 연구하던 연구소에서 바이러스가 유출되었다. 다행히 바이러스는 아직 퍼지지 않았고, 바이러스의 확산을 막기 위해서 연구소에 벽을 세우려고 한다. 연구소는 크 www.acmicpc.net 파이썬 풀이 import sys import copy sys.setrecursionlimit(10**6) input = sys.stdin.readline N, M = map(int,input().split()) graph = [list(map(int,input().split())) for _ in range(N)] # 그래프 생성 graph_copy = copy.deepcopy(..

Python/백준 2021.05.06

[백준 파이썬] 11724번 연결 요소의 개수

백준 11724번 연결 요소의 개수 www.acmicpc.net/problem/11724 11724번: 연결 요소의 개수 첫째 줄에 정점의 개수 N과 간선의 개수 M이 주어진다. (1 ≤ N ≤ 1,000, 0 ≤ M ≤ N×(N-1)/2) 둘째 줄부터 M개의 줄에 간선의 양 끝점 u와 v가 주어진다. (1 ≤ u, v ≤ N, u ≠ v) 같은 간선은 한 번만 주 www.acmicpc.net 파이썬 풀이 import sys import collections sys.setrecursionlimit(10**6) input = sys.stdin.readline N, M = map(int,input().split()) graph = collections.defaultdict(list) # 빈 그래프 생성 vi..

Python/백준 2021.05.06

[논문 읽기] Hourglass(2016), Stacked Hourglass Networks for Human Pose Estimation

오늘 읽은 논문은 'Stacked Hourglass Networks for Human Pose Estimation' 입니다. pose estimation 논문은 처음 읽어보네요ㅎㅎ hourglass network를 첫 논문으로 선택한 이유는 detection 분야에서 CornerNet이 hourglass을 backbone으로 사용하기 때문입니다. hourglass로 찾아낸 특징점을 바운딩 박스를 생성하는데 사용하는데요ㅎㅎ hourglass network가 무엇인지 호기심이 생겨 읽게 되었습니다! 논문을 읽고 아쉬웠던 점은, loss function이 정확하게 나와있지 않았었습니다. pose estimation 분야는 어떻게 loss를 계산하는지 궁금했었는데, 단순히 mse loss를 사용한다고만 나와있었..

논문 읽기/Pose Estimation 2021.05.06

[논문 구현] PyTorch로 RetinaNet(2017) 구현하고 학습하기

RetinaNet을 파이토치로 구현하고, VOC dataset으로 전이 학습까지 진행해보도록 하겠습니다. Computer Vision을 공부하시는 분들에게 많은 도움이 됬으면 합니다. 저도 공부하는 과정에 있어, 구현이 완벽하지 않습니다. 개선점이 있다면 지적 바랍니다. 논문 리뷰는 아래에서 확인하실 수 있습니다. [논문 읽기] RetinaNet(2017) 리뷰, Focal Loss for Dense Object Detection RetinaNet 논문은 모델이 예측하기 어려운 hard example에 집중하도록 하는 Focal Loss를 제안합니다. ResNet과 FPN을 활용하여 구축된 one-stage 모델인 RetinaNet은 focal loss를 사용하여 two-stage 모델 Fas.. dee..

논문 구현 2021.05.06

딥러닝 공부방

전체 글 823

티스토리툴바