반응형

분류 전체보기 823

[PRML] 1장 소개

패턴인식과 머신러닝을 공부하고 내용을 정리한 포스팅입니다. 1. 소개 위 그림과 같은 손글씨로 쓰인 숫자를 인식하는 예시를 살펴보겠습니다. 각 숫자는 28 x 28 픽셀 이미지이며, 따라서 784개의 실수로 구성된 벡터로 표현될 수 있습니다. 이런 벡터 X를 입력값으로 받았을 때 숫자 0~9 중 하나의 값을 올바르게 출력하는 기계를 만드는 것입니다. 머신 러닝을 적용하면 좋은 결과를 얻을 수 있습니다. 머신 러닝 : N개의 숫자들 {$x_1, ... , x_N$}을 훈련 집합(training set)으로 활용해서 변경 가능한 모델의 매개변수들을 조절하는 방법 훈련 집합(training set) : 손글씨 숫자 데이터 N개, {$x_1, ... , x_N$} 표적 벡터(target vector) : 훈련 ..

[Object Detection] YOLO(v3)를 PyTorch로 바닥부터 구현하기 - Part 2

안녕하세요! YOLO를 PyTorch로 바닥부터 구현하기 part 2 입니다. 이 포스팅은 공부 목적으로 아래 게시글을 변역했습니다. How to implement a YOLO (v3) object detector from scratch in PyTorch: Part 2 Part 2 of the tutorial series on how to implement your own YOLO v3 object detector from scratch in PyTorch. blog.paperspace.com 바닥부터 YOLO v3 detector를 구현하는 튜토리얼의 Part 2 입니다. 지난 파트에서, YOLO가 어떻게 작동하는 지 설명했고 이번 파트에서는 YOLO에서 사용되는 layers를 PyTorch로 구현해..

[Object Detection] YOLO(v3)를 PyTorch로 바닥부터 구현하기 - Part 1

YOLO를 알아보고, pytorch로 바닥부터 구현해보는 블로그가 있어 번역 해보기로 했습니다! 많은 공부가 될 것 같습니다ㅎㅎ 블로그는 아래 링크에서 확인하실 수 있습니다. Tutorial on implementing YOLO v3 from scratch in PyTorch Tutorial on building YOLO v3 detector from scratch detailing how to create the network architecture from a configuration file, load the weights and designing input/output pipelines. blog.paperspace.com 객체 탐지는 딥러닝의 발전에 의해 큰 이점을 얻은 분야입니다. 최근 몇년 ..

[논문 리뷰] R-CNN (2013) 리뷰

안녕하세요! 2021년이 시작함과 동시에 Object detection 논문을 읽게 되었습니다. 첫 번째로 읽어볼 논문은 R-CNN 'Rich feature hierarchies for accurate object detection and semantic segmentation' 입니다. R-CNN은 region proposals와 CNN이 결합된 Regions with CNN의 약자입니다. R-CNN이 등장하기 전 HOG와 SHIFT를 활용한 Object detection 성능은 몇년 동안 정체되어 있었습니다. R-CNN은 이전까지 최고의 성능을 나타낸 기법의 mAP보다 30% 높은 53.3%를 달성하여 detection 분야에 새로운 방향을 제시하게 됩니다. (object detection의 성능 평..

[Object Detection] mAP(mean Average Precision)을 이해하고 파이토치로 구현하기

안녕하세요 mAP(mean Average Precision)는 Faster R-CNN, SSD와 같은 object detector의 정확도를 측정하는 유명한 평가지표 입니다. 이번 포스팅에서는 mAP가 무엇인지 알아보고 파이토치로 구현해보도록 하겠습니다. mAP를 알아보기 전에 precision(정밀도), recall(재현율), IoU(intersection of union)에 대한 개념을 알아야 합니다. Precision(정밀도)와 recall(재현율) Precision은 모델이 True라고 예측한 것 중 정답도 True인 것의 비율을 의미합니다. recall은 실제 정답이 True인 것중에서 모델이 True라고 예측한 것의 비율입니다. Precision과 recall의 공식은 다음과 같습니다. TP,..

[Object Detection] 비-최대 억제(NMS, Non-maximum Suppression)를 이해하고 파이토치로 구현하기

안녕하세요! 이번 포스팅에서는 비-최대 억제(NMS,Non-maximum Suppression)을 알아보도록 하겠습니다. 비최대 억제를 이해하기 위해서는 IoU(intersection over unio)에 대한 개념을 알아야합니다. IoU에 대한 내용은 아래 링크에 있습니다. [Object Detection] IoU(Intersection over Union)를 이해하고 파이토치로 구현하기 안녕하세요 이번 포스팅에서는 IoU에 대해 알아보도록 하겠습니다. IoU(Intersection over Union)은 무엇일까요? Intersection over Union은 object detector의 정확도를 측정하는데 이용되는 평가 지표입니다.. deep-learning-study.tistory.com 비-최..

[Object Detection] IoU(Intersection over Union)를 이해하고 파이토치로 구현하기

안녕하세요 이번 포스팅에서는 IoU에 대해 알아보도록 하겠습니다. IoU(Intersection over Union)은 무엇일까요? Intersection over Union은 object detector의 정확도를 측정하는데 이용되는 평가 지표입니다. Object detection 논문이나 대회에서 IoU 평가 지표를 쉽게 볼 수 있습니다. 알고리즘이 출력한 예측 바운딩 박스는 IoU를 이용해서 평가될 수 있습니다. IoU를 적용하기 위해서는 두 가지가 필요합니다. 1. ground-truth bounding boxes(testing set에서 object 위치를 labeling 한것) 2. prediceted bounding boxes (model이 출력한 object 위치 예측값) 이 두가지가 있으..

[논문 리뷰] VGGNet(2014) 리뷰와 파이토치 구현

안녕하세요 이번에 읽어볼 논문은 'Very Deep Convolutional Networks for large-scale image recognition'(VGGNet) 입니다. VGGNet은 19 layer를 지닌 깊은 network로 ILSVRC 2014 대회에서 2등을 차지했습니다. 역대 ILSVRC 우승작 network의 깊이는 8 layer에 불가했습니다. 깊이가 깊어짐에 따라 overfitting, gradient vanishing, 연산량 문제가 생기기 때문에 깊이를 증가시키는 것이 쉬운 문제는 아니었습니다. VGGNet은 어떻게 문제들을 해결하고 깊이를 19 layer까지 증가할 수 있었을까요?? VGGNet 논문에 나와있는 핵심 내용을 간추려 보았습니다. 1. 깊이를 증가하면 정확도가 좋..

[선형대수학] 5.5 최소자승법(Least-Squares Problems)

David C.Lay 의 Linear algebra and its application를 공부하면서 정리해보았습니다. 감사합니다. 드디어 5장의 마지막 부분인 최소자승법(Least-Squares Problems)에 대해 공부해 보겠습니다! 선형대수학 공부를 처음 시작할 때 언제 다 할 수 있을까라는 막막했는데, 꾸준히 해나가니까 끝이 보이네요ㅎㅎ 항상 꾸준히 하는것이 중요한 것 같습니다. Ax=b 문제를 풀 때 해가 없는 경우가 대부분입니다. 현실의 문제에는 여러가지 오차가 포함되어 있기 때문입니다. 이런 경우 b와 제일 근접한 x를 찾게됩니다. 이때 이용하는 방법이 최소자승법 입니다. 1. 최소자승법의 해(Least-Squares Solution) b-Ax를 가장 작게하는 x가 $\hat{x}$이며, ..

[논문 리뷰] GoogLeNet (2014) 리뷰와 파이토치 구현

공부 목적으로 논문을 읽어보고 요약한 뒤에 파이토치로 구현해보았습니다 이번에 공부할 논문은 'Going deeper with convolutions' (GoogLeNet)입니다. LeNet-5를 시작으로 CNN은 이미지 분류에서 일반적인 구조가 되었습니다. CNN 구조에 dropout, pooling, ReLu, GPU 기법이 적용된 AlexNet이 ILSVRC 2012년 대회에서 우승을 차지하고 CNN을 세상에 알리게 됩니다(이전까진 머신러닝 기법이 대회를 우승했습니다). 2년 뒤 Inception block을 적용한 CNN 모델인 GoogLeNet이 ILSVRC 2014년 대회에서 우승을 차지하게 됩니다. GoogLeNet을 우승으로 이끈 Inception block에 대해 알아보고, 추가적으로 적용..

반응형