반응형

논문 읽기/Zero shot 36

[논문 읽기] Zero-shot Learning via Shared-Reconstruction-Graph Pursuit(2017)

Zero-shot Learning via Shared-Reconstruction-Graph Pursuit PDF, Zero-Shot Classification, Zhao et al, arXiv 2017 Summary space shift problem을 정의한다. image feature space, attribute space, word vector space 사이의 knowledge structure가 다르다는 문제점이다. 기하학적인 inconsistent가 발생한다는 것인데, 각 space에서 structure가 서로 다른 데이터로 학습되기 때문에 발생한다. 즉, word embedding의 class 관계를 직접 image space로 transfer하면 문제점이 발생한다는 것. 논문에서 제안하는..

[논문 읽기] DeViSE, A Deep Visual-Semantic Embedding Model(2013)

DeViSE, A Deep Visual-Semantic Embedding Model PDF, Zero-Shot Classification, Frome, et al, NIPS 2013 Summary CNN으로 image로부터 feature를 추출하고 transformation matrix를 통해 embedding vector space로 map한다. 사전 학습된 embedding vector와 유사도를 측정하여 class를 예측. 손실 함수는 ranking loss를 사용한다. my github Seonghoon-Yu/Paper_Review_and_Implementation_in_PyTorch 공부 목적으로 논문을 리뷰하고 해당 논문 파이토치 재구현을 합니다. Contribute to Seonghoon-Y..

[논문 읽기] A Generative Adversarial Approach for Zero-Shot Learning from Noisy Texts(2017)

A Generative Adversarial Approach for Zero-Shot Learning from Noisy Texts PDF, Zero-Shot Classification, Zhu et al, arXiv 2017 Summary generative based zero shot classification이다. generator이 생성한 feature은 disparse하고 cluster structure를 망가뜨린다. 그래서 visual pivot regularization을 제안한다. 위 loss를 사용하는데, train distribution에 접근할 수 없으므로 sythesized feature의 평균을 계산해서 단일 feature가 이에 가까워 지도록 한다. 또, wiki에서 긁어온 te..

[논문 읽기] Zero-Shot Instance Segmentation(2021)

Zero-Shot Instance Segmentation PDF, Zero-Shot Segmentation, Ye et al, CVPR 2021 Summary 해당 논문은 zero shot instance segmentation task를 제안하는 논문이다. zero shot instance segmentation(ZSI)의 베이스 라인을 제공하고 논문에서 제안하는 방법이 zero shot object detection(ZSD)에서 SOTA 성능을 달성한다. 5가지 구성요소가 존재한다. (1) backbone, (2) BA-RPN, (3) Sync-bg, (4) zero-shot detector, (5) semantic mask head zero-shot detection RoI Align을 거쳐서 vi..

[논문 읽기] Learning unbiased zero-shot semantic segmentation networks via transductive transfer(2020)

Learning unbiased zero-shot semantic segmentation networks via transductive transfer PDF, Zero-Shot Segmentation, Haiyang et al, IEEE 2020 Summary self-traning process를 model의 prediction 값을 pseudo label로 사용하는 대신에, unseen image로 진행한다. transfuctive zero-shot은 unseen image를 사용하는 분야 중 하나이다. true image를 self-training에 사용하기 때문에 부정확한 pseudo label로 인해 발생하는 negative transfer 문제를 해결할 수 있다. source data(see..

[논문 읽기] Language-Driven Semantic Segmentation(2021)

Language-Driven Semantic Segmentation PDF, Zero-Shot Segmentation, Anonymous, ICLR 2022 open review Summary CLIP을 segmentation에 적용한 페이퍼이다. Inference시에 label를 flexible하게 넣어줄 수 있다. 즉, 이미지에서 원하는 객체만 찾을 수 있다는 말. class를 dog와 other만 넣어주면 나머지는 other로 분류한다. Text encoder은 pre-trained CLIP을 freezing하여 사용한다. image encoder은 DPT를 사용하는데 DPT는 pretrained ViT를 encoder로 사용하고 decoder DPT를 random 초기화하여 학습시킨다. text ..

[논문 읽기] Recursive Training for Zero-Shot Semantic Segmentation(2021)

Recursive Training for Zero-Shot Semantic Segmentation PDF, Zero-Shot Segmentation, Ce et al, arXiv 2021 Summary generative 방법을 사용하는 Zero shot semantic segmentation은 generator가 얼마나 unseen image를 잘 생성하는지에 따라 성능이 좌우된다. generator가 seen data로만 학습이 되기 때문에 seen에 bias가 되어있는데, 해당 논문은 그 문제점을 해결하기 위한 method를 제안한다. generator를 recursive training하는건데, generator가 생성한 이미지를 classifier로 전달하여 confidence를 추출한다. 그러..

[논문 읽기] Consistent Structural Relation Learning for Zero-Shot Segmentation(2020)

Consistent Structural Relation Learning for Zero-Shot Segmentation PDF, Zero-Shot Segmentation, Peike et al, neurips 2020 Summary seen과 unseen 사이의 structural relation을 사용하여 생성된 unseen visual feature를 제한한다. seen과 unseen에 대한 word embedding이 갖고 있는 관계 정보를 이용하여 unseen 을 제한한다면, generator는 더 좋은 unseen visual feature를 생성할 것이다. Generator generator는 생성모델이 아니라 L개의 layer로 이루어져 있다. 그래프 구조를 사용하여 word embeddin..

[논문 읽기] Uncertainty-Aware Learning for Zero-Shot Semantic Segmentation(2020)

Uncertainty-Aware Learning for Zero-Shot Semantic Segmentation PDF, Zero-Shot Segmentation, Xizhou et al, neurips 2020 Summary 논문에서 지적하는 문제점 (1) training set에 noise가 존재 왜? 이상치와 사람의 어노테이션 때문에 (2) 각 pixel을 다루는 것은 global information이 손실됌 따라서 이미지 단위로 학습할 수 있는 loss 제안 개선 방법 uncertainty를 측정할 수 있는 통계값을 얻어서 loss로 준다 pixel level loss image level loss my github Seonghoon-Yu/Paper_Review_and_Implementation..

[논문 읽기] A Closer Look at Self-training for Zero-Label Semantic Segmentation(2021)

A Closer Look at Self-training for Zero-Label Semantic Segmentation PDF, Zero-Shot Segmentation, Giuseppe, arXiv 2021 Summary Self-training process를 개선한 논문. 베이스 모델은 SPNet을 사용한다. SPNet은 일정 confidence 이하의 pseudo label을 무시했었다. 해당 논문에서 제안하는 방법은 이미지로부터 augmentation을 여러개 적용하여 출력한 pseudo label의 교집합을 최종 pseudo label로 사용한다. 즉, unseen에 대한 더 정확한 pseudo label을 사용하여 모델을 re - training하여 성능을 높인다 my github Seon..

반응형