반응형

전체 글 823

[논문 읽기] ALIGN(2021), Scaling Up Vision-Language Representation Learning with Noisy Text Supervision

Scaling Up Vision-Language Representation Learning with Noisy Text Supervision https://arxiv.org/abs/2102.05918 Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Pre-trained representations are becoming crucial for many NLP and perception tasks. While representation learning in NLP has transitioned to training on raw text without human annotations, visual ..

[논문 읽기] DAZLE(2020), Fine-Grained Generalized Zero-Shot Learning via Dense Attribute-Based Attention

Fine-Grained Generalized Zero-Shot Learning via Dense Attribute-Based Attention PDF, Zero-Shot Classification, Dat Huynh, Ehsan Elhamifar, CVPR 2020 Summary attribute에 해당하는 이미지 region에 집중해서 보겠다는 논문이다. 즉, 전체 이미지로부터 추출한 feature vector를 전체 attribute와 매칭하지 않고, attribute에 해당하는 이미지 region을 찾아내어 가중치를 준 다음에 class를 예측한다. 좀 더 세밀한 feature를 활용할 수 있다는 것이 장점. image region으로부터 추출한 feature와 attribute word embed..

[PyTorch] Error: one of the variables needed for gradient computation has been modified by an inplace operation

파이토치 오류 https://discuss.pytorch.org/t/one-of-the-variables-needed-for-gradient-computation-has-been-modified-by-an-inplace-operation-torch-cuda-floattensor-3-48-3-3-is-at-version-2-expected-version-1-instead/83241 One of the variables needed for gradient computation has been modified by an inplace operation: [torch.cuda.FloatTensor [3, 48, When I was training the GAN, the first iteration worked ..

[논문 읽기] LiT, Zero-Shot Transfer with Locked-image Text Tuning(2021)

LiT: Zero-Shot Transfer with Locked-image Text Tuning PDF, Zero-Shot Transfer, Zhai et al, arXiv 2021 Summary Transfer Learning과 Zero-Shot Transfer 의 차이점 먼저 설명하고 논문을 소개하겠다. Transfer Learning은 big dataset로 pre trained된 big model을 down stream으로 fine-tuning을 하는 것이다. 즉, 두 가지 철차로 이루어진다. (1) pre-training, (2) fine-tuning. 이 과정을 통하여 데이터가 적은 task에서도 좋은 성능을 가진 모델을 사용할 수 있다. Zero-Shot Transfer은 fine-tunin..

[논문 읽기] Zero-shot Learning via Shared-Reconstruction-Graph Pursuit(2017)

Zero-shot Learning via Shared-Reconstruction-Graph Pursuit PDF, Zero-Shot Classification, Zhao et al, arXiv 2017 Summary space shift problem을 정의한다. image feature space, attribute space, word vector space 사이의 knowledge structure가 다르다는 문제점이다. 기하학적인 inconsistent가 발생한다는 것인데, 각 space에서 structure가 서로 다른 데이터로 학습되기 때문에 발생한다. 즉, word embedding의 class 관계를 직접 image space로 transfer하면 문제점이 발생한다는 것. 논문에서 제안하는..

[논문 읽기] DeViSE, A Deep Visual-Semantic Embedding Model(2013)

DeViSE, A Deep Visual-Semantic Embedding Model PDF, Zero-Shot Classification, Frome, et al, NIPS 2013 Summary CNN으로 image로부터 feature를 추출하고 transformation matrix를 통해 embedding vector space로 map한다. 사전 학습된 embedding vector와 유사도를 측정하여 class를 예측. 손실 함수는 ranking loss를 사용한다. my github Seonghoon-Yu/Paper_Review_and_Implementation_in_PyTorch 공부 목적으로 논문을 리뷰하고 해당 논문 파이토치 재구현을 합니다. Contribute to Seonghoon-Y..

반응형