반응형

커스텀 데이터셋 4

[PyTorch] PyTorch에서 제공하는 VOC dataset 불러와서 사용하기

voc dataset을 pytorch에서 제공하는 사실을 알고 계셨나요?! 저는 최근에 알게 되었는데요..ㅎㅎ 알기 전까지 많은 삽질을 했습니다..! pytorch에서 제공하는 voc dataset을 활용하는 방법에 대해 정리한 게시글이 없어서 한번 정리해보도록 하겠습니다! object detection을 공부하시는 분들에게 많은 도움이 됬으면 합니다. dataset을 불러오고, transforms를 적용한 뒤에 dataloader를 생성해보도록 하겠습니다. 필요한 라이브러리를 import 합니다. from torchvision.datasets import VOCDetection from PIL import Image, ImageDraw, ImageFont from torchvision.transform..

[PyTorch] YOLOv3 학습을 위한 VOC2007 커스텀 데이터셋 생성하기

COCO dataset은 용량이 너무 크기 때문에 구글 코랩에서 YOLOv3을 학습시키는데에 무리가 있습니다. 여러번 시도했지만.. 실패했네요ㅎㅎ 그래서 저용량의 VOC2007 dataset을 가져왔습니다! VOC2007 dataset을 다운로드 받고, 커스텀 데이터셋을 생성하여 바운딩박스 출력값이 (class, cx, cy, w, h)되도록 만들겠습니다. 구글 코랩을 마운트 합니다. from google.colab import drive drive.mount('yolov3') dataset을 다운로드 받고 압축을 풀어줍니다. 다운로드 받을 디렉토리 경로를 잘 설정해줘야 합니다. !mkdir train !mkdir test !wget http://pjreddie.com/media/files/VOCtrai..

[PyTorch] 커스텀 데이터셋(custom dataset) 생성하기

AMD dataset을 사용하여 custom dataset을 생성해보겠습니다. AMD dataset은 amd.grand-challenge.org/ 여기에서 다운로드 받으실 수 있습니다. # create the training and validation datasets and the data loaders from torch.utils.data import Dataset from PIL import Image class AMD_dataset(Dataset): def __init__(self, path2data, transform, trans_params): pass def __len__(self): # return size of dataset return len(self.labels) def __getit..

[PyTorch] 암 이미지로 커스텀 데이터셋 만들기(creating custom dataset for cancer images)

kaggle에 있는 Histopathologic Cancer Detection 대회에서 제공하는 Histopathologic cencer 이미지로 커스텀 데이터셋(custom dataset)을 만들어보도록 하겠습니다. histopathologic cencer 이미지는 종양이 있는 경우 1, 없는 경우 0 두 가지로 분류되는 이진 분류 문제입니다. 우선, kaggle에서 제공한 데이터 레이블을 확인해보겠습니다. 구글 코랩을 사용했습니다. import pandas as pd path2csv = '/content/cookbook/MyDrive/data/train_labels.csv' labels_df = pd.read_csv(path2csv) labels_df.head() id 는 이미지의 이름을 의미합니다...

반응형