반응형
사이토고키의 <밑바닥부터 시작하는 딥러닝>을 공부하고 정리해보았습니다.
데이터 확장 - data augmentation
데이터 확장은 입력 이미지(훈련 이미지)를 알고리즘을 동원해 '인위적'으로 확장합니다.
아래 그림과 같이 입력 이미지를 회전하거나 세로로 이동하는 등 미세한 변화를 주어 이미지 개수를 늘리는 것입니다.
이는 데이터가 몇 개 없을 때 특히 효과적인 수단입니다.
데이터 확장은 다양한 방법으로 이미지를 확장할 수 있습니다.
예를 들어 이미지 일부를 잘라내는 crop이나 좌우를 뒤집는 flip 등이 있습니다.
일반적인 이미지에는 밝기 등의 외형 변화나 확대, 축소 등의 스케일 변화도 효과적입니다.
데이터 확장을 동원해 훈련 이미지의 개수를 늘릴 수 있다면 딥러닝의 인식 수준을 개선할 수 있습니다.
데이터 확장을 위한 파이썬 opencv 함수는 여기서 확인할 수 있습니다.
반응형
'수학 > 딥러닝 이론' 카테고리의 다른 글
[딥러닝] 세 가지 유명 신경망 - VGG, GoogLeNet, ResNet (0) | 2020.10.09 |
---|---|
[딥러닝] 신경망의 층을 깊게 하는 것의 중요성 (0) | 2020.10.08 |
[딥러닝] CNN의 원조 LeNet, 딥러닝을 주목 받도록 이끈 AlexNet (0) | 2020.10.05 |
[딥러닝] 합성곱 신경망(CNN) - CNN 시각화 하기 (2) | 2020.10.05 |
[딥러닝] 합성곱 신경망(CNN) - CNN 구현하기 (0) | 2020.10.05 |