수학/딥러닝 이론

[딥러닝] CNN에서 정확도를 높이는 방법 - 데이터 확장(data augmentation)

AI 꿈나무 2020. 10. 5. 22:57
반응형

사이토고키의 <밑바닥부터 시작하는 딥러닝>을 공부하고 정리해보았습니다.

 


데이터 확장 - data augmentation

 데이터 확장은 입력 이미지(훈련 이미지)를 알고리즘을 동원해 '인위적'으로 확장합니다.

 아래 그림과 같이 입력 이미지를 회전하거나 세로로 이동하는 등 미세한 변화를 주어 이미지 개수를 늘리는 것입니다.

 

 이는 데이터가 몇 개 없을 때 특히 효과적인 수단입니다.

 

 

 데이터 확장은 다양한 방법으로 이미지를 확장할 수 있습니다.

 예를 들어 이미지 일부를 잘라내는 crop이나 좌우를 뒤집는 flip 등이 있습니다.

 일반적인 이미지에는 밝기 등의 외형 변화확대, 축소 등의 스케일 변화도 효과적입니다.

 

 데이터 확장을 동원해 훈련 이미지의 개수를 늘릴 수 있다면 딥러닝의 인식 수준을 개선할 수 있습니다.

 

 데이터 확장을 위한 파이썬 opencv 함수는 여기서 확인할 수 있습니다.

 

[파이썬 OpenCV] 영상의 확대와 축소(크기 변환) - cv2.resize 함수 설명, interpolation 인자

황선규 박사님의 , 패스트 캠퍼스 OpenCV 강의를 공부한 내용을 정리해 보았습니다. [파이썬 OpenCV] 영상의 기하학적 변환 - 전단 변환 - cv2.warpAffine 황선규 박사님의 , 패스트 캠퍼스 OpenCV 강의를 공

deep-learning-study.tistory.com

 

반응형