[논문 읽기] PSPNet(2016), Pyramid Scene Parsing Network

논문 읽기/Segmentation

[논문 읽기] PSPNet(2016), Pyramid Scene Parsing Network

AI 꿈나무 2021. 9. 27. 21:13

Pyramid Scene Parsing Network

PDF, Semantic Segmentation, Hengshuan Zhao, Jianping Shi, Xiaojuan Qi, Xiaogang Wang, Jiaya Jia, arXiv 2016

Summary

Semantic Segmentation을 위한 모델입니다.

위 그림을 보면 강가에 있는 보트를 FCN은 car로 예측한 것을 확인할 수 있습니다. 이 error의 원인을 논문은 global Context를 고려하지 않았기 때문이라고 말합니다.

이 문제를 해결하기 위해 global context를 보고 예측을 할 수 있는 모델을 제안합니다.

Pooling 연산으로 여러 크기의 feature map을 만든 후에 concat하여 global context 정보를 취합하여 prediction을 수행합니다.

4 scale pyramid를 사용하는데 image의 global, half, part 정보를 추출합니다.

논문은 추가적으로 ResNet을 optimization하는 방법을 제안합니다.

auxiliary loss를 사용하는데, 실험 결과를 보니 효과가 좋네요.

Experiment

my github

Seonghoon-Yu/Paper_Review_and_Implementation_in_PyTorch

공부 목적으로 논문을 리뷰하고 해당 논문 파이토치 재구현을 합니다. Contribute to Seonghoon-Yu/Paper_Review_and_Implementation_in_PyTorch development by creating an account on GitHub.

github.com

'논문 읽기 > Segmentation' 카테고리의 다른 글

[논문 읽기] Panoptic Feature Pyramid Networks(2019) (0)	2021.09.28
[논문 읽기] IMP(2019), Instance Mask Projection for High Accuracy Semantic Segmentation of Things (0)	2021.09.27
[논문 읽기] Single Network Panoptic Segmentation for Street Scene Understanding(2019) (0)	2021.09.27
[논문 읽기] Panoptic Segmentation with a Joint Semantic and Instance Segmentation Network(2018) (0)	2021.09.26
[논문 읽기] Panoptic Segmentation(2018) (0)	2021.09.25

현재글[논문 읽기] PSPNet(2016), Pyramid Scene Parsing Network

딥러닝 공부방