※ 본 포스팅에서는 Rethinking Data Augmentation for Image Super-resolution: A Comprehensive Analysis and a New Strategy(CVPR 2020) 논문의 실험결과 재현 내용을 다뤘습니다.
논문 링크 : https://arxiv.org/abs/2004.00448
Rethinking Data Augmentation for Image Super-resolution: A Comprehensive Analysis and a New Strategy
Data augmentation is an effective way to improve the performance of deep networks. Unfortunately, current methods are mostly developed for high-level vision tasks (e.g., classification) and few are studied for low-level vision tasks (e.g., image restoratio
arxiv.org
본 포스팅에서는 실험결과 재현을 위해서 A6000을 사용하였다.
1) Installation
# 가상환경 생성 conda create -n name python=3.8 -y # 가상환경 활성화 conda activate name # 파이토치 설치 pip install torch==1.4.0 torchvision==0.5.0 # 필요 라이브러리 설치 pip install numpy pip install tqdm |
2. Data Preparation
깃허브에서 제공해주는 방법으로 DIV2K 데이터셋을 다운로드 받았다.
3. Evaluate Pre-trained Models
# Evaluate Pre-trained Models python main.py \ --use_moa \ --model EDSR \ --dataset DIV2K_SR \ --div2k_range 1-800/801-900 \ --scale 4 \ --dataset_root ./datasets/DIV2K # -- aug 값을 실행하고 싶은 augmentation 방법으로 바꾸어 실행 (오류 발생) python main.py \ --aug blend --model EDSR \ --dataset DIV2K_SR \ --div2k_range 1-800/801-900 \ --scale 4 \ --dataset_root ./datasets/DIV2K |
pip install scikit-image로 모듈 설치하여 오류를 해결할 수 있다.
4) Reproduction result
Augmentation method | Table1 | 재현 결과 |
Cutout | 29.22 | 29.22 |
CutMix | 29.22 | 29.23 |
Mixup | 29.26 | 29.27 |
CutMixup | 29.27 | 29.27 |
RGB perm | 29.30 | 29.29 |
Blend | 29.23 | 29.24 |
CutBlur | 29.26 | 29.25 |
윗 표는 DIV2K 데이터셋에 대한 논문 결과 및 재현 결과에 대한 정량적 결과를 보여주며, Method에서 Augmentation method는 논문에 제시된 Table 1에서 가져온 결과이다.
실험 결과는 논문 결과와 재현 결과의 유사성을 확인할 수 있었다. 더불어 본 포스팅에서 재현한 정량적 결과가 신뢰성이 있다고 판단된다.
5) 참고 문헌
[1] Yoo, Jaejun, Namhyuk Ahn, and Kyung-Ah Sohn. "Rethinking data augmentation for image super-resolution: A comprehensive analysis and a new strategy." Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2020.