Week13 Day64

EDA
한 픽셀에 여러 label이 있는지 확인했다.
그러한 경우가 있었지만 512x512 픽셀 중 그러한 경우는 무시할 정도로 적었다.
다행히 모든 픽셀은 하나의 label을 가지고 있고 이를 예측하면 될 것 같다.
U-Net 구현
원래는 DeepLab V1을 구현하려고 했는데 오늘 수업에서 U-Net을 배워서 이를 구현했다.
backbone model로 VGG16-BN을 사용했다.
현재 학습 중이다.
DeconvNet
어제 DeconvNet 구현 중 문제점을 발견했고 오늘 학습하여 제출했다.
¹
위 이미지에서 붉은색 박스를 두가지 버전으로 만들고 나머지는 동일하게 학습했다.
V1
7x7 conv+4096 -> 1x1 conv+4096 -> 7x7 deconv+512
conv 옆 숫자는 출력 channel 수이다.
위 conv 모두 padding=0으로 하여 feature map의 사이즈를 줄이도록 했다.
학습 시간 약 2시간
V2 7x7 conv+1024 -> 1x1 conv+1024 -> 7x7 deconv+512
V1과 다르게 channel 수를 줄였다.
학습 시간 약 1시간 50분