Week13 Day65

Done

U-Net 학습
backbone model로 VGG16을 사용했다.
여태까지 모델 구현 중 가장 까다로웠다.
encoder와 decoder가 대칭인데 encoder에서 subsampling 하기 전 feature map을 decoder에 넘겨주고 decoder의 feature map과 concatenation을 해야 된다.
이 부분을 어떻게 구현할지 고민을 많이 했다.
또한 논문에서는 convolution을 할 때 padding을 주지 않아서 feature map의 크기가 조금씩 줄었다.
나는 padding을 줘서 크기를 유지했고 pooling을 통해 크기를 줄였다.
다음 이미지들은 train, validation data에 대한 metric이다.
UNet4VGG16은 VGG16 기반 U-Net 모델을 의미하며 DeconvNet4VGG16은 현재 public LB 점수가 가장 높은 모델이다.
train, val loss
train, val mean IoU

UNet4VGG16의 public LB는 0.4364를 기록했다.

To do

DeepLab V1 구현

peer session

여기에 오늘의 피어세션을 정리했다.
그리고 이곳에 각자 어떤 실험을 했는지 기록하는 페이지를 만들었다.

이전Week13 Day64

다음Week13 Weekend