지난 2주동안 semantic segmentation을 진행했고 앞으로 2주동안 object detection을 진행한다.
앞서 프로젝트와 동일한 데이터셋을 사용한다.
yolo-v1
나중에 추가…
SSD(Single Shot Multibox Detector)
나중에 추가…
To do
- pre-trained model에서 사용한 데이터와 이 프로젝트의 데이터는 다르다.
도메인도 다를 것이고 해상도도 다를 것이다.
segmentation 프로젝트에서는 fine-tuning을 하지 않아서 이번에는 해볼 생각이다.
주어진 데이터의 해상도는 512x512이다.
어떻게 fine-tuning을 할까?
가장 먼저 드는 생각은 encoder에서 feature map을 추출하고 이를 interpolation하여 원래 크기로 만들고 segmentation을 진행한다.
이렇게 하면 encoder는 주어진 512x512 이미지에 대한 정보를 학습할 것이라 생각한다.
fine-tuning을 한 경우와 안한 경우를 비교할 것이다.