retrospective
지난 주 회고해보면 모델의 성능이 너무 낮았다.
먼저, 다른 사람들은 efficientNet을 사용했다.
나는 torchvision
에서 제공하는 모델 중 ResNet
, ShuffleNetV2
, MNASNet
을 사용해보며 어떤 모델이 좋은지 확인했다.
하지만 평가를 할 수 없을 정도로 성능이 모두 낮았다.
심지어 학습 데이터에 대해 accuracy와 f1 score가 1을 달성하지 못했다.
즉, 모델이 학습 데이터를 완전히 학습하지도 못했다.
그래서 머리가 복잡해져서 금, 토요일 키보드에서 손을 놨다.
여태까지 내가 한 것을 정리하면 다음과 같다.
model | train loss | train accuracy | train f1 | val loss | val accuracy | val f1 |
---|---|---|---|---|---|---|
ShuffleNetV2 | 0.6315 | 0.7813 | 0.5455 | 0.6501 | 0.7812 | 0.6038 |
ResNet50 | 0.9159 | 0.625 | 0.4424 | 0.8468 | 0.7098 | 0.5934 |
공통적으로 적용한 사항은 다음과 같다.
lr | batch size | epoch | loss | optimizer | augmentation | |
---|---|---|---|---|---|---|
내용 | 1e-3 | 64 | 10 | C.E | Adam | CenterCrop(384, 384), RandomCrop(224, 224), HorizontalFlip(), Normalize() |