(23.01.25)
medical ai 논문 리뷰 2탄
- 논문 제목: Convolutional Networks for Biomedical Image Segmentation (MICAAI 2015)
- https://arxiv.org/pdf/1505.04597.pdf
(Segmentation)
많은 visual task가 있지만, biomedical image segmentation은 각 pixel 별로 class label을 매겨줘야하는 localization이 필요하다.
H x W x RGB_channel -> model -> H x W x class
Abstract
- data augmentation 중요하다.
- 본 논문에서 제안하는 아키텍쳐는 end-to-end train 가능하다.
- context를 포착하는 contracting path, 이와 대칭되며 정확한 localization을 가능하게 하는 expanding path로 구성된다.
- 저자가 제안한 모델(U-Net)이 ISBI challenge에서 성능이 가장 좋은 모델이다.
Network Architecture
U-Net은 위의 그림과 같은데, 왼쪽 부분이 contracting path, 오른쪽 부분이 expanding path이다. 총 23개의 conv layer를 가진다.
contracting path는
- 각각 2번의 3x3 conv (+ReLU)를 거치고,
- 2x2 max pooling(stride 2)를 통해 downsampling 한다.
- 각 downsampling step을 통해 feature channel은 2배가 된다.
expanding path는
- 각각 2x2 conv(up-conv)를 거치고,
- contracting path로부터 crop된 feature map과 concat한 뒤,
- 각 2번의 3x3 conv (+reLU)를 거친다.
- 마지막 layer에서는 1x1 conv를 통해 64 component feature vector를 class number에 매핑한다.
p_k(x): approximated maximum-function
K: number of classes
a_k(x): activation in feature channel k at pixel position x
w(x): weight map
Experiments