Post

U-Net

U-Net은 segmentation을 위한 모델로, 영상과 비슷한 사이즈의 출력을 가진다.
영상의 일부분을 자세하게 봐야하는 경우, 많은 모델의 기원이 되고있으며 FCN 모델의 skip connections과 유사하며 더 정교하다.

U-Net_architecture U-Net architecture

Contracting path

  • 3 x 3 convolutions을 반복
  • feature channels이 2배씩 증가
  • 깊은 layers를 통해 전체적인 맥락을 파악

    Expanding path

  • 2 x 2 congolutions를 반복
  • feature channels은 반씩 줄어듦
  • contracting path에서 대응하는 feature map과 concatenate
    • 공간적으로 높은 해상도와 입력이 약간 바뀌어도 민감한 정보를 제공하기 때문에, 경계선이난 공간적으로 중요한 정보는 뒤쪽 레이어에 전달해주는 것!

!주의!

  • feature map의 spatial size가 홀수를 가지게 되면?
    • Unet은 downsampling과 upsampling을 반복하는 구조
    • 원래 입력과 출력의 해상도가 차이나게 된다
      $\rightarrow$ 어떤 map에서도 홀수가 나오지 않도록 주의해야한다
      test를 통해 미연에 error 방지!
This post is licensed under CC BY 4.0 by the author.