본문 바로가기

AI19

[SEGMENTATION] Attention U-Net: Learning Where to Look for the Pancreas 이번에 다룰 모델은 U-Net++에 이어서 U-Net을 기반으로 하는 의료 영상 세그멘테이션 모델인 Attention U-Net이다. 데이터셋은 췌장(Pancreas)을 세그멘테이션하기 위한 복부 CT 영상이다. 1. Attention이란 이미지 세그멘테이션에서 Attention은 학습할 때 관심있는 영역 혹은 관련된 영역을 강조하는 방법이다. 예측이나 분류할 정답과 관련없는 영역들을 무시하거나 관심을 덜 갖기 때문에 계산 비용이 줄어든다는 특징이 있는데, 즉, 이미지의 특정 영역에만 집중(Attention)한다는 것이다. 1.1. Hard Attention Attention은 Hard Attention과 Soft Attention으로 나뉜다. Hard Attention은 이미지를 자르거나(Croppin.. 2021. 7. 20.
[SEGMENTATION] U-Net++ : Redesigning Skip Connections to Exploit Multiscale Features in Image Segmentation | 2018 2015년 U-Net 발표 이후에 메디컬 분야의 이미지 세그멘테이션 연구는 U-Net을 기본 골자로 하는 경우가 많았다. U-Net++도 마찬가지로 U-Net 아키텍처를 업그레이드해 시멘틱 세그멘테이션 성능을 끌어올렸다. U-Net 복습 베이스라인 모델인 U-Net을 잠시 복기해보자. U-Net은 바이오 이미지의 시멘틱 세그멘테이션을 목적으로 고안되었다. 특징으로는 첫째, 인코더-디코더 형식으로 아키텍처의 전체적인 형상이 좌우 대칭의 U자 모양을 그린다는 점이 있다. 그림 1을 보면 각각 4번의 다운 샘플링과 업 샘플링을 하는 것을 볼 수 있다. 두번째는 Skip Connection이다. 그림 1의 회색 화살표는 인코더의 특징맵을 대응하는 디코더의 특징맵과 합치는 것을 의미한다. 특징맵을 합칠 때는 단순.. 2021. 6. 28.
[SEGMENTATION] DeepLab v1 | 2015 1. 서론 2. DCNN 3. atrous convolution 4. fully-connected Conditional Random Field 5. Multi-Scale Prediction 5. Experiment Details 일러두기 1. DeepLab 팀은 시멘틱 세그멘테이션(semantic segmentation) 방법으로 DeepLab 시스템을 고안했다. 2015년, 2016년, 2017년, 2018년에 차례로 DeepLab v1, v2, v3, v3+를 발표했다. 2. 본문에서 atrous 알고리즘 혹은 hole 알고리즘은 atrous 알고리즘으로 통일한다. 참고로 DeepLab v1에서는 두 용어를 혼용해서 사용했지만, DeepLab v2부터는 atrous 알고리즘으로만 언급했다. 논문 UR.. 2021. 6. 21.
[SEGMENTATION] U-Net: Convolutional Networks for Biomedical Image Segmentation | 2015 목차 1. U-Net 배경 2. U-net 구조 2.1 개요 2.2 아키텍쳐 2.3 Overlap-tile starategy 3. Training Details 3.1 Optimization 3.2 Loss Function 3.3 Data Augmentation 4. Performance 5. Reference 1. U-Net 배경 본 논문의 과제는 세포 이미지(그림 1)에서 세포막과 배경, 서로 맞닿은 세포막(Touching objects of the same class)을 구분하는 세그멘테이션이다. 세그멘테이션을 위해서는 두 가지 조건이 있다. 먼저 위치 검출(Localization) 성능이 좋아야 한다. 이미지 분류(Image Recognition) 과제에서는 이미지에 어떤 객체가 있는지 분류만 하.. 2021. 6. 5.
Image Scale(척도)과 resolution(해상도) 영상 처리에서 다양한 Scale에서 영상을 처리 하기 위해 Scale Space, Image Pyramid을 활용한다. 이러한 multi-scale 방법론에 대한 설명은 많이 찾아볼 수 있었지만, 정작 Image Scale이 무엇인지 정확히 다루는 내용을 보긴 힘들었다. Image Scale에 대한 내용을 찾던 중 아래 2004년에 발간된 Horning의 자료[1]를 발견했고, 해당 자료를 참고해 Image Scale과 Resolution에 대해 이해하고자 한다. What is Scale? image scale(혹은 map scale이라고도 불린다.)은 이미지와 그 이미지가 담고 있는 실제 모습의 사이즈 혹은 거리의 상대적인 차이다. map scale(지도 척도)를 생각하면 이해가 쉬워진다. 그림 1과 .. 2021. 5. 30.
[SEGMENTATION] deconvolution network | Learning Deconvolution Network for Semantic Segmentation | 2015 본 글은 Learning Deconvolution Network for Semantic Segmentation 논문[2]을 공부하면서 이해한 내용을 바탕으로 작성하였습니다. 디테일한 내용은 아래 목차의 순서대로 정리합니다. 목차는 논문과 동일하지 않습니다. 1. Introduction 1.1. FCN 다시 보기 1.2. FCN의 한계 1.3. Contributions of Deconvolution Network 2. Deconvolution Network 구조 2.1. Unpooling 2.2. Deconvolution 2.3. Layer Output으로 Deconvolution Network 이해하기 3. Further Details of the Algorithm 3.1. Instance-wise tr.. 2021. 5. 26.