목록AI (38)
Kim Seon Deok
VGGNet논문 : https://arxiv.org/pdf/1409.1556.pdf VGGNet VGG논문은 convolutional network의 깊이를 증가시키면서 정확도 양상을 조사한다. VGG모델은 3*3 convolution layer를 연속적으로 사용한 16-19 깊이의 모델이다. Introduction convnets이 컴퓨터 비전 분야에서 점점 상용화 되어가면서 더 좋은 정확도를 얻기 위해 AlexNet의 기본 구조를 향상시키기 위한 많은 시도가 이루어졌다. 이 논문에서는 Convnet 구조의 깊이에 집중한다. 이를 위해 더 많은 convolutional layer를 추가하였고 이것은 모든 layers에 매우 작은 3*3 convolution filters를 사용하였다. ConvNet C..
https://proceedings.neurips.cc/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf AlexNet[Krizhevskv et al., 2012] 목표 더 깊은 네트워크를 만들면서 성능을 높여간다. 5개의 Convolution층과 3개의 Fully-connected layer가 연결된 아키텍처로 구성 Fully- connected layer의 마지막 부분은 softmax 함수를 사용해 1000개의 output을 출력 3. Architecture 3.1 ReLU Nonlinearity 활성화 함수로 ReLU함수를 적용 이전까지 사용한 tanh함수는[-1,1] 범위에서 존재하는 saturating function이다. -1에서 1까지 ..
Faster RCNN RPN + Fast RCNN selective Search를 Neural network 구조로 대체 -gpu 사용으로 빠른 학습/inference가 가능해짐 -End to End Network학습 Anchor Box Object가 있는지 없는지의 후보 Box Object의 형태가 다르므로 총 9개의 Anchor box, 3개의 서로 다른 크기, 3개의 서로 다른 ratio로 구성 800*600 크기의 이미지를 1/16으로 downsampling 하여 50*38 = 1900의 크기로 변경 총 anchor box의 개수 = 1900 * 9 = 17100개 기존의 고정된 크기의 bounding box를 사용할 때보다 9배 많은 bounding box를 생성하며 더 다양한 크기의 객체를 포..
R-CNN의 단점 개선 -2000개의 region proposal이미지를 cnn으로 feature extraction하지 않고, 원본 이미지만 CNN으로 feature map 생성 -feature map으로 투영된 서로 다른 크기를 가진 Region Proposal 이미지를 SPP Net의 고정된 크기 벡터로 변환해 FC에 1D Flattened 된 input 제공 Bag of words(BoW) 영상에서 feature들을 뽑은 후, 이들 Feature들을 대표할 수 있는 값(code)들로 구성되는 코드북(codebook)을 생성. 코드북은 다수의 이미지들로부터 추출한 물체를 분류하는데 있어서 중요하다 생각되는 주요 feature들을 전체에 대해 클러스터링(k-means clustering)을 수행해 획..
RCNN 'Regions with Convolutional Neuron Network' Region Proposal 방식에 기반한 Object Detection image classification을 수행하는 CNN과 localization을 위한 regional proposal알고리즘을 연결한 모델 세가지의 모듈로 구성된다. 1.Region Proposal - 물체의 영역을 찾는 모듈 2.CNN detection - 각각의 영역으로부터 고정된 크기의 Feature Vector을 뽑아내는 모듈 3.SVM classifier - Classification을 위한 선형 지도학습 모델 자세한 과정 설명은 다음과 같다. 1.image를 input으로 집어넣는다. 2.Region Proposal Selective..