목록AI/Computer Vision (5)
Kim Seon Deok
Faster RCNN RPN + Fast RCNN selective Search를 Neural network 구조로 대체 -gpu 사용으로 빠른 학습/inference가 가능해짐 -End to End Network학습 Anchor Box Object가 있는지 없는지의 후보 Box Object의 형태가 다르므로 총 9개의 Anchor box, 3개의 서로 다른 크기, 3개의 서로 다른 ratio로 구성 800*600 크기의 이미지를 1/16으로 downsampling 하여 50*38 = 1900의 크기로 변경 총 anchor box의 개수 = 1900 * 9 = 17100개 기존의 고정된 크기의 bounding box를 사용할 때보다 9배 많은 bounding box를 생성하며 더 다양한 크기의 객체를 포..
R-CNN의 단점 개선 -2000개의 region proposal이미지를 cnn으로 feature extraction하지 않고, 원본 이미지만 CNN으로 feature map 생성 -feature map으로 투영된 서로 다른 크기를 가진 Region Proposal 이미지를 SPP Net의 고정된 크기 벡터로 변환해 FC에 1D Flattened 된 input 제공 Bag of words(BoW) 영상에서 feature들을 뽑은 후, 이들 Feature들을 대표할 수 있는 값(code)들로 구성되는 코드북(codebook)을 생성. 코드북은 다수의 이미지들로부터 추출한 물체를 분류하는데 있어서 중요하다 생각되는 주요 feature들을 전체에 대해 클러스터링(k-means clustering)을 수행해 획..
RCNN 'Regions with Convolutional Neuron Network' Region Proposal 방식에 기반한 Object Detection image classification을 수행하는 CNN과 localization을 위한 regional proposal알고리즘을 연결한 모델 세가지의 모듈로 구성된다. 1.Region Proposal - 물체의 영역을 찾는 모듈 2.CNN detection - 각각의 영역으로부터 고정된 크기의 Feature Vector을 뽑아내는 모듈 3.SVM classifier - Classification을 위한 선형 지도학습 모델 자세한 과정 설명은 다음과 같다. 1.image를 input으로 집어넣는다. 2.Region Proposal Selective..
PASCAL VOC MS COCO : 이미지 한 개에 여러 오브젝트들을 가지고 있으며 타 데이터 셋에 비해 난이도가 높은 데이터를 제공 Google Open Images Annotation이란? 이미지의 Detection 정보를 별도의 설명 파일로 제공되는 것 Object Bounding Box위치나 Object이름 등을 특정 포맷으로 제공함. Python 기반 주요 이미지 라이브러리 PIL scikit-image OpenCV OpenCV 인텔이 초기 개발 주도 Window, 리눅스, Mac OS X, 안드로이드, ios등 다양한 플랫폼에서 사용 가능 방대한 컴퓨터 비전 관련 라이브러리와 손쉬운 인터페이스 제공
하나의 object classification : 분류 localization : 하나의 이미지 내에서 하나의 object의 위치를 bounding box로 지정하여 찾음 > 바운딩 박스 내의 오브젝트를 판별. 여러 개의 object들 object detection : 하나의 이미지 안에 있는 여러 object들의 위치를 bounding box로 지정해 찾음 segmentation : 개별 픽셀 값 단위로 classification해 판단. detection보다 더 발전된 형태로 pixel 레벨 detection 수행 object detection의 주요 구성요소 detection을 위한 deep learning 네트워크 구성 1.feature extraction(backbone) 2.fpn(neck) ..