목록전체 글 (168)
Kim Seon Deok
과적합의 발생원인 1. 학습할 샘플 데이터 수의 부족 학습할 데이터의 수가 많을 수록 모집단의 특성을 잘 반영할 확률이 높다. 모집단의 특성을 잘 반영할수록 과적합이 일어날 확률이 적어진다. 따라서 학습할 데이터의 수가 적을수록 과적합이 일어날 확률이 높다. 2.풀고자 하는 문제에 비해 복잡한 모델 적용 간단한 문제에 대해서는 간단한 모델 혹은 적은 변수를 사용해야 한다. 3.적합성 평가 및 실험 설계 학습 데이터와 검증 데이터로 분할하고 학습데이터로 모델을 학습한 후 검증 데이터에 모델을 적용시켜 과적합 여부를 판단해야 한다. 하이퍼파라미터(hyperparameter) : 학습데이터를 모델에 학습시킬 때 사용자가 지정해야 할 다양한 파라미터 학습 데이터(training data) : 머신러닝 모델함수 ..
RNN의 한계 long-term dependency 중요한 정보가 recurrent step이 계속됨에 따라 희석되는 문제 LSTM(Long short - term memory) RNN의 한계를 보완중요한 정보만 선택하여 다음 state에 전달함Cell에 정보를 저장정보들은 gate에 의해서 선택됨 >> 중요한 정보들을 오랜기간 동안 가지고 멀리 갈 수 있게 한 구조 Cell state = 사람의 장기기억 모든 LSTM 연산을 관통하는 vector학습 데이터를 관통하는 중요한 정보들을 가지고 있음Gate구조를 통해 정교하게 정보가 추가되고 삭제됨목적 : 정보 보관! * RNN의 state vs LSTM의 state RNN의 state : 정보 저장, 정보 전달을 모두 함 LSTM의 state - 정보 저..
Sequential data : sequence를 갖고있는 data >> 이전 data가 이후 data에 영향을 미침 RNN(Recurrent Neural Network) -딥러닝 구조 중 하나 -가변적 길이의 연속적인 시퀀스 input 데이터를 처리하기 위해 고안된 모델 -이웃한 데이터간의 연관성을 표현 -'기억'을 뜻하는 'hidden state'를 가지고 있음 -새로운 입력이 들어올 때마다 기억을 조금씩 수정 -RNN은 추가된 input(xt)과 과거의 정보(ht-1)을 조합해, 새로운 정보(ht)를 생성 -원하는 시점에 생성된 정보(ht)를 통해 task를 수행 >> task에 따라서 yt가 필요한 / 필요하지 않은 경우가 달라짐 -input과 이전 state를 선형변환하여 결합한 후 activa..
인공지능 인간의 지능으로 할 수 있는 사고 학습, 자기 개발 등을 컴퓨터가 할 수 있도록 하는 방법을 연구하는 컴퓨터 공학 및 정보 기술의 한 분야 컴퓨터가 인간의 지능적인 행동을 모방할 수 있도록 하는 것 딥러닝 + 전통적 머신러닝(데이터 사이언스, 데이터 분석) 인공지능의 사례 1.이미지 분류 인간이 이미지를 분류하는 성능은 약 95%. 2015년 'ResNet'이라는 모델이 96%의 성능을 기록하면서 인간의 능력을 뛰어넘기 시작 2.객체 탐지 어떤 이미지 및 비디오 속에 포함돼 있는 물체에 대해 해당 물체가 어떤 물체인지 분류하는 문제, 물체의 위치를 찾아내는 문제 물체의 위치정보(x,y,w,h)를 bounding box로 표현하여 자율주행 자동차, CCTV 등과 같은 카메라 기술ㅇ르 바탕으로 개발..
GUI = Graphical User Interace 그래픽 사용자 인터페이스 코드를 그래픽화하여 사용자가 쓰기 편하도록 만든 환경 tkinter -파이썬에서 그래픽 사용자 인터페이스(GUI)를 개발할 때 필요한 모듈 -예전부터 유닉스 계열에서 사용되던 Tcl/Tk 위에 객체 지향 계층을 입힌 것이다. Tk는 John Ousterhout에 의하여 Tcl 스크립팅 언어를 위한 GUI 확장으로 개발 전체 창 >> 하나의 장치 창(Window) 위젯 = 부품 import 방법 from tkinter import * 또는 import tkinter tkinter.Tk() 창 생성 win = Tk() 창 크기 win.geometry(" 2000 * 2000 ") 창 제목 win.title("gui_coding")..