2024. 1. 8. 15:54ㆍ인공지능/머신러닝 이론
머신러닝(Machine Learning, ML)
기계학습은 컴퓨터가 데이터를 분석하여 학습하는 알고리즘이나 기술을 뜻하며, 인공지능의 한 분야이다. 쉽게 말해, 주어진 데이터에서 유의미한 규칙등을 컴퓨터가 스스로 찾아내고 학습하는 것을 말한다.
머신러닝 알고리즘 유형
머신 러닝의 모든 개념에 대해서 자세하게 짚고 넘어가면 글의 내용이 너무 늘어나므로, 이 글에서는 각 유형에 대해 간략하게만 설명하고 넘어간다.
1. 지도 학습(Supervised Learning)
레이블(Label)된 훈련 데이터로 모델을 학습시키는 방법. 입력 값 X와, 그에 대한 Label Y로 이루어져 있다. 쉽게 말해 문제와 정답을 모두 알려주고 공부시키는 방법이라 할 수 있다. 지도 학습은 크게 분류와 회귀의 두 카테고리로 나누어진다.
분류(Classification)는 과거의 관측을 기반으로 새로운 샘플이나 새로운 데이터 포인트의 범주형 클래스 레이블(순서가 없음)을 예측하는 것이 목적이다. 여기서 클래스 레이블은 샘플이 속한 그룹을 말한다. 가령 개와 고양이를 분류하고자 할 때, 개 또는 고양이라는 종족이 클래스 레이블이 될 수 있다. 클래스 레이블이 두 가지이면 이진 분류(Binary Classification), 두 가지 이상이면 다중 분류(Multiclass Classification)이라 부른다.
회귀(Regression)는 특성(Feature)를 기준으로, 연속적인 출력 값(반응 변수, 결과)을 예측하는 것이 목적이다. 지구의 평균온도에 따른 평균해수면 높이를 예측하고자 할 때, 이용할 수 있을 것이다.
○ 유형: 분류
● 다층 퍼셉트론 (Multi Layer Perceptron, MLP): 심층 신뢰 신경망(DBN), 합성곱 신경망(CNN), 순환 신경망(RNN)
● 서포트 벡터 머신 (Support Vector Machine, SVM)
● K-최근접 이웃 알고리즘 (K-Nearest Neighbors Algorithm, KNN)
● 결정 트리 (Decision Tree)
● 앙상블 분석 (Ensemble-based Classification)
● 나이브 베이즈 분류기 (Naive Bayes Classifier)
○ 유형: 회귀
● 선형 회귀분석(Linear Regression): 단순 선형 회귀, 다중 선형 회귀
● 로지스틱 회귀분석(Logistic Regression)
2. 비지도 학습(Unsupervised Learning)
비지도 학습에서는 레이블되지 않거나 구조를 알 수 없는 데이터를 다룬다. 쉽게 설명하면, 정답을 가르쳐주지 않고 학습시키는 방법이라 할 수 있다. 주어진 데이터에서 구조를 찾는 것이 주요 목적이며, 다변량 데이터를 정제 그룹으로 묶을 수 있다. 비지도 학습의 대표적인 카테고리로는 군집화, 독립 성분 분석(ICA), 생산적 적대 신경망(GAN)등이 있다.
군집(Clustering)은 서로 유사한 속성을 갖는 데이터를 서브 그룹(Subgroup)이나 클러스터(Cluster)로 조직하는 탐색적 데이터 분석 또는 패턴 발견 기법이다. 클러스터링 알고리즘은 분할적 클러스터링(Partitional Clustering)과 계층적 클러스터링(Hierarchical Clustering)으로 분류된다.
○ 유형: 군집화
● K-평균 알고리즘 (K-Means Clustering)
● Mean-Shift Clustering
● Density-Based Spatial Clustering of Applications with Noise (DBSCAN)
● Expectation-Maximization Clustering
● Agglomerative Hierarchical Clustering
3. 강화 학습(Reinforcement Learning)
강화 학습은 행위자(Agent)가 환경(Environment) 속 현재 상태(State)에서 취한 행동(Action) 대해 보상(Reward)을 받으며 학습하는 방법으로써, 보상을 최대화하는 것이 목적이다. 이때 행위자는 자신이 어떤 행동을 해야 하는지 알지 못하는 상태에서 학습을 시작한다. 다시말해 목표 지향(Goal-directed learning)에 초점을 둔 학습 방법이다. 가장 구현하기 어려운 학습 유형이지만, 다른 유형의 학습으로 해결하기 어렵거나 복잡한 문제 해결에 용이하다.
'인공지능 > 머신러닝 이론' 카테고리의 다른 글
머신러닝 - 6. 데이터 스케일링 (Data Scaling) (0) | 2024.01.10 |
---|---|
머신러닝 - 5. 적응형 선형 뉴런(ADALINE) (1) | 2024.01.10 |
머신러닝 - 4. 평균 제곱 오차(Mean Squared Error, MSE) (0) | 2024.01.10 |
머신러닝 - 3. 경사하강법(Gradient Descent) (0) | 2024.01.09 |
머신러닝 - 2. 단층 퍼셉트론(Perceptron) (0) | 2024.01.09 |