빅데이터

머신러닝 알고리즘 정리 초보용

달보드레91 2026. 4. 15. 20:30
반응형
머신러닝 알고리즘 정리

📊 머신러닝 알고리즘 정리

Label이 있는 데이터로부터 input과 label 데이터 사이의 패턴을 학습하는 방식

📌 지도학습

✔ 회귀

Input 데이터로부터 연속적인 output을 매핑하는 함수를 학습

✔ 선형 회귀

Input과 output의 선형 관계를 모델링하는 회귀 분석 기법

✔ 분류

Input 데이터로부터 이산적인 output을 매핑하는 함수

✔ 습도, 기압 예시

습도와 기압 데이터를 이용해 비가 오는지 여부를 예측


📌 주요 지도학습 알고리즘

✔ K-Nearest Neighbor (KNN)

Input에 가장 가까운 K개의 데이터를 이용하여 output을 예측

예: K=1일 때 가장 가까운 1개의 데이터 기준으로 비 여부 예측

✔ Decision Tree

Input 공간을 여러 개의 작은 영역으로 계층적으로 분할

나무처럼 가지가 뻗는 구조

해석은 쉬우나 성능은 상대적으로 낮을 수 있음

Random Forest, Boosting으로 성능 개선 가능 (단 해석력 감소)

✔ 결정 경계

데이터를 분류하기 위한 경계선을 생성

완벽한 분류는 불가능하지만 분포 기반 경계 생성

✔ 로지스틱 회귀

0~1 사이 확률값으로 결과를 모델링


📌 비지도학습

✔ 클러스터링

비슷한 데이터끼리 그룹(클러스터)으로 묶는 방법

거리 기준이 중요하며 데이터/환경에 따라 달라짐

✔ K-means

클러스터 중심과 거리 기준으로 K개 그룹 생성

✔ Hierarchical Clustering

가까운 클러스터를 반복적으로 합쳐 트리 구조 생성

dendrogram을 잘라 클러스터 수 결정

bottom-up (agglomerative) 방식이 일반적

📌 딥러닝

✔ 뉴런과 선형 구조

이전 뉴런의 입력을 받아 다음 뉴런으로 전달

입력 x → 출력 y 구조

✔ Single Layer Neural Network

p개의 input variable을 받아 Y를 예측하는 비선형 함수

트리, SVM과 구조는 다르지만 비선형 모델

✔ Multilayer Neural Network

여러 개의 hidden layer로 구성

✔ CNN

이미지 데이터에 특화된 신경망

Convolution + Pooling layer 사용

뇌의 시각 처리 방식 모사

✔ RNN

순서가 있는 데이터를 처리하는 신경망


📌 정리

머신러닝은 데이터로부터 패턴을 학습하는 AI 구현 방법이다.

데이터 양이 많을수록 일반적으로 성능이 증가하며 문제와 알고리즘에 따라 필요량이 달라진다.

하드웨어와 소프트웨어 발전으로 다양한 분야에 적용 가능해졌다.

지도학습 → KNN, Decision Tree, SVM

비지도학습 → K-means, Hierarchical

딥러닝 → 다층 뉴런 구조 기반 모델

반응형