📊 머신러닝 알고리즘 정리
Label이 있는 데이터로부터 input과 label 데이터 사이의 패턴을 학습하는 방식
📌 지도학습
✔ 회귀
Input 데이터로부터 연속적인 output을 매핑하는 함수를 학습
✔ 선형 회귀
Input과 output의 선형 관계를 모델링하는 회귀 분석 기법
✔ 분류
Input 데이터로부터 이산적인 output을 매핑하는 함수
✔ 습도, 기압 예시
습도와 기압 데이터를 이용해 비가 오는지 여부를 예측
📌 주요 지도학습 알고리즘
✔ K-Nearest Neighbor (KNN)
Input에 가장 가까운 K개의 데이터를 이용하여 output을 예측
예: K=1일 때 가장 가까운 1개의 데이터 기준으로 비 여부 예측
✔ Decision Tree
Input 공간을 여러 개의 작은 영역으로 계층적으로 분할
나무처럼 가지가 뻗는 구조
해석은 쉬우나 성능은 상대적으로 낮을 수 있음
✔ 결정 경계
데이터를 분류하기 위한 경계선을 생성
완벽한 분류는 불가능하지만 분포 기반 경계 생성
✔ 로지스틱 회귀
0~1 사이 확률값으로 결과를 모델링
📌 비지도학습
✔ 클러스터링
비슷한 데이터끼리 그룹(클러스터)으로 묶는 방법
거리 기준이 중요하며 데이터/환경에 따라 달라짐
✔ K-means
클러스터 중심과 거리 기준으로 K개 그룹 생성
✔ Hierarchical Clustering
가까운 클러스터를 반복적으로 합쳐 트리 구조 생성
dendrogram을 잘라 클러스터 수 결정
📌 딥러닝
✔ 뉴런과 선형 구조
이전 뉴런의 입력을 받아 다음 뉴런으로 전달
입력 x → 출력 y 구조
✔ Single Layer Neural Network
p개의 input variable을 받아 Y를 예측하는 비선형 함수
트리, SVM과 구조는 다르지만 비선형 모델
✔ Multilayer Neural Network
여러 개의 hidden layer로 구성
✔ CNN
이미지 데이터에 특화된 신경망
Convolution + Pooling layer 사용
뇌의 시각 처리 방식 모사
✔ RNN
순서가 있는 데이터를 처리하는 신경망
📌 정리
머신러닝은 데이터로부터 패턴을 학습하는 AI 구현 방법이다.
데이터 양이 많을수록 일반적으로 성능이 증가하며 문제와 알고리즘에 따라 필요량이 달라진다.
하드웨어와 소프트웨어 발전으로 다양한 분야에 적용 가능해졌다.
지도학습 → KNN, Decision Tree, SVM
비지도학습 → K-means, Hierarchical
딥러닝 → 다층 뉴런 구조 기반 모델
'빅데이터' 카테고리의 다른 글
| 빅데이터 분산처리와 관리구조 (0) | 2026.05.07 |
|---|---|
| 빅데이터 추천시스템 (0) | 2026.05.03 |
| AI, 머신러닝, 딥러닝 정리 초보용 (0) | 2026.04.15 |
| 데이터 유형별 시각화 기법 정리 초보용 (2) | 2026.04.15 |
| 시각화 맵핑과 데이터 시각화의 원칙을 쉽게 이해 (1) | 2026.04.12 |