공간 변환 방법과 유용성
비지도 학습 알고리즘이 데이터의 구조를 스스로 파악하여 최적의 공간 변환을 알아내는 접근방법을 사용해야 함
* 인코딩 : 원래 공간을 다른 공간으로 변환하는 과정(f)
* 디코딩 : 원래 공간으로 역변환하는 과정(g)
1. 선형 인자 모델 linear factor model
* 인자 factor : 현상으로 나타나지 않는, 관찰되지 않는 변수(latent variable, hidden variable)
: 선형 연산을 이용하여 관찰한 데이터를 인자로 변환하는 방법
* 데이터의 잠재적인 특성을 파악해서 더 심층적인 의사결정이 가능
* 선형 연산을 사용하므로 행렬 곱으로 인코딩과 디코딩 과정 표현 가능
1) 주성분 분석 PCA (principal component analysis)
데이터를 원점 중심으로 옮겨 놓는 일부터 시작
고차원 데이터를 저차원으로 변환하면 정보 손실이 일어남 -> 정보 손실이 적을수록 좋은 축
2) 학습 알고리즘
PCA 목적은 정보 손실을 최소화하면서 저차원으로 변환
머신러닝 - 훈련집합 X가 주어지면 정보 손실을 최소화하는 q개의 벡터, 변환 행렬 W를 찾는 것
PCA는 변환된 새로운 공간에서 샘플이 얼마나 퍼져 있는지를 따져 정보 손실을 측정함
변환된 훈련집합의 분산이 클수록 정보 손실이 작다고 판단함
'ML' 카테고리의 다른 글
밀도 추정 (0) | 2023.07.31 |
---|---|
군집화 (0) | 2023.07.25 |
Optimization - 2차 미분 (0) | 2023.02.13 |
Hyperparameter Optimization (0) | 2023.01.31 |
Regularization Method (0) | 2023.01.30 |