ML

공간 변환의 이해

술임 2023. 8. 7. 13:13

공간 변환 방법과 유용성

비지도 학습 알고리즘이 데이터의 구조를 스스로 파악하여 최적의 공간 변환을 알아내는 접근방법을 사용해야 함

* 인코딩 : 원래 공간을 다른 공간으로 변환하는 과정(f)

* 디코딩 : 원래 공간으로 역변환하는 과정(g)

 

1. 선형 인자 모델 linear factor model

* 인자 factor : 현상으로 나타나지 않는, 관찰되지 않는 변수(latent variable, hidden variable)

: 선형 연산을 이용하여 관찰한 데이터를 인자로 변환하는 방법

* 데이터의 잠재적인 특성을 파악해서 더 심층적인 의사결정이 가능

* 선형 연산을 사용하므로 행렬 곱으로 인코딩과 디코딩 과정 표현 가능

 

1) 주성분 분석 PCA (principal component analysis)

데이터를 원점 중심으로 옮겨 놓는 일부터 시작

고차원 데이터를 저차원으로 변환하면 정보 손실이 일어남 -> 정보 손실이 적을수록 좋은 축

 

2) 학습 알고리즘

PCA 목적은 정보 손실을 최소화하면서 저차원으로 변환

머신러닝 - 훈련집합 X가 주어지면 정보 손실을 최소화하는 q개의 벡터, 변환 행렬 W를 찾는 것

PCA는 변환된 새로운 공간에서 샘플이 얼마나 퍼져 있는지를 따져 정보 손실을 측정함

변환된 훈련집합의 분산이 클수록 정보 손실이 작다고 판단함

 

 

'ML' 카테고리의 다른 글

밀도 추정  (0) 2023.07.31
군집화  (0) 2023.07.25
Optimization - 2차 미분  (0) 2023.02.13
Hyperparameter Optimization  (0) 2023.01.31
Regularization Method  (0) 2023.01.30