GAN

생성 모델링

술임 2022. 5. 14. 22:20

1.1 생성 모델링

- 생성 모델

: 데이터셋을 생성하는 방법, 모델에서 샘플링해서 새로운 데이터를 생성함

훈련 데이터 : 개체의 샘플을 많이 가진 데이터셋

샘플 : 데이터 포인트 한개

- 각 샘플은 많은 feature로 이루어져있음

- 이미지 생성에서는 feature는 개별 픽셀값

- 생성 모델은 결정적이 아니고 확률적이어함, 고정되어있는 것이 아니라 영향을 미칠 수 있는 확률적 요소를 포함해야함

 

 

1.1.1 생성 모델링, 판별 모델링

판별 모델링을 수행할 때는 훈련 데이터의 각 샘플이 레이블을 가져야함

판별 모델링은 지도학습. 

ex. 반 고흐의 그림을 판별하는 모델은 반 고흐 그림처럼 보이는 그림을 만드는 방법은 알지 못함

 

cf. 생성 모델링은 레이블이 없는 데이터셋에서 수행됨(비지도 학습)

개별 클래스 샘플을 생성하기 위해서 레이블을 가진 데이터셋에서도 적용 가능함

 

-> 판별 모델링은 샘플 x가 범주 y에 속할 확률을 추정함

-> 생성 모델링은 샘플 레이블이 아닌 샘플을 발견할 확률을 추정함

-> 판별 모델링은 머신러닝 발전에 동력 제공

 

1.1.2 생성 모델

-> 최근에는 생성 모델링 작업에 딥러닝을 적용함

1) 엔비디아의 StyleGAN : 실제 같은 사람 얼굴 이미지 생성 가능

2) 오픈AI의 GPT-2 언어 모델 : 짧은 도입 구문 제공 시 완전한 문장 만들 수 있음

 

1.1.3 생성 모델링 프레임워크

  • 샘플 데이터셋 X를 가짐
  • 샘플이 알려지지 않은 어떤 Pdata 분포로 생성되었다고 가정
  • 생성 모델 Pmodel이 Pdata를 흉내내려고 함. 
  • 목표 달성 시 Pmodel에서 샘플링해서 Pdata에서 뽑은것 같은 샘플 생성 가능
  • Pmodel 의 규칙
  • 규칙 1 : Pdata에서 뽑은 것 같은 샘플 생성이 가능함
  • 규칙 2 : X에 있는 샘플과 다른 샘플 생성이 가능함, 모델이 이미 본 샘플을 단순히 재생산하지 않음

 

1.2 확률적 생성 모델

  • 표본 공간 : 샘플 x가 가질 수 있는 모든 값의 집합
  • 확률 밀도 함수 : p(x)는 표본 공간의 포인트 x를 0과 1 사이의 숫자에 매핑하는 함수
  • 모수 모델 : p𝜽(x)는 한정된 개수의 파라미터 𝜽 사용해서 묘사하는 확률 밀도 함수의 한 종류
  • 가능도 : 파라미터 집합 𝜽의 가능도는 샘플 포인트 x가 주어졌을 때 𝜽의 알맞은 정도를 측정함
  • 최대 가능도 추정 : 확률 밀도 함수의 파라미터 집합에서 관측된 데이터 X를 가장 잘 설명할 수 있는 추정값을 찾는 방법

진짜 확률 밀도 함수 Pdata는 하나지만 Pdata를 추정하기 위해 사용할 수 있는 확률 밀도 함수 Pmodel은 무수히 많음

적합한 Pmodel(X)를 찾기 위해 모수 모델(parametric model)이라는 기법을 사용

 

1.3 생성 모델의 난관

  • 특성 간에 조건부 의존성이 클 때는 어떻게 대처할 것인가
  • 모델 이 고차원 표본 공간의 생성 가능한 샘플 중 만족할 수 있는 하나를 찾을 것인가

미리 만든 가정을 따르는 것이 아니라 데이터로부터 의미 있는 구조를 추론할 수 있는 모델이 필요함

딥러닝이 저차원 공간의 특성으로 변환할 수 있는 사실은 표현학습(representation learning)을 수행함

 

1.3.1 표현학습

- 고차원 표본 공간을 직접 모델링하는게 아니라 대신 저차원의 잠재 공간(latent space)를 사용해서 훈련세트의 각 샘플을 표현하고 원본 공간의 포인트에 매핑

- 잠재 공간의 각 포인트는 고차원 이미지에 대한 표현

--> 미리 주어진 특성에 값을 할당하지 않음

--> 샘플을 묘사하는데 가장 뛰어난 특성과 이런 특성을 원본 데이터에서 추출하는 방법을 학습함

(데이터의 비선형 매니폴드를 찾고, 공간을 완전하게 설명하기 위한 필요 차원을 구성함)

 

- 픽셀이 어떻게 출력되어야하는지 가장 잘 설명하는 고수준 특성을 만듦

- 잠재 공간의 포인트는 잘 구성된 이미지를 표현함

- 잠재 공간에서 특성값을 조금 바꾸면 새로운 표현 생성 가능

- 원본 이미지 공간으로 잠재 공간을 되돌리면 개별 원시 픽셀을 직접 다루는 것보다 실제와 같이 보일 가능성이 높을 것

 

 

 

 

 

 

 

 

'GAN' 카테고리의 다른 글

Neural Style Transfer  (0) 2022.05.29
CycleGAN  (0) 2022.05.26
WGAN, WGAN-GP  (0) 2022.05.23
GAN 생성적 적대 신경망  (1) 2022.05.20
딥러닝  (0) 2022.05.17