[Gen AI] ์์ฑํ ๋ชจ๋ธ๋ค์ ์๋ฆฌ ๋น๊ต: VAE, GAN, Flow-based, Diffusion
๐ก ๋ณธ ๋ฌธ์๋ '[Gen AI] ์์ฑํ ๋ชจ๋ธ๋ค์ ์๋ฆฌ ๋น๊ต: VAE, GAN, Flow-based, Diffusion'์ ๋ํด ์ ๋ฆฌํด๋์ ๊ธ์ ๋๋ค.
์์ฑํ ๋ชจ๋ธ๋ค ์ค ๋ํ์ ์ธ ๋ชจ๋ธ์ธ VAE, GAN, Flow-based, Diffusion์ ๋ํด ๋น๊ตํ๊ณ , ๊ฐ ๋ฐฉ๋ฒ๋ก ์ด Latent variable๋ก๋ถํฐ ์์ฑํ๋ ์๋ฆฌ๋ฅผ ์ ๋ฆฌํ์์ผ๋ ์ฐธ๊ณ ํ์๊ธฐ ๋ฐ๋๋๋ค.
1. Prerequisite
1) Markov Chain
Markov ์ฑ์ง์ ๊ฐ๋ ์ด์ฐ ํ๋ฅ ๊ณผ์
- Markov ์ฑ์ง: "ํน์ ์ํ์ ํ๋ฅ (t+1)์ ์ค์ง ํ์ฌ(t)์ ์ํ์ ์์กดํ๋ค"
- ์ด์ฐ ํ๋ฅ ๊ณผ์ : ์ด์ฐ์ ์ธ ์๊ฐ(0์ด, 1์ด, ..,) ์์์์ ํ๋ฅ ์ ํ์
$$ P[s_(t+1) | s_(t)] = P[s_(t+1) | s_1, ..., s_(t)] $$
e.g. "๋ด์ผ์ ๋ ์จ๋ ์ค๋์ ๋ ์จ๋ง ๋ณด๊ณ ์ ์ ์๋ค."
2) Normalizing Flow
์ฌ์ธต์ ๊ฒฝ๋ง ๊ธฐ๋ฐ ํ๋ฅ ์ ์์ฑ ๋ชจํ ์ค ํ๋. ์ ์ฌ ๋ณ์(Z) ๊ธฐ๋ฐ ํ๋ฅ ์ ์์ฑ ๋ชจํ์ผ๋ก์, ์ ์ฌ ๋ณ์(Z) ํ๋์ '๋ณ์ ๋ณํ' ๊ณต์์ ํ์ฉํฉ๋๋ค.
2. Probabilistic Generative Model: Latent variable model
1) Overview of Generative Models
- ๋ฐ๋ณต์ ์ธ ๋ณํ(iterative transformation)๋ฅผ ํ์ฉํ๋ค๋ ์ ์์ Flow-based models์ ์ ์ฌ
- ๋ถํฌ์ ๋ํ ๋ณ๋ถ์ ์ถ๋ก (Variational Inference)์ ํตํ ํ์ต์ ์งํํ๋ค๋ ์ ์ VAE์ ์ ์ฌ
- ์ต๊ทผ์๋ Diffusion ๋ชจ๋ธ์ ํ์ต์ Adversarial Training์ ํ์ฉํ๊ธฐ๋ ํจ (Diffusion-GAN, 2022)
2) Generative model: Latent variable model
๊ฒฐ๊ตญ ์์ฑ ๋ชจ๋ธ๋ก๋ถํฐ ์ํ๋ ๊ฒ์ ๋งค์ฐ ๊ฐ๋จํ ๋ถํฌ(Z)๋ฅผ ํน์ ํ ํจํด์ ๊ฐ๋ ๋ถํฌ๋ก ๋ณํ(Mapping, transformation, sampling)ํ๋ ๊ฒ์ ๋๋ค. ๊ทธ๋ ๊ธฐ์ ๋๋ถ๋ถ์ ์์ฑ๋ชจ๋ธ์ด ์ฃผ์ด์ง ์ ๋ ฅ ๋ฐ์ดํฐ๋ก๋ถํฐ latent variable(Z)์ ์ป์ด๋ด๊ณ , ์ด๋ฅผ ๋ณํํ๋ ์ญ๋์ ํ์ตํ๊ณ ์ ํฉ๋๋ค.
3) Variational Auto Encoder
- ํ์ต๋ Decoder network๋ฅผ ํตํด latent variable์ ํน์ ํ ํจํด์ ๋ถํฌ๋ก mapping
- Encoder๋ฅผ ๋ชจ๋ธ ๊ตฌ์กฐ์ ์ถ๊ฐํด, Latent variable / Encoder / Decoder๋ฅผ ๋ชจ๋ ํ์ต์ํต๋๋ค.
3) Generative Adversarial Network (GAN)
- ํ์ต๋ Generator๋ฅผ ํตํด latent variable์ ํน์ ํ ํจํด์ ๋ถํฌ๋ก mapping
- Discriminator๋ฅผ ๋ชจ๋ธ ๊ตฌ์กฐ์ ์ถ๊ฐํด, Generator๋ฅผ ํ์ต์ํด
4) Flow-based Model
๊ธฐ๋ณธ์ ์ผ๋ก ๊ฐ๋จํ๊ณ tractableํ prior ๋ถํฌ๋ฅผ ๋ณต์กํ ๋ถํฌ๋ก ๋ณํ์๊ณ ์ ํฉ๋๋ค. ์ด๋ฅผ ์ํด ํ์ตํ Invertible Function์ Inverse mapping์ ์ด์ฉํ๋ฉฐ, ์ด๋ฌํ function์ flow๋ผ ํ์ฌ ์์ฑ์ ํ์ฉํฉ๋๋ค.
- ํ์ต๋ Flow model์ Inverse mapping์ ํตํด latent variable์ ํน์ ํ ํจํด์ ๋ถํฌ๋ก mapping
- ์์ฑ์ ํ์ฉ๋๋ Inverse mapping์ ํ์ตํ๊ธฐ ์ํด Invertible Function์ ํ์ต
5) Diffusion based generative model
Diffusion ๋ชจ๋ธ๋ ๊ธฐ๋ณธ์ ์ผ๋ก ๊ฐ๋จํ๊ณ tractableํ prior ๋ถํฌ๋ฅผ ๋ณต์กํ ๋ถํฌ๋ก ๋ณํ์๊ณ ์ ํฉ๋๋ค.
- ํ์ต๋ Diffusion Model์ ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ถํฌ P(x|z)๋ฅผ ํตํด ํน์ ํ ํจํด์ ๋ถํฌ ํ๋
- ์์ฑ์ ํ์ฉ๋๋ ์กฐ๊ฑด๋ถ ํ์จ ๋ถํฌ P(x|z)๋ฅผ ํ์ตํ๊ธฐ ์ํด Diffusion process q(z|x)๋ฅผ ํ์ฉ
์ฐธ๊ณ
[Youtube] [Paper Review] Denoising Diffusion Probabilistic Models: https://www.youtube.com/watch?v=_JQSMhqXw-4