Study: Artificial Intelligence(AI)/AI: 3D Vision

[๋…ผ๋ฌธ๋ฆฌ๋ทฐ] Spacetime: Spacetime Gaussian Feature Splatting for Real-Time Dynamic View Synthesis (CVPR 2024)

DrawingProcess 2024. 11. 19. 23:47
๋ฐ˜์‘ํ˜•
๐Ÿ’ก ๋ณธ ๋ฌธ์„œ๋Š” 'Spacetime Gaussian Feature Splatting for Real-Time Dynamic View Synthesis (CVPR 2024)' ๋…ผ๋ฌธ์„ ์ •๋ฆฌํ•ด๋†“์€ ๊ธ€์ž…๋‹ˆ๋‹ค.
ํ•ด๋‹น ๋…ผ๋ฌธ์€ 3D Gaussian์„ 4D ์‹œ๊ณต๊ฐ„ ์˜์—ญ์œผ๋กœ ํ™•์žฅํ•˜๋Š” Spacetime Gaussian (STG)์„ ์ œ์•ˆํ•˜์˜€์œผ๋ฉฐ, ์ด๋Š” ๋‹คํ•ญ์‹์œผ๋กœ parameterize๋œ ๋ชจ์…˜ ๋ฐ ํšŒ์ „๊ณผ ํ•จ๊ป˜ ์‹œ๊ฐ„์— ๋”ฐ๋ฅธ ๋ถˆํˆฌ๋ช…๋„๋ฅผ 3D Gaussian์— ์žฅ์ฐฉํ•˜์—ฌ Dynamic View Synthesis๋กœ์˜ ํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค€ ๋…ผ๋ฌธ์ด๋‹ˆ ์ฐธ๊ณ ํ•˜์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค.
Zhan Li, Zhang Chen, Zhong Li, Yi Xu
OPPO US Research Center | Portland State University
 - Project: https://oppo-us-research.github.io/SpacetimeGaussians-website/
 - Paper: https://arxiv.org/abs/2312.16812
 - Github: https://github.com/oppo-us-research/SpacetimeGaussians
 - Youtube: https://www.youtube.com/watch?v=_7deTUDRlns&feature=youtu.be

Introduction

์ •์  ์žฅ๋ฉด์—์„œ์˜ ์„ฑ๊ณต์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  NeRF๋‚˜ 3D Gaussian Splatting (3DGS)๋ฅผ ๋™์  ์žฅ๋ฉด์— ์ง์ ‘ ์ ์šฉํ•˜๋Š” ๊ฒƒ์€ ๋ชจ๋ธ ํฌ๊ธฐ ๋ฐ ํ•™์Šต ์‹œ๊ฐ„์˜ ์˜ค๋ฒ„ํ—ค๋“œ๋กœ ์ธํ•ด ์–ด๋ ต๋‹ค. SOTA ๋™์  ๋ทฐ ํ•ฉ์„ฑ ๋ฐฉ๋ฒ•์€ ๋‹จ์ผ ๋ชจ๋ธ์—์„œ ์—ฌ๋Ÿฌ ํ”„๋ ˆ์ž„์ด ํ‘œํ˜„๋˜๋Š” ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ฑ„ํƒํ•˜์˜€๋‹ค.

NeRFPlayer์™€ HyperReel์€ ์ •์ ์ธ ๊ณต๊ฐ„์  ํ‘œํ˜„๊ณผ ์‹œ๊ฐ„์  feature์˜ ๊ณต์œ  ๋ฐ ๋ณด๊ฐ„์„ ๊ฒฐํ•ฉํ•˜์—ฌ ๋ชจ๋ธ์˜ ์••์ถ•์„ฑ์„ ํ–ฅ์ƒ์‹œ์ผฐ๋‹ค. ์ด ์ „๋žต์€ ๋™์˜์ƒ์˜ ์ธ์ ‘ ํ”„๋ ˆ์ž„์ด ์ผ๋ฐ˜์ ์œผ๋กœ ๋†’์€ ์œ ์‚ฌ์„ฑ์„ ๋‚˜ํƒ€๋‚ด๋Š” ํŠน์„ฑ์„ ํ™œ์šฉํ•œ๋‹ค. ๋น„์Šทํ•œ ๋งฅ๋ฝ์—์„œ MixVoxels๋Š” ์‹œ๊ฐ„์— ๋”ฐ๋ผ ๋ณ€ํ•˜๋Š” latent๋ฅผ ์‚ฌ์šฉํ•˜๊ณ  ์ด๋ฅผ ๋‚ด์ ์œผ๋กœ ๊ณต๊ฐ„์  feature์™€ ์—ฐ๊ฒฐํ•˜์˜€๋‹ค. K-Planes๊ณผ HexPlane์€ ๊ฐ„๊ฒฐํ•œ ํ‘œํ˜„์„ ์œ„ํ•ด 4D ์‹œ๊ณต๊ฐ„ ์˜์—ญ์„ ์—ฌ๋Ÿฌ 2D ํ‰๋ฉด์œผ๋กœ ๋ถ„ํ•ดํ•˜์˜€๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐฉ๋ฒ•์˜ ํ•œ ๊ฐ€์ง€ ํ•œ๊ณ„์ ์€ ๊ทธ๋ฆฌ๋“œ์™€ ๊ฐ™์€ ํ‘œํ˜„์ด ์žฅ๋ฉด ๊ตฌ์กฐ์˜ ์—ญํ•™์— ์™„์ „ํžˆ ์ ์‘ํ•  ์ˆ˜ ์—†์–ด ์„ฌ์„ธํ•œ ๋””ํ…Œ์ผ์˜ ๋ชจ๋ธ๋ง์„ ๋ฐฉํ•ดํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ๋™์‹œ์— ํ’ˆ์งˆ ์ €ํ•˜ ์—†์ด ์‹ค์‹œ๊ฐ„ ๊ณ ํ•ด์ƒ๋„ ๋ Œ๋”๋ง์„ ์ƒ์„ฑํ•˜๋Š” ๋ฐ ์–ด๋ ค์›€์„ ๊ฒช๊ณ  ์žˆ๋‹ค.

๋ณธ ๋…ผ๋ฌธ์—์„œ๋Š” ๋™์  ๋ทฐ ํ•ฉ์„ฑ์„ ์œ„ํ•œ ์ƒˆ๋กœ์šด ํ‘œํ˜„์„ ์ œ์‹œํ•˜์˜€๋‹ค. ๋ณธ ๋…ผ๋ฌธ์˜ ์ ‘๊ทผ ๋ฐฉ์‹์€ ์‚ฌ์‹ค์ ์ธ ํ’ˆ์งˆ, ์‹ค์‹œ๊ฐ„ ๊ณ ํ•ด์ƒ๋„ ๋ Œ๋”๋ง, ์ปดํŒฉํŠธํ•œ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ๋™์‹œ์— ๋‹ฌ์„ฑํ•˜์˜€๋‹ค. ํ•ต์‹ฌ์€ 3D Gaussian์„ 4D ์‹œ๊ณต๊ฐ„ ์˜์—ญ์œผ๋กœ ํ™•์žฅํ•˜๋Š” Spacetime Gaussian (STG)์ด๋‹ค. ๋‹คํ•ญ์‹์œผ๋กœ parameterize๋œ ๋ชจ์…˜ ๋ฐ ํšŒ์ „๊ณผ ํ•จ๊ป˜ ์‹œ๊ฐ„์— ๋”ฐ๋ฅธ ๋ถˆํˆฌ๋ช…๋„๋ฅผ 3D Gaussian์— ์žฅ์ฐฉํ•œ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ STG๋Š” ์žฅ๋ฉด์˜ ์ •์ , ๋™์ , ์ผ์‹œ์  ์ฝ˜ํ…์ธ ๋ฅผ ์ถฉ์‹คํ•˜๊ฒŒ ๋ชจ๋ธ๋งํ•  ์ˆ˜ ์žˆ๋‹ค.

์ €์ž๋“ค์€ ๋ชจ๋ธ์˜ ์ปดํŒฉํŠธํ•จ์„ ๊ฐ•ํ™”ํ•˜๊ณ  ์‹œ๊ฐ„์— ๋”ฐ๋ผ ๋ณ€ํ•˜๋Š” ์™ธํ˜•์„ ๊ณ ๋ คํ•˜๊ธฐ ์œ„ํ•ด splatted feature rendering์„ ์ œ์•ˆํ•˜์˜€๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ ๊ฐ Spacetime Gaussian์— ๋Œ€ํ•ด spherical harmonics (SH) ๊ณ„์ˆ˜๋ฅผ ์ €์žฅํ•˜๋Š” ๋Œ€์‹  base color, ๋ทฐ ๊ด€๋ จ ์ •๋ณด, ์‹œ๊ฐ„ ๊ด€๋ จ ์ •๋ณด๋ฅผ ์ธ์ฝ”๋”ฉํ•˜๋Š” feature๋ฅผ ์ €์žฅํ•œ๋‹ค. ์ด๋Ÿฌํ•œ feature๋Š” ๋ฏธ๋ถ„ ๊ฐ€๋Šฅํ•œ ์Šคํ”Œ๋ž˜ํŒ…์„ ํ†ตํ•ด ์ด๋ฏธ์ง€ ๊ณต๊ฐ„์œผ๋กœ rasterize๋˜๊ณ  ์ž‘์€ MLP ๋„คํŠธ์›Œํฌ๋ฅผ ๊ฑฐ์ณ ์ตœ์ข… ์ƒ‰์ƒ์„ ์ƒ์„ฑํ•œ๋‹ค. SH์— ๋น„ํ•ด ํฌ๊ธฐ๋Š” ์ž‘์ง€๋งŒ ๊ฐ•๋ ฅํ•œ ํ‘œํ˜„๋ ฅ์„ ๋ฐœํœ˜ํ•œ๋‹ค.

๋˜ํ•œ ๋ณต์žกํ•œ ์žฅ๋ฉด์˜ ๋ Œ๋”๋ง ํ’ˆ์งˆ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด Gaussian์˜ guided sampling์„ ๋„์ž…ํ•˜์˜€๋‹ค. Initialization ์‹œ Gaussian์œผ๋กœ ๋“œ๋ฌผ๊ฒŒ ๋ฎํžŒ ๋จผ ์˜์—ญ์€ ๋ Œ๋”๋ง ๊ฒฐ๊ณผ๊ฐ€ ํ๋ฆฟํ•ด์ง€๋Š” ๊ฒฝํ–ฅ์ด ์žˆ๋‹ค. ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ํ•™์Šต ์˜ค์ฐจ์™€ ๋Œ€๋žต์ ์ธ ๊นŠ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ 4D ์žฅ๋ฉด์—์„œ ์ƒˆ๋กœ์šด Gaussian์„ ์ƒ˜ํ”Œ๋งํ•œ๋‹ค.

์ด ๋…ผ๋ฌธ์ด ๊ฐ€์ง€๋Š” contribution ์ค‘ ๊ฐ€์žฅ ๋ฉ”์ธ์ด ๋˜๋Š” ๋ถ€๋ถ„์„ ์ •๋ฆฌํ•ด๋ณด๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

  • splatted feature rendering์„ ์ œ์•ˆ: ๊ฐ Spacetime Gaussian์— ๋Œ€ํ•ด spherical harmonics (SH) ๊ณ„์ˆ˜๋ฅผ ์ €์žฅํ•˜๋Š” ๋Œ€์‹  base color, ๋ทฐ ๊ด€๋ จ ์ •๋ณด, ์‹œ๊ฐ„ ๊ด€๋ จ ์ •๋ณด๋ฅผ ์ธ์ฝ”๋”ฉํ•˜๋Š” feature๋ฅผ ์ €์žฅํ•œ๋‹ค. SH์— ๋น„ํ•ด ํฌ๊ธฐ๋Š” ์ž‘์ง€๋งŒ ๊ฐ•๋ ฅํ•œ ํ‘œํ˜„๋ ฅ์„ ๋ฐœํœ˜ํ•œ๋‹ค.
  • Gaussian์˜ guided sampling์„ ๋„์ž…: ๊ฑฐ๋ฆฌ๊ฐ€ ๋จผ ์˜์—ญ์€ Gaussian์ด Sparseํ•˜๊ธฐ์— ํ•™์Šต ์˜ค์ฐจ์™€ ๋Œ€๋žต์ ์ธ ๊นŠ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ 4D ์žฅ๋ฉด์—์„œ ์ƒˆ๋กœ์šด Gaussian์„ ์ƒ˜ํ”Œ๋งํ•œ๋‹ค.

Method

1. Spacetime Gaussians

๋ณธ ๋…ผ๋ฌธ์€ 4D ๋™์—ญํ•™์„ ํ‘œํ˜„ํ•˜๊ธฐ ์œ„ํ•ด 3D Gaussian๊ณผ ์‹œ๊ฐ„ ์„ฑ๋ถ„์„ ๊ฒฐํ•ฉํ•˜์—ฌ ๋‚˜ํƒ€๋‚˜๊ณ  ์‚ฌ๋ผ์ง€๋Š” ์ฝ˜ํ…์ธ ์™€ ๋ชจ์…˜/๋ณ€ํ˜•์„ ๋ชจ๋ธ๋งํ•˜๋Š” Spacetime Gaussians (STG)๋ฅผ ์ œ์•ˆํ•˜์˜€๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์‹œ๊ฐ„์  ๋ถˆํˆฌ๋ช…๋„๋ฅผ ์ธ์ฝ”๋”ฉํ•˜๊ธฐ ์œ„ํ•ด temporal radial basis function๋ฅผ ๋„์ž…ํ•˜์˜€๋‹ค. ์ด๋Š” ๋‚˜ํƒ€๋‚˜๊ฑฐ๋‚˜ ์‚ฌ๋ผ์ง€๋Š” ์žฅ๋ฉด ์ฝ˜ํ…์ธ ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ๋ชจ๋ธ๋งํ•  ์ˆ˜ ์žˆ๋‹ค. ํ•œํŽธ, ์‹œ๊ฐ„์„ ์กฐ๊ฑด์œผ๋กœ ํ•˜๋Š” 3D Gaussian์˜ ์œ„์น˜์™€ ํšŒ์ „์— ๋Œ€ํ•œ ํŒŒ๋ผ๋ฉ”ํŠธ๋ฆญ ํ•จ์ˆ˜๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์žฅ๋ฉด์˜ ๋ชจ์…˜๊ณผ ๋ณ€ํ˜•์„ ๋ชจ๋ธ๋งํ•œ๋‹ค. ์‹œ๊ณต๊ฐ„ ์ง€์  ์—์„œ์˜ STG์˜ ๋ถˆํˆฌ๋ช…๋„๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

์—ฌ๊ธฐ์„œ ๋Š” ์‹œ๊ฐ„์  ๋ถˆํˆฌ๋ช…๋„์ด๊ณ , ์™€ ๋Š” ์‹œ๊ฐ„์— ์˜์กดํ•˜๋Š” ์œ„์น˜ ๋ฐ ๊ณต๋ถ„์‚ฐ์ด๋‹ค. i๋Š” i๋ฒˆ์งธ STG๋ฅผ ๋œปํ•œ๋‹ค.

Temporal Radial Basis Function. ์‹œ๊ฐ„ t์—์„œ STG์˜ ์‹œ๊ฐ„ ๋ถˆํˆฌ๋ช…๋„๋ฅผ ๋‚˜ํƒ€๋‚ด๊ธฐ ์œ„ํ•ด temporal radial basis function์„ ์‚ฌ์šฉํ•œ๋‹ค. ์‹œ๊ฐ„์  ๋ถˆํˆฌ๋ช…๋„ ์— ๋Œ€ํ•ด 1D Gaussian์„ ์‚ฌ์šฉํ•œ๋‹ค.

์—ฌ๊ธฐ์„œ temporal center μiτ๋Š” STG๊ฐ€ ๊ฐ€์žฅ ์ž˜ ๋ณด์ด๋Š” ํƒ€์ž„์Šคํƒฌํ”„๋ฅผ ๋‚˜ํƒ€๋‚ด๊ณ , temporal scaling factor siτ๋Š” ์œ ํšจํ•œ ์ง€์† ๊ธฐ๊ฐ„์„ ๊ฒฐ์ •ํ•œ๋‹ค. STG ์ „๋ฐ˜์— ๊ฑธ์ณ ๊ณต๊ฐ„์  ๋ถˆํˆฌ๋ช…๋„ ๋ณ€ํ™”๋ฅผ ํ—ˆ์šฉํ•˜๊ธฐ ์œ„ํ•ด ์‹œ๊ฐ„์— ๋…๋ฆฝ์ ์ธ ๊ณต๊ฐ„์  ๋ถˆํˆฌ๋ช…๋„ ๋ฅผ ํฌํ•จํ•œ๋‹ค.

Polynomial Motion Trajectory. ๊ฐ STG์— ๋Œ€ํ•ด ๋‹คํ•ญ ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ์…˜์„ ๋ชจ๋ธ๋งํ•œ๋‹ค.

๋‹คํ•ญ์‹ ๊ณ„์ˆ˜ bi,k∈R์€ ํ•™์Šต ์ค‘์— ์ตœ์ ํ™”๋œ๋‹ค.

Polynomial Rotation. ๋ชจ์…˜ ๊ถค์ ๊ณผ ์œ ์‚ฌํ•˜๊ฒŒ rotation matrix Ri์˜ ์ฟผํ„ฐ๋‹ˆ์–ธ์„ ํ‘œํ˜„ํ•˜๊ธฐ ์œ„ํ•ด ๋‹คํ•ญ ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค.

Scaling matrix ๋Š” ์‹œ๊ฐ„์— ๋…๋ฆฝ์ ์œผ๋กœ ๋‘”๋‹ค.

2. Splatted Feature Rendering

๋ทฐ์™€ ์‹œ๊ฐ„์— ๋”ฐ๋ฅธ radiance๋ฅผ ์ •ํ™•ํ•˜๊ณ  ๊ฐ„๊ฒฐํ•˜๊ฒŒ ์ธ์ฝ”๋”ฉํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ STG์— spherical harmonics (SH) ๊ณ„์ˆ˜ ๋Œ€์‹  feature๋ฅผ ์ €์žฅํ•œ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ ๊ฐ STG์˜ feature ๋Š” ์„ธ ๋ถ€๋ถ„์œผ๋กœ ๊ตฌ์„ฑ๋œ๋‹ค.

๋Š” RGB base color๋ฅผ ํฌํ•จํ•˜๊ณ , ๋Š” ๋ทฐ ๋ฐฉํ–ฅ๊ณผ ์‹œ๊ฐ„์— ๊ด€๋ จ๋œ ์ •๋ณด๋ฅผ ์ธ์ฝ”๋”ฉํ•œ๋‹ค.

Feature splatting ํ”„๋กœ์„ธ์Šค๋Š” RGB ์ƒ‰์ƒ์ด feature ๋กœ ๋Œ€์ฒด๋œ๋‹ค๋Š” ์ ์„ ์ œ์™ธํ•˜๋ฉด Gaussian Splatting๊ณผ ์œ ์‚ฌํ•˜๋‹ค. ์ด๋ฏธ์ง€ ๊ณต๊ฐ„์œผ๋กœ splattingํ•œ ํ›„ ๊ฐ ํ”ฝ์…€์˜ splatting๋œ feature๋ฅผ , , ๋กœ ๋ถ„ํ• ํ•œ๋‹ค. ๊ฐ ํ”ฝ์…€์˜ ์ตœ์ข… RGB ์ƒ‰์ƒ์€ 2-layer MLP ๋ฅผ ๊ฑฐ์นœ ํ›„ ์–ป์–ด์ง„๋‹ค.

์—ฌ๊ธฐ์„œ r์€ ๋ทฐ ๋ฐฉํ–ฅ์ด๋ฉฐ, feature๋“ค๊ณผ concatenate๋˜์–ด Φ์— ์ž…๋ ฅ๋œ๋‹ค.

SH ์ธ์ฝ”๋”ฉ๊ณผ ๋น„๊ตํ•˜์—ฌ feature ๊ธฐ๋ฐ˜ ์ ‘๊ทผ ๋ฐฉ์‹์€ ๊ฐ STG์— ๋Œ€ํ•ด ๋” ์ ์€ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ํ•„์š”๋กœ ํ•œ๋‹ค. ๋™์‹œ์— MLP ๋„คํŠธ์›Œํฌ Φ๋Š” ์–•๊ณ  ์ข๊ธฐ ๋•Œ๋ฌธ์— ์—ฌ์ „ํžˆ โ€‹โ€‹๋ Œ๋”๋ง ์†๋„๊ฐ€ ๋น ๋ฅด๋‹ค.

๋ Œ๋”๋ง ์†๋„๋ฅผ ์ตœ๋Œ€ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ์„ ํƒ์ ์œผ๋กœ Φ๋ฅผ ์‚ญ์ œํ•˜๊ณ  ํ•™์Šต ๋ฐ ๋ Œ๋”๋ง ์ค‘์— Fbase๋งŒ ์œ ์ง€ํ•  ์ˆ˜๋„ ์žˆ๋‹ค. ์ด ๊ตฌ์„ฑ์„ ๋ผ์ดํŠธ ๋ฒ„์ „์ด๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค.

3. Optimization

MLP ์™€ ๊ฐ STG์˜ ํŒŒ๋ผ๋ฏธํ„ฐ ๊ฐ€ ์ตœ์ ํ™”๋œ๋‹ค.

3DGS์™€ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ๋ฏธ๋ถ„ ๊ฐ€๋Šฅํ•œ ์Šคํ”Œ๋ž˜ํŒ…๊ณผ ๊ธฐ์šธ๊ธฐ ๊ธฐ๋ฐ˜ ์—ญ์ „ํŒŒ๋ฅผ ํ†ตํ•ด ์ด๋Ÿฌํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ตœ์ ํ™”ํ•˜๊ณ  ์ค‘๊ฐ„์— density control์„ ์ง„ํ–‰ํ•œ๋‹ค. ๋ Œ๋”๋ง๋œ ์ด๋ฏธ์ง€๋ฅผ GT ์ด๋ฏธ์ง€์™€ ๋น„๊ตํ•˜๋Š” ๋ Œ๋”๋ง loss๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค. ๋ Œ๋”๋ง loss๋Š” L1 ํ•ญ๊ณผ D-SSIM ํ•ญ์œผ๋กœ ๊ตฌ์„ฑ๋œ๋‹ค.

4. Guided Sampling of Gaussians


์ €์ž๋“ค์€ initialization ์‹œ Gaussian์ด ํฌ๋ฐ•ํ•œ ์˜์—ญ์˜ ๋ Œ๋”๋ง ํ’ˆ์งˆ์ด ๋†’๊ฒŒ ์ˆ˜๋ ด๋˜๊ธฐ ์–ด๋ ต๋‹ค๋Š” ๊ฒƒ์„ ๊ด€์ฐฐํ–ˆ๋‹ค. ํŠนํžˆ ์ด๋Ÿฌํ•œ ์˜์—ญ์ด ์นด๋ฉ”๋ผ์—์„œ ๋ฉ€๋ฆฌ ๋–จ์–ด์ ธ ์žˆ๋Š” ๊ฒฝ์šฐ ๋”์šฑ ๊ทธ๋ ‡๋‹ค. ๋”ฐ๋ผ์„œ ํ•™์Šต ์˜ค์ฐจ์™€ coarseํ•œ ๊นŠ์ด๋ฅผ guidance๋กœ ์ƒˆ๋กœ์šด Gaussian์„ ์ƒ˜ํ”Œ๋งํ•˜๋Š” ์ „๋žต์„ ์ถ”๊ฐ€๋กœ ๋„์ž…ํ•˜์˜€๋‹ค.

ํ•™์Šต ์ค‘ ์˜ค์ฐจ๊ฐ€ ํฐ ํ”ฝ์…€์˜ ๊ด‘์„ ์„ ๋”ฐ๋ผ ์ƒˆ๋กœ์šด Gaussian๋“ค์„ ์ƒ˜ํ”Œ๋งํ•œ๋‹ค. ์ƒ˜ํ”Œ๋ง ํšจ์œจ์„ฑ์„ ๋ณด์žฅํ•˜๊ธฐ ์œ„ํ•ด loss๊ฐ€ ์•ˆ์ •๋œ ํ›„์— ์ƒ˜ํ”Œ๋ง์„ ์ˆ˜ํ–‰ํ•œ๋‹ค. ์˜ค์ฐจ ๋งต์€ ํ•™์Šต ์ค‘์— ๋…ธ์ด์ฆˆ๊ฐ€ ์žˆ์„ ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ patch-wise๋กœ ํ•™์Šต ์˜ค์ฐจ๋ฅผ ์ง‘๊ณ„ํ•˜์—ฌ ์ƒ๋‹นํ•œ ์˜ค์ฐจ๊ฐ€ ์žˆ๋Š” ์˜์—ญ์— ์šฐ์„ ์ˆœ์œ„๋ฅผ ๋‘”๋‹ค. ๊ทธ๋Ÿฐ ๋‹ค์Œ ํฐ ์˜ค์ฐจ๊ฐ€ ์žˆ๋Š” ๊ฐ ํŒจ์น˜์˜ ์ค‘์•™ ํ”ฝ์…€์—์„œ ๊ด‘์„ ์„ ์ƒ˜ํ”Œ๋งํ•œ๋‹ค. ์ง€๋‚˜์น˜๊ฒŒ ํฐ ๊นŠ์ด ๋ฒ”์œ„์—์„œ ์ƒ˜ํ”Œ๋ง์„ ํ”ผํ•˜๊ธฐ ์œ„ํ•ด Gaussian ์ค‘์‹ฌ์˜ coarseํ•œ depth map์„ ํ™œ์šฉํ•˜์—ฌ ๋ณด๋‹ค ๊ตฌ์ฒด์ ์ธ ๊นŠ์ด ๋ฒ”์œ„๋ฅผ ๊ฒฐ์ •ํ•œ๋‹ค. Depth map์€ feature splatting ์ค‘์— ์ƒ์„ฑ๋˜๋ฉฐ ๊ณ„์‚ฐ ์˜ค๋ฒ„ํ—ค๋“œ๊ฐ€ ๊ฑฐ์˜ ๋ฐœ์ƒํ•˜์ง€ ์•Š๋Š”๋‹ค. ๊ทธ๋Ÿฐ ๋‹ค์Œ ์ƒˆ๋กœ์šด Gaussian๋“ค์€ ๊ด‘์„ ์„ ๋”ฐ๋ผ ๊นŠ์ด ๋ฒ”์œ„ ๋‚ด์—์„œ ๊ท ์ผํ•˜๊ฒŒ ์ƒ˜ํ”Œ๋ง๋œ๋‹ค. ์ƒˆ๋กœ ์ƒ˜ํ”Œ๋ง๋œ Gaussian๋“ค์˜ ์ค‘์‹ฌ์— ์ž‘์€ ๋…ธ์ด์ฆˆ๋ฅผ ์ถ”๊ฐ€ํ•œ๋‹ค. ์ƒ˜ํ”Œ๋ง๋œ Gaussian๋“ค ์ค‘์—์„œ ๋ถˆํ•„์š”ํ•œ ๊ฒƒ๋“ค์€ ํ•™์Šต ์ค‘์— ๋ถˆํˆฌ๋ช…๋„๊ฐ€ ๋‚ฎ์•„์ ธ ์ œ๊ฑฐ๋œ๋‹ค. ์ƒ˜ํ”Œ๋ง ํ”„๋กœ์„ธ์Šค๋Š” 3ํšŒ ์ดํ•˜๋กœ๋งŒ ์ˆ˜ํ–‰ํ•˜๋ฉด ๋œ๋‹ค.

์ œ์•ˆ๋œ guided sampling ์ „๋žต์€ 3DGS์˜ density control์„ ๋ณด์™„ํ•œ๋‹ค. Density control์€ ๊ธฐ์กด Gaussian๋“ค ๊ทผ์ฒ˜์—์„œ ์ ์ง„์ ์œผ๋กœ Gaussian์„ ์ฆ๊ฐ€์‹œํ‚ค๋Š” ๋ฐ˜๋ฉด, ์ œ์•ˆ๋œ ์ ‘๊ทผ ๋ฐฉ์‹์€ Gaussian์ด ํฌ๋ฐ•ํ•˜๊ฑฐ๋‚˜ ์—†๋Š” ์˜์—ญ์—์„œ ์ƒˆ๋กœ์šด Gaussian์„ ์ƒ˜ํ”Œ๋งํ•  ์ˆ˜ ์žˆ๋‹ค.

Experiments

Implement Details

  • , 
  • optimizer: Adam
  • ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ๋ชจ๋“  ํƒ€์ž„์Šคํƒฌํ”„์˜ SfM ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ STG๋ฅผ ์ดˆ๊ธฐํ™”
  • Density control์˜ ๊ฒฝ์šฐ 3DGS๋ณด๋‹ค ๋” ๊ณต๊ฒฉ์ ์ธ pruning์„ ์ˆ˜ํ–‰ํ•˜์—ฌ Gaussian ์ˆ˜๋ฅผ ์ค„์ด๊ณ  ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์ž‘๊ฒŒ ์œ ์ง€
  • 50 ํ”„๋ ˆ์ž„ ์‹œํ€€์Šค๋ฅผ ํ•™์Šต์‹œํ‚ค๋Š” ๋ฐ NVIDIA A6000 GPU 1๊ฐœ์—์„œ 40 ~ 60๋ถ„ ์†Œ์š”

1. Neural 3D Video Dataset

2. Google Immersive Dataset

3. Technicolor Dataset

4. Ablation Study

๋‹ค์Œ์€ ๊ตฌ์„ฑ ์š”์†Œ์— ๋Œ€ํ•œ ablation ๊ฒฐ๊ณผ์ด๋‹ค.


๋‹ค์Œ์€ SfM ํฌ์ธํŠธ ํด๋ผ์šฐ๋“œ๊ฐ€ initialization์— ์‚ฌ์šฉ๋˜๋Š” ํ”„๋ ˆ์ž„ ์ˆ˜์— ๋Œ€ํ•œ ablation ๊ฒฐ๊ณผ์ด๋‹ค.

๋ฐ˜์‘ํ˜•