간단한 드래그만으로 이미지를 조작하는 기술 dragGAN 논문

출처 : https://t.me/thesedays_ai/208

영상 속 간단한 조작만으로 이미지 형태를 자유자재로 조절하는 것은 매우 인상적입니다.

dragGAN에 대한 간단한 설명과 원리에 대해 소개드립니다.

- 먼저, GAN은 두 개의 신경망인 "생성자"와 "감별자"가 경쟁하며 학습하는 머신러닝 모델

- 생성자: 가짜 데이터를 생성(목표는 가짜 데이터를 진짜처럼 보이게 만드는 것)

-감별자: 진짜 데이터와 가짜 데이터를 입력받아 이를 판별(목표는 진짜 데이터와 가짜 데이터를 정확하게 분류하는 것)

- 두 신경망은 적대적인 관계에 있음. 즉, 생성자는 감별자를 속이려 노력하고, 감별자는 생성자가 만든 가짜 데이터를 판별하려 노력. 학습이 진행됨에 따라 생성자는 실제 데이터를 잘 모방한 가짜 데이터를 생성하게 되고 감별자는 가짜와 진짜를 더욱 정확하게 구분하게 됨

- 이런 과정을 반복하면서 두 네트워크는 서로를 '경쟁'하면서 발전하게 됨. 이렇게 GAN을 통해 생성된 데이터는 실제 데이터와 구별하기 어렵게 만들어짐.

- dragGAN은 위에서 설명한 GAN(Generative Adversarial Network)이라는 딥러닝 기술을 이용하여 이미지를 변형하는 방법. GAN은 실제와 비슷한 가짜 이미지를 만들어내는 기술로, 학습 데이터셋으로부터 실제 이미지와 비슷한 분포를 가진 가짜 이미지를 생성

- dragGAN은 사용자가 지정한 포인트들의 위치 정보를 GAN 모델에 입력. 그러면 GAN 모델은 입력된 위치 정보에 따라 새로운 이미지를 생성(이때 생성된 이미지는 실제와 비슷한 분포를 가진 가짜 이미지)

- 그리고 dragGAN은 생성된 가짜 이미지와 사용자가 지정한 포인트의 위치 정보를 다시 입력으로 받아들임. 그리고 다시 새로운 이미지를 생성하는 과정을 반복(이렇게 반복하면 사용자가 원하는 이미지로 변형될 때까지 이미지를 조작할 수 있음)

-논문에 대한 자세한 내용은 아래 링크를 통해 확인하실 수 있습니다.

https://huggingface.co/papers/2305.10973