DragGAN: Sürükle ve bırak yoluyla AI destekli fotogerçekçi görüntü işleme

Adanali

New member
Tıklayın, sürükleyin, bırakın, bitti, görüntü düzenleme bu kadar kolay olabilir. Max Planck Bilgisayar Bilimleri Enstitüsü, Saarbrücken Görsel Hesaplama, Etkileşim ve Yapay Zeka Araştırma Merkezi (VIA), MIT CSAIL ve Pennsylvania Üniversitesi’nden araştırmacılar, yüz, poz, perspektif ifadelerinin kullanıldığı yapay zeka destekli bir görüntü işleme yöntemi sundular. ve fotoğraflardaki diğer özellikler, sürükle ve bırak yöntemiyle esnek bir şekilde kontrol edilebilir. Daha önce Photoshop ve diğer programlarda fotogerçekçi içeriği düzenlemek büyük beceri gerektirirken, DragGAN ile örneğin bir gülümseme yapmak, duruşu ayarlamak, kıyafetleri esnetmek veya her tur için perspektif gibi bir fotoğrafta başlangıç ve bitiş noktalarını işaretlemeniz yeterlidir. GAN, işaretlenen noktaları takip eder ve görüntü içeriği insanlar, hayvanlar, manzaralar veya araçlar gibi önceden eğitilmiş kategorilerle eşleştiği sürece istenen değişikliklerle eşleşen görüntüler üretir.







GAN’ın manipüle edebileceği görüntü bölgelerini tanımlamak için DragGAN’da maskeleme kullanılabilir. Örnekte bu, köpeğin yalnızca başını çevirmesini ve görüntünün tüm perspektifini ayarlamamasını sağlar.


(Resim: Bilgi İşlem için MPI)



Photoshop & Co.’nun geleceği?


Bilim adamları yayınlarında, “Bu manipülasyonlar, bir GAN’ın öğrenilmiş üretken görüntüleri üzerinde gerçekleştirildiğinden, halüsinasyonla gizlenmiş içerik ve nesnenin sertliğini sürekli takip eden deforme şekiller gibi zor senaryolarda bile gerçekçi sonuçlara yol açıyorlar” diye yazıyorlar. İlgili tarafların örneğin arXiv’den indirebilecekleri Ağustos ayında SIGGRAPH23 grafiklerinin bilgisayar fuarı. DragGAN’ın gerçekte ne kadar iyi çalıştığı henüz kendiniz test edilemez, ancak Max Planck Bilgisayar Bilimleri Enstitüsü’nün DragGAN web sitesinden yalnızca örnek videoları izleyebilirsiniz:


Önerilen editoryal içerik



İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.



Her zaman video yükle

videoyu şimdi yükle



DragGAN ile hayvan pozları gerçekçi bir şekilde ayarlanabilir.



(Kaynak: IT için MPI)




Önerilen editoryal içerik



İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.



Her zaman video yükle

videoyu şimdi yükle



Giysilerin uzunluğu da DragGAN ile fotogerçekçi olarak manipüle edilebilmelidir.



(Kaynak: IT için MPI)




Önerilen editoryal içerik



İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.



Her zaman video yükle

videoyu şimdi yükle



Yüz ifadeleri, saç ve dönüş de ayarlanabilirken DragGAN, GAN’ın görüntünün yalnızca belirli kısımlarını dikkate alması için maskelemeyi destekler.



(Kaynak: IT için MPI)




Daha önce basit olan GitHub proje sayfasında yapılan bir duyuruya göre baş yazar Xingang Pan, DragGAN’ın kaynak kodunu Haziran ayında yayınlamayı planladığını duyurdu. Diğer birçok proje gibi, DragGAN da PyTorch makine öğrenimi için optimize edilmiş Python kitaplığını kullanır. Şimdiye kadar, donanım gereksinimleri hakkında hiçbir şey bilinmiyor. Yazarlar basitçe şöyle yazıyor: “Yaklaşımımızın verimliliği sayesinde, kullanıcıların yalnızca birkaç saniye beklemesi gerekiyor ve tatmin olana kadar düzenlemeye devam edebiliyorlar.” DragGAN henüz emekleme aşamasındadır, bu nedenle sonuçların kalitesi, bir miktar tahmin etme becerisine rağmen şu anda eğitim verilerinin çeşitliliğinden etkilenmektedir.




Ağzı açık ve bükülmüş bir araba lastiği olan bir aslan



Kural olarak, DragGAN gerçekçi sonuçlar sağlamayı amaçlar, ancak diğer içerikleri de halüsinasyona uğratabilir.


(Resim: Bilgi İşlem için MPI)




(gider)



Haberin Sonu
 
Üst