1. Scroll
  2. /
  3. Technologia
  4. /
  5. GauGAN2, czyli zamień słowa w zdjęcie! Czym jest GauGAN2?

Technologia

23.11.2021 13:51

GauGAN2, czyli zamień słowa w zdjęcie! Czym jest GauGAN2?

Newsy
8
0
0
8
0

GauGAN2 – pod tą jakże urokliwą nazwą, kryje się potężna sztuczna inteligencja od Nvidii, która jest w stanie dokonać nader zaskakujących rzeczy. Jak zmienić zdanie składające się z kilku słów w zdjęcie? I to na dodatek w czasie rzeczywistym?

Algorytm opracowany przez inżynierów Zielonych pokazuje, że tego typu rzeczy są jak najbardziej możliwe. GauGAN2 jest w stanie wygenerować od ręki obraz, opierając się jedynie na zdaniu, składającym się z trzech lub czterech słów. Jak udało się tego dokonać?

Jak działa GauGAN2?

Druga odsłona SI od Nvidii jest rozwinięciem poprzednich prac, których finałem był algorytm zdolny do przemiany bazgrołów w fotorealistyczne dzieła, wywołujące opad szczęk. GauGAN stał się podłożem dla apki znanej pod nazwą Nvidia Canvas, oferującej to samo, choć rzecz jasna w przystępniejszej formie. Co jednak ważniejsze, pierwsza odsłona algorytmu stała się podstawą i punktem wyjścia do stworzenia technologii, która jeszcze bardziej zaskakuje.

GauGAN2 to najnowsze dzieło inżynierów Nvidii, które pozwoli stworzyć obraz bez potrzeby posiadania pędzla czy flamastra. Jak zaznaczyliśmy wcześniej: wszystko rozbija się o wpisanie odpowiedniego zdania, reszta pracy leży po stronie algorytmu.

Jak to działa? Ważną rolę pełni tu generatywna sieć przeciwstawna (GAN), algorytm który przyspiesza w znacznym stopniu proces uczenia maszynowego oraz zmniejsza udział człowieka w poprawnym instruowaniu maszyny. Nvidia chwali się przy tym, że druga odsłona GauGANa, jest pierwszą, która łączy w sobie wiele różnych modalności w jednej sieci GAN.

Składa się na to m. in. mapowanie segmentacji, generowanie tekstu do obrazu czy algorytm zamalowujący. Wszystko to połączone razem i wzajemnie ze sobą współpracujące, pozwala generować ultra realistyczne obrazy ze słów. Producent zaznacza także, że GauGAN2 jest obecnie najbardziej zaawansowanym narzędziem tego typu, pozwalając na większą różnorodność obrazów i znacznie lepszą jakość.

Sprawdź też: Nowe karty graficzne – odpowiedź Nvidii na wysokie zapotrzebowanie na rynku

GauGAN2 to duże osiągnięcie Nvidii

Jak donosi oficjalny blog Zielonych, sztuczna inteligencja, która stoi za modelem GauGAN2 była “trenowana” na 10 milionach zdjęć wysokiej jakości. Prace związane z przyuczeniem sieci neuronowej odbywały się na superkomputerze Selene. Selene posiada moc obliczeniową ponad 63 petaflopów, co na chwilę obecną czyni go szóstym najszybszym komputerem na świecie.

To jeden z obrazów wygenerowanych przez sztuczną inteligencję GauGAN2 | Źródło: nvidia.com

Przyuczanie polegało na prezentowaniu konkretnych zdjęć, które przedstawiały wybrane krajobrazy a następnie łączeniu ich z odpowiadającymi im słowami jak np “niebo”, “tęcza” i “deszcz”.

Choć narzędzie jest obecnie w wersji demo, to już teraz pokazuje jak ogromne możliwości posiada. Może być niezwykłym ułatwieniem i przyspieszeniem prac np. dla artystów, pozwalając im generować obrazy tła dla swoich dzieł, praktycznie od ręki.

Jeśli samemu chciałbyś pobawić się pierwszą odsłoną SI GauGAN – nic nie stoi na przeszkodzie aby ściągnąć ze strony producenta Nvidia Canvas. Jedyny haczyk tkwi w tym, że musisz posiadać kartę graficzną z serii RTX.

Źródło: blogs.nvidia.com

8
0

Podziel się:

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.