जनरेटिव प्रतिकूल नेटवर्क

जनरेटिव प्रतिकूल नेटवर्क (GAN) यंत्र अधिगम फ्रेमवर्क का वर्ग है और जेनेरेटिव AI के लिए प्रमुख फ्रेमवर्क है।^[1]^[2] अवधारणा को प्रारंभ में जून 2014 में इयान गुडफेलो और उनके सहयोगियों द्वारा विकसित किया गया था।^[3] जीएएन में, दो तंत्रिका नेटवर्क शून्य-राशि के खेल के रूप में एक दूसरे के साथ प्रतिस्पर्धा करते हैं, जहां एजेंट का लाभ दूसरे एजेंट का हानि होता है।

प्रशिक्षण सेट को देखते हुए, यह तकनीक प्रशिक्षण सेट के समान आँकड़ों के साथ नया डेटा उत्पन्न करना सीखती है। उदाहरण के लिए, चित्रों पर प्रशिक्षित जीएएन नई चित्र उत्पन्न कर सकता है जो मानव पर्यवेक्षकों के लिए कम से कम सतही रूप से प्रामाणिक दिखती हैं, जिनमें कई यथार्थवादी विशेषताएँ होती हैं। चूँकि मूल रूप से अप्रशिक्षित शिक्षा के लिए जनरेटिव मॉडल के रूप में प्रस्तावित किया गया था, जीएएन अर्ध-पर्यवेक्षित शिक्षा के लिए भी उपयोगी सिद्ध हुए हैं।^[4]

जीएएन का मुख्य विचार विवेचक के माध्यम से अप्रत्यक्ष प्रशिक्षण पर आधारित है, अन्य तंत्रिका नेटवर्क जो यह बता सकता है कि इनपुट कितना यथार्थवादी लगता है, जिसे स्वयं भी गतिशील रूप से अपडेट किया जा रहा है।

इसका अर्थ है कि जनरेटर को किसी विशिष्ट छवि की दूरी को कम करने के लिए प्रशिक्षित नहीं किया जाता है, बल्कि विवेचक को मूर्ख बनाने के लिए प्रशिक्षित किया जाता है। यह मॉडल को अप्रशिक्षित विधि से सीखने में सक्षम बनाता है।

दोनों नेटवर्क के बीच विकासवादी हथियारों की दौड़ के साथ जीएएन विकासवादी जीव विज्ञान में अनुकरण के समान हैं।

परिभाषा

गणितीय

मूल जीएएन को निम्नलिखित खेल सिद्धांत के रूप में परिभाषित किया गया है:^[3]

प्रत्येक प्रायिकता स्थान $(\Omega ,\mu _{ref})$ जीएएन गेम को परिभाषित करता है।

2 खिलाड़ी हैं: जनरेटर और विवेचक

जनरेटर की रणनीति (गेम सिद्धांत) है ${\mathcal {P}}(\Omega )$ , सभी संभाव्यता उपायों का सेट $\mu _{G}$ पर $\Omega$ है।

विवेचक की रणनीति सेट मार्कोव गुठली का सेट है $\mu _{D}:\Omega \to {\mathcal {P}}[0,1]$ , जहाँ ${\mathcal {P}}[0,1]$ संभाव्यता उपायों का सेट है $[0,1]$ है।

जीएएन गेम शून्य-राशि वाला गेम है, जिसमें ऑब्जेक्टिव फलन होता है।

L(\mu _{G},\mu _{D}):=\mathbb {E} _{x\sim \mu _{ref},y\sim \mu _{D}(x)}[\ln y]+\mathbb {E} _{x\sim \mu _{G},y\sim \mu _{D}(x)}[\ln(1-y)].

जनरेटर का उद्देश्य उद्देश्य को कम करना है, और विवेचक का उद्देश्य उद्देश्य को अधिकतम करना है।

जेनरेटर का काम अप्रोच करना है $\mu _{G}\approx \mu _{ref}$ , अर्थात्, संदर्भ वितरण के साथ जितना संभव हो सके अपने स्वयं के आउटपुट वितरण का मिलान करना। विवेचक का कार्य 1 के समीप मान को आउटपुट करना है जब इनपुट संदर्भ वितरण से प्रतीत होता है, और 0 के समीप मान को आउटपुट करने के लिए जब इनपुट ऐसा लगता है जैसे यह जनरेटर वितरण से आया है।

व्यवहार में

जनरेटिव मॉडल उम्मीदवारों को उत्पन्न करता है जबकि विवेकशील मॉडल उनका मूल्यांकन करता है।^[3] प्रतियोगिता डेटा वितरण के संदर्भ में संचालित होती है। सामान्यतः, जनरेटिव नेटवर्क अव्यक्त स्थान से ब्याज के डेटा वितरण के लिए मैप करना सीखता है, जबकि विवेकशील नेटवर्क जनरेटर द्वारा उत्पादित उम्मीदवारों को सही डेटा वितरण से अलग करता है। जनरेटिव नेटवर्क का प्रशिक्षण उद्देश्य भेदभावपूर्ण नेटवर्क की त्रुटि दर को बढ़ाना है (यानी, नए उम्मीदवारों का उत्पादन करके भेदभाव करने वाले नेटवर्क को मूर्ख बनाना है जो कि भेदभाव करने वाले को लगता है कि संश्लेषित नहीं हैं (वास्तविक डेटा वितरण का भाग हैं)।^[3]^[5]

ज्ञात डेटासेट विवेचक के लिए प्रारंभिक प्रशिक्षण डेटा के रूप में कार्य करता है। प्रशिक्षण में इसे प्रशिक्षण डेटासेट से नमूने के साथ प्रस्तुत करना सम्मिलित है जब तक कि यह स्वीकार्य सटीकता प्राप्त नहीं कर लेता। जनरेटर को इस आधार पर प्रशिक्षित किया जाता है कि क्या वह भेदभाव करने वाले को बेवकूफ बनाने में सफल होता है। सामान्यतः, जनरेटर को यादृच्छिक इनपुट के साथ वरीयता दी जाती है जिसे पूर्वनिर्धारित अव्यक्त स्थान (जैसे बहुभिन्नरूपी सामान्य वितरण) से नमूना लिया जाता है। उसके बाद, जनरेटर द्वारा संश्लेषित उम्मीदवारों का मूल्यांकन विवेचक द्वारा किया जाता है। दोनों नेटवर्क पर स्वतंत्र बैकप्रोपैगेशन प्रक्रियाएं प्रयुक्त की जाती हैं जिससे जनरेटर अच्छे नमूने तैयार कर सके, जबकि विवेचक सिंथेटिक नमूनों को चिह्नित करने में अधिक कुशल हो जाता है।^[6] जब छवि निर्माण के लिए उपयोग किया जाता है, तो जनरेटर सामान्यतः विसंक्रमणीय तंत्रिका नेटवर्क होता है, और विवेचक दृढ़ तंत्रिका नेटवर्क होता है।

अन्य सांख्यिकीय मशीन सीखने के विधियों से संबंध

जीएएन अंतर्निहित जनरेटिव मॉडल हैं,^[7] जिसका अर्थ है कि वे स्पष्ट रूप से संभावना कार्य को मॉडल नहीं करते हैं और न ही प्रवाह-आधारित जनरेटिव मॉडल जैसे विकल्पों के विपरीत किसी दिए गए नमूने के अनुरूप अव्यक्त चर को खोजने के लिए साधन प्रदान करते हैं।

मुख्य प्रकार के गहन जनरेटिव मॉडल जो अधिकतम संभावना अनुमान लगाते हैं^[8]

पूरी तरह से दिखाई देने वाले विश्वास नेटवर्क जैसे कि वेवनेट और पिक्सेलआरएनएन और सामान्य रूप से ऑटोरेग्रेसिव मॉडल की तुलना में, जीएएन नेटवर्क के माध्यम से कई पास के अतिरिक्त एक पास में पूरा नमूना उत्पन्न कर सकते हैं।

बोल्ट्जमान मशीनों और अरैखिक स्वतंत्र घटक विश्लेषण की तुलना में, नेटवर्क द्वारा उपयोग किए जाने वाले फलन के प्रकार पर कोई प्रतिबंध नहीं है।

चूंकि तंत्रिका नेटवर्क सार्वभौमिक सन्निकटन प्रमेय हैं, जीएएन स्पर्शोन्मुख सिद्धांत (सांख्यिकी) हैं। भिन्नात्मक ऑटोएन्कोडर्स सार्वभौमिक सन्निकटन हो सकते हैं, लेकिन यह 2017 तक सिद्ध नहीं हुआ है।^[8]

गणितीय गुण

उपाय-सैद्धांतिक विचार

यह खंड इन विधियों के पीछे कुछ गणितीय सिद्धांत प्रदान करता है।

माप सिद्धांत पर आधारित प्रायिकता अभिगृहीतों में, प्रायिकता स्थान को भी σ-बीजगणित से लैस करने की आवश्यकता होती है। परिणामस्वरूप, जीएएन गेम की अधिक कठोर परिभाषा से निम्नलिखित परिवर्तन होंगे:

प्रत्येक प्रायिकता स्थान $(\Omega ,{\mathcal {B}},\mu _{ref})$ जीएएन गेम को परिभाषित करता है।
जनरेटर की रणनीति सेट है ${\mathcal {P}}(\Omega ,{\mathcal {B}})$ , सभी संभाव्यता उपायों का सेट $\mu _{G}$ माप-स्थान पर $(\Omega ,{\mathcal {B}})$ है।
विवेचक की रणनीति सेट मार्कोव गुठली का सेट है $\mu _{D}:(\Omega ,{\mathcal {B}})\to {\mathcal {P}}([0,1],{\mathcal {B}}([0,1]))$ , जहाँ ${\mathcal {B}}([0,1])$ बोरेल बीजगणित है बोरेल σ-बीजगणित पर $[0,1]$ है।

चूंकि मापनीयता के मुद्दे व्यवहार में कभी उत्पन्न नहीं होते हैं, ये आगे हमारे लिए चिंता का विषय नहीं होंगे।

रणनीति सेट का विकल्प

ऊपर वर्णित जीएएन गेम के सबसे सामान्य संस्करण में, विवेचक के लिए निर्धारित रणनीति में सभी मार्कोव गुठली सम्मिलित हैं $\mu _{D}:\Omega \to {\mathcal {P}}[0,1]$ , और जनरेटर के लिए निर्धारित रणनीति में मनमाने ढंग से संभाव्यता वितरण सम्मिलित हैं $\mu _{G}$ पर $\Omega$ है।

चूँकि, जैसा कि नीचे दिखाया गया है, किसी के खिलाफ इष्टतम भेदभावपूर्ण रणनीति $\mu _{G}$ नियतात्मक है, इसलिए विवेचक की रणनीतियों को नियतात्मक कार्यों तक सीमित करने में व्यापकता का कोई हानि नहीं है $D:\Omega \to [0,1]$ . अधिकांश अनुप्रयोगों में, $D$ गहरा तंत्रिका नेटवर्क कार्य है।

जनरेटर के लिए, जबकि $\mu _{G}$ सैद्धांतिक रूप से कोई भी संगणनीय संभाव्यता वितरण हो सकता है, व्यवहार में, इसे सामान्यतः पुशफॉरवर्ड उपाय के रूप में प्रयुक्त किया जाता है: $\mu _{G}=\mu _{Z}\circ G^{-1}$ . यानी यादृच्छिक चर के साथ प्रारंभ करें $z\sim \mu _{Z}$ , जहाँ $\mu _{Z}$ प्रायिकता बंटन है जिसकी गणना करना सरलहै (जैसे सतत समान वितरण, या सामान्य वितरण), फिर फलन परिभाषित करें $G:\Omega _{Z}\to \Omega$ . फिर वितरण $\mu _{G}$ का वितरण $G(z)$ है।

परिणामस्वरूप, जनरेटर की रणनीति को सामान्यतः बस के रूप में परिभाषित किया जाता है $G$ , जा रहा है $z\sim \mu _{Z}$ अंतर्निहित। इस औपचारिकता में जीएएन खेल का उद्देश्य है।

L(G,D):=\mathbb {E} _{x\sim \mu _{ref}}[\ln D(x)]+\mathbb {E} _{z\sim \mu _{Z}}[\ln(1-D(G(z))].

जनरेटिव रीपैरामेट्रिजेशन

GAN आर्किटेक्चर के दो मुख्य घटक हैं। खेल के रूप में अनुकूलन कास्टिंग कर रहा है $\min _{G}\max _{D}L(G,D)$ , जो सामान्य प्रकार के अनुकूलन से अलग है, प्रपत्र का $\min _{\theta }L(\theta )$ . अन्य का अपघटन है $\mu _{G}$ में $\mu _{Z}\circ G^{-1}$ , जिसे रीपैरामेट्रिजेशन ट्रिक के रूप में समझा जा सकता है।

इसके महत्व को देखने के लिए, जीएएन की तुलना जनरेटिव मॉडल सीखने के पिछले विधियों से करनी चाहिए, जो अधिकतम संभावना अनुमान और संबंधित रणनीतियों में उत्पन्न होने वाली आगमनात्मक संभाव्य संगणना से ग्रस्त थे।^[3]

वहीं, किंगमा और वेलिंग^[9] और रेजेंडे एट अल।^[10] सामान्य स्टोचैस्टिक बैकप्रोपैजेशन विधि में पुनर्मूल्यांकन का ही विचार विकसित किया। इसके पहले अनुप्रयोगों में परिवर्तनशील ऑटोएन्कोडर था।

मूव ऑर्डर और रणनीतिक संतुलन

मूल पेपर में, साथ ही साथ बाद के पेपर में, सामान्यतः यह माना जाता है कि जनरेटर पहले चलता है, और विवेचक दूसरे स्थान पर चलता है, इस प्रकार निम्न मिनीमैक्स गेम देता है:

\min _{\mu _{G}}\max _{\mu _{D}}L(\mu _{G},\mu _{D}):=\mathbb {E} _{x\sim \mu _{ref},y\sim \mu _{D}(x)}[\ln y]+\mathbb {E} _{x\sim \mu _{G},y\sim \mu _{D}(x)}[\ln(1-y)].

यदि जेनरेटर और भेदभाव करने वाला दोनों की रणनीति सेट को सीमित संख्या में रणनीतियों द्वारा फैलाया जाता है, तो मिनिमैक्स प्रमेय द्वारा,

\min _{\mu _{G}}\max _{\mu _{D}}L(\mu _{G},\mu _{D})=\max _{\mu _{D}}\min _{\mu _{G}}L(\mu _{G},\mu _{D})

अर्थात्, स्थानांतरण क्रम कोई मायने नहीं रखता।

चूँकि, चूंकि रणनीति सेट दोनों को सूक्ष्म रूप से फैलाया नहीं गया है, मिनिमैक्स प्रमेय प्रयुक्त नहीं होता है, और संतुलन का विचार साधारण हो जाता है। बुद्धि के लिए, संतुलन की निम्नलिखित विभिन्न अवधारणाएँ हैं:

संतुलन जब जनरेटर पहले चलता है, और विवेचक दूसरे स्थान पर चलता है: ${\hat {\mu }}_{G}\in \arg \min _{\mu _{G}}\max _{\mu _{D}}L(\mu _{G},\mu _{D}),\quad {\hat {\mu }}_{D}\in \arg \max _{\mu _{D}}L({\hat {\mu }}_{G},\mu _{D}),\quad$
संतुलन जब विवेचक पहले चलता है, और जनरेटर दूसरा चलता है: ${\hat {\mu }}_{D}\in \arg \max _{\mu _{D}}\min _{\mu _{G}}L(\mu _{G},\mu _{D}),\quad {\hat {\mu }}_{G}\in \arg \min _{\mu _{G}}L(\mu _{G},{\hat {\mu }}_{D}),$ * नैश संतुलन $({\hat {\mu }}_{D},{\hat {\mu }}_{G})$ , जो साथ चलने के क्रम में स्थिर है: ${\hat {\mu }}_{D}\in \arg \max _{\mu _{D}}L({\hat {\mu }}_{G},\mu _{D}),\quad {\hat {\mu }}_{G}\in \arg \min _{\mu _{G}}L(\mu _{G},{\hat {\mu }}_{D})$

सामान्य खेलों के लिए, इन संतुलनों का सहमत होना, या अस्तित्व में होना भी आवश्यक नहीं है। मूल जीएएन खेल के लिए, ये सभी संतुलन उपस्थित हैं और सभी समान हैं। चूँकि, अधिक सामान्य जीएएन खेलों के लिए, ये आवश्यक रूप से उपस्थित नहीं हैं, या सहमत हैं।^[11]

GAN खेल के लिए मुख्य प्रमेय

मूल GAN पेपर ने निम्नलिखित दो प्रमेयों को सिद्ध किया:^[3]

प्रमेय (इष्टतम भेदभावकर्ता जेन्सेन -शैनन विचलन की गणना करता है) — किसी भी निश्चित जनरेटर रणनीति के लिए $\mu _{G}$ ,इष्टतम उत्तर दें $D^{*}=\arg \max _{D}L(\mu _{G},D)$ , then

{\begin{aligned}D^{*}(x)&={\frac {d\mu _{ref}}{d(\mu _{ref}+\mu _{G})}}\\L(\mu _{G},D^{*})&=2D_{JS}(\mu _{ref};\mu _{G})-2\ln 2\end{aligned}}

where the derivative is the Radon–Nikodym derivative, and $D_{JS}$ is the Jensen–Shannon divergence.

Proof

By Jensen's inequality,

\mathbb {E} _{x\sim \mu _{ref},y\sim \mu _{D}(x)}[\ln y]\leq \mathbb {E} _{x\sim \mu _{ref}}[\ln \mathbb {E} _{y\sim \mu _{D}(x)}[y]]

and similarly for the other term. Therefore, the optimal reply can be deterministic, i.e.

\mu _{D}(x)=\delta _{D(x)}

for some function

D:\Omega \to [0,1]

, in which case

L(\mu _{G},\mu _{D}):=\mathbb {E} _{x\sim \mu _{ref}}[\ln D(x)]+\mathbb {E} _{x\sim \mu _{G}}[\ln(1-D(x))].

To define suitable density functions, we define a base measure $\mu :=\mu _{ref}+\mu _{G}$ , which allows us to take the Radon–Nikodym derivatives

\rho _{ref}={\frac {d\mu _{ref}}{d\mu }}\quad \rho _{G}={\frac {d\mu _{G}}{d\mu }}

with

\rho _{ref}+\rho _{G}=1

.

We then have

L(\mu _{G},\mu _{D}):=\int \mu (dx)\left[\rho _{ref}(x)\ln(D(x))+\rho _{G}(x)\ln(1-D(x))\right].

The integrand is just the negative cross-entropy between two Bernoulli random variables with parameters $\rho _{ref}(x)$ and $D(x)$ . We can write this as $-H(\rho _{ref}(x))-D_{KL}(\rho _{ref}(x)\|D(x))$ , where $H$ is the binary entropy function, so

L(\mu _{G},\mu _{D})=-\int \mu (dx)(H(\rho _{ref}(x))+D_{KL}(\rho _{ref}(x)\|D(x))).

This means that the optimal strategy for the discriminator is $D(x)=\rho _{ref}(x)$ , with

L(\mu _{G},\mu _{D}^{*})=-\int \mu (dx)H(\rho _{ref}(x))=D_{JS}(\mu _{ref}\|\mu _{G})-2\ln 2

after routine calculation.

व्याख्या: किसी निश्चित जनरेटर रणनीति के लिए $\mu _{G}$ , इष्टतम विवेचक संदर्भ वितरण और जनरेटर वितरण के बीच संभावना अनुपात का ट्रैक रखता है:

{\frac {D(x)}{1-D(x)}}={\frac {d\mu _{ref}}{d\mu _{G}}}(x)={\frac {\mu _{ref}(dx)}{\mu _{G}(dx)}};\quad D(x)=\sigma (\ln \mu _{ref}(dx)-\ln \mu _{G}(dx))

जहा

\sigma

रसद फलन है।

विशेष रूप से, यदि किसी छवि के लिए पूर्व संभाव्यता $x$ संदर्भ वितरण से आने के बराबर है ${\frac {1}{2}}$ , तब $D(x)$ बस पश्च संभाव्यता है कि $x$ संदर्भ वितरण से आया:

D(x)=Pr(x{\text{ came from reference distribution}}|x).

Theorem (the unique equilibrium point) — किसी भी GAN खेल के लिए, एक जोड़ी उपस्थित है $({\hat {\mu }}_{D},{\hat {\mu }}_{G})$ यह एक अनुक्रमिक संतुलन और एक नैश संतुलन दोनों है:

${\begin{aligned}L({\hat {\mu }}_{G},{\hat {\mu }}_{D})=\min _{\mu _{G}}\max _{\mu _{D}}L(\mu _{G},\mu _{D})=&\max _{\mu _{D}}\min _{\mu _{G}}L(\mu _{G},\mu _{D})=-2\ln 2\\{\hat {\mu }}_{D}\in \arg \max _{\mu _{D}}\min _{\mu _{G}}L(\mu _{G},\mu _{D}),&\quad {\hat {\mu }}_{G}\in \arg \min _{\mu _{G}}\max _{\mu _{D}}L(\mu _{G},\mu _{D})\\{\hat {\mu }}_{D}\in \arg \max _{\mu _{D}}L({\hat {\mu }}_{G},\mu _{D}),&\quad {\hat {\mu }}_{G}\in \arg \min _{\mu _{G}}L(\mu _{G},{\hat {\mu }}_{D})\\\forall x\in \Omega ,{\hat {\mu }}_{D}(x)=\delta _{\frac {1}{2}},&\quad {\hat {\mu }}_{G}=\mu _{ref}\end{aligned}}$

अर्थात्, जनरेटर पूरी तरह से संदर्भ की नकल करता है, और भेदभावपूर्ण आउटपुट ${\frac {1}{2}}$ सभी इनपुटों पर नियति।

Proof

पिछले प्रस्ताव से,

\arg \min _{\mu _{G}}\max _{\mu _{D}}L(\mu _{G},\mu _{D})=\mu _{ref};\quad \min _{\mu _{G}}\max _{\mu _{D}}L(\mu _{G},\mu _{D})=-2\ln 2.

किसी भी निश्चित विवेचक रणनीति के लिए $\mu _{D}$ , any $\mu _{G}$ सेट पर केंद्रित

\{x|\mathbb {E} _{y\sim \mu _{D}(x)}[\ln(1-y)]=\inf _{x}\mathbb {E} _{y\sim \mu _{D}(x)}[\ln(1-y)]\}

जनरेटर के लिए एक इष्टतम रणनीति है। इस प्रकार,

\arg \max _{\mu _{D}}\min _{\mu _{G}}L(\mu _{G},\mu _{D})=\arg \max _{\mu _{D}}\mathbb {E} _{x\sim \mu _{ref},y\sim \mu _{D}(x)}[\ln y]+\inf _{x}\mathbb {E} _{y\sim \mu _{D}(x)}[\ln(1-y)].

जेन्सेन की असमानता से, विवेचक हमेशा खेलने की नियतात्मक रणनीति अपनाकर ही सुधार कर सकता है $D(x)=\mathbb {E} _{y\sim \mu _{D}(x)}[y]$ . Therefore,

\arg \max _{\mu _{D}}\min _{\mu _{G}}L(\mu _{G},\mu _{D})=\arg \max _{D}\mathbb {E} _{x\sim \mu _{ref}}[\ln D(x)]+\inf _{x}\ln(1-D(x))

जेन्सेन की असमानता से,

\ln \mathbb {E} _{x\sim \mu _{ref}}[D(x)]+\inf _{x}\ln(1-D(x))=\ln \mathbb {E} _{x\sim \mu _{ref}}[D(x)]+\ln(1-\sup _{x}D(x))=\ln[\mathbb {E} _{x\sim \mu _{ref}}[D(x)](1-\sup _{x}D(x))]\leq \ln[\sup _{x}D(x))(1-\sup _{x}D(x))]\leq \ln {\frac {1}{4}},

समानता के साथ अगर $D(x)={\frac {1}{2}}$ , so

\forall x\in \Omega ,{\hat {\mu }}_{D}(x)=\delta _{\frac {1}{2}};\quad \max _{\mu _{D}}\min _{\mu _{G}}L(\mu _{G},\mu _{D})=-2\ln 2.

अंत में, यह जांचने के लिए कि यह नैश संतुलन है, ध्यान दें कि कब $\mu _{G}=\mu _{ref}$ , अपने पास

L(\mu _{G},\mu _{D}):=\mathbb {E} _{x\sim \mu _{ref},y\sim \mu _{D}(x)}[\ln(y(1-y))]

which is always maximized by

y={\frac {1}{2}}

.

जब $\forall x\in \Omega ,\mu _{D}(x)=\delta _{\frac {1}{2}}$ कोई भी रणनीति जनरेटर के लिए इष्टतम है।

GAN का प्रशिक्षण और मूल्यांकन

प्रशिक्षण

अस्थिर अभिसरण

जबकि जीएएन गेम में अद्वितीय वैश्विक संतुलन बिंदु होता है, जब जनरेटर और विवेचक दोनों के पास अपने संपूर्ण रणनीति सेट तक पहुंच होती है, जब उनके पास प्रतिबंधित रणनीति सेट होती है, तो संतुलन की गारंटी नहीं होती है।^[11]

व्यवहार में, जनरेटर के पास केवल फॉर्म के उपायों तक ही पहुंच होती है $\mu _{Z}\circ G_{\theta }^{-1}$ , जहाँ $G_{\theta }$ मापदंडों के साथ तंत्रिका नेटवर्क द्वारा गणना की जाने वाली फलन $\theta$ हैऔर $\mu _{Z}$ सरलता से नमूना वितरण है, जैसे समान या सामान्य वितरण। इसी तरह, विवेचक के पास केवल फॉर्म के कार्यों तक ही पहुंच होती है $D_{\zeta }$ , मापदंडों के साथ एक तंत्रिका नेटवर्क द्वारा गणना की गई एक फलन $\zeta$ . ये प्रतिबंधित रणनीति सेट उनके संपूर्ण रणनीति सेटों का एक छोटा सा भाग लेते हैं।^[12]

इसके अतिरिक्त, तथापि एक संतुलन अभी भी उपस्थित हो, यह केवल सभी संभावित तंत्रिका नेटवर्क कार्यों के उच्च-आयामी स्थान में खोज कर पाया जा सकता है। संतुलन खोजने के लिए ढाल वंश का उपयोग करने की मानक रणनीति अधिकांशतः जीएएन के लिए काम नहीं करती है, और अधिकांशतः खेल कई विफलता मोडों में से एक में गिर जाता है। अभिसरण स्थिरता में सुधार करने के लिए, कुछ प्रशिक्षण रणनीतियाँ एक सरलकार्य से प्रारंभ होती हैं, जैसे कम-रिज़ॉल्यूशन वाली छवियां बनाना^[13] या साधारण छवियां (एक समान पृष्ठभूमि वाली एक वस्तु),^[14] और प्रशिक्षण के समय कार्य की कठिनाई को धीरे-धीरे बढ़ाएं। यह अनिवार्य रूप से पाठ्यचर्या सीखने की योजना को प्रयुक्त करने के लिए अनुवाद करता है।^[15]

मोड पतन

जीएएन अधिकांशतः मोड पतन से पीड़ित होते हैं जहां वे ठीक से सामान्यीकरण करने में विफल होते हैं, इनपुट डेटा से संपूर्ण मोड गायब होते हैं। उदाहरण के लिए, एमएनआईएसटी डेटासेट पर प्रशिक्षित एक जीएएन जिसमें प्रत्येक अंक के कई नमूने होते हैं, केवल अंक 0 के चित्र उत्पन्न कर सकते हैं। इसे पहले पेपर में अपने आसपास देखो नाम दिया गया था।

एक विधि यह हो सकता है कि यदि जनरेटर विवेचक की तुलना में बहुत तीव्रता से सीखता है। यदि विवेचक $D$ स्थिर रखा जाता है, तो इष्टतम जनरेटर केवल के तत्वों का उत्पादन करेगा $\arg \max _{x}D(x)$ .^[16] उदाहरण के लिए, यदि एमएनआईएसटी डेटासेट बनाने के लिए जीएएन प्रशिक्षण के समय, कुछ युगों के लिए, विवेचक किसी तरह अंक 0 को अन्य अंकों की तुलना में थोड़ा अधिक पसंद करता है, तो जनरेटर केवल अंक 0 उत्पन्न करने का अवसर जब्त कर सकता है, फिर स्थानीय से बचने में असमर्थ हो सकता है विवेचक के सुधार के बाद न्यूनतम। कुछ शोधकर्ता मूल समस्या को एक कमजोर भेदभावपूर्ण नेटवर्क मानते हैं जो चूक के पैटर्न को नोटिस करने में विफल रहता है, जबकि अन्य उद्देश्य कार्य के खराब विकल्प को दोष देते हैं। कई समाधान प्रस्तावित किए गए हैं, लेकिन यह अभी भी एक खुली समस्या है।^[17]^[18]

यहां तक कि अत्याधुनिक आर्किटेक्चर, बिगगैन (2019) भी मोड के पतन से नहीं बच सका। लेखकों ने प्रशिक्षण के बाद के चरणों में पतन की अनुमति देने का सहारा लिया, जिस समय तक एक मॉडल को अच्छे परिणाम प्राप्त करने के लिए पर्याप्त रूप से प्रशिक्षित किया जाता है।^[19]

दो टाइम-स्केल अपडेट रूल

जनरेटर की सीखने की दर को विवेचक की तुलना में कम करके जीएएन अभिसरण को अधिक स्थिर बनाने के लिए दो समय-स्तरीय अद्यतन नियम (टीटीयूआर) का प्रस्ताव है। लेखकों ने तर्क दिया कि जनरेटर को विवेचक की तुलना में धीमी गति से आगे बढ़ना चाहिए, जिससे यह अपनी एकत्रित जानकारी को कैप्चर किए बिना विवेचक को नए क्षेत्रों में तीव्रता से न चलाए।

उन्होंने सिद्ध कर दिया कि गेम का एक सामान्य वर्ग जिसमें जीएएन गेम सम्मिलित है, जब टीटीयूआर के अनुसार प्रशिक्षित किया जाता है, तो एक स्थिर स्थानीय नैश संतुलन के लिए हल्के अनुमानों के अनुसार अभिसरण करता है।^[20]

उन्होंने स्टोचैस्टिक अनुकूलन का उपयोग करने का भी प्रस्ताव दिया^[21] मोड पतन से बचने के लिए, साथ ही जीएएन प्रदर्शन के मूल्यांकन के लिए फ्रेचेट स्थापना दूरी है।

गायब हो रही ढाल

इसके विपरीत, यदि विवेचक जनरेटर की तुलना में बहुत तीव्रता से सीखता है, तो विवेचक लगभग पूरी तरह से अंतर कर सकता है $\mu _{G_{\theta }},\mu _{ref}$ . ऐसे में जनरेटर $G_{\theta }$ बहुत अधिक हानि के साथ फंस सकता है चाहे वह किसी भी दिशा में बदल जाए $\theta$ , जिसका अर्थ है कि ढाल $\nabla _{\theta }L(G_{\theta },D_{\zeta })$ शून्य के समीप होगा। ऐसी स्थिति में, जनरेटर सीख नहीं सकता है, गायब होने वाली ढाल समस्या की स्थितियों^[12] सहज रूप से बोलना, विवेचक बहुत अच्छा है, और चूंकि जनरेटर अपने भुगतान को अच्छे बनाने के लिए कोई छोटा कदम नहीं उठा सकता है (केवल छोटे कदमों को ग्रेडिएंट डिसेंट में माना जाता है), यह कोशिश भी नहीं करता है।

इस समस्या को हल करने के लिए महत्वपूर्ण विधि वासरस्टीन जीएएन है।

मूल्यांकन

GAN का मूल्यांकन सामान्यतः इंसेप्शन स्कोर (आईएस) द्वारा किया जाता है, जो यह मापता है कि जनरेटर के आउटपुट कितने विविध हैं (जैसा कि इमेज वर्गीकरण द्वारा वर्गीकृत किया गया है, सामान्यतः इंसेप्शन v3 या फ्रीचेट इंसेप्शन डिस्टेंस (एफआईडी), जो मापता है कि जनरेटर का आउटपुट कितना समान है। संदर्भ सेट के लिए हैं (जैसा कि सीखी हुई छवि फ़ीचराइज़र द्वारा वर्गीकृत किया गया है, जैसे कि इसकी अंतिम परत के बिना इनसेप्शन-वी 3)। छवि निर्माण के लिए नए जीएएन आर्किटेक्चर का प्रस्ताव करने वाले कई पेपर रिपोर्ट करते हैं कि कैसे उनके आर्किटेक्चर एफआईडी या आईएस पर कला की स्थिति को तोड़ते हैं।

अन्य मूल्यांकन पद्धति लर्न्ड अवधारणात्मक इमेज पैच समानता (एलपीआईपीएस) है, जो सीखे हुए इमेज भविष्यकारक से प्रारंभ होती है। $f_{\theta }:{\text{Image}}\to \mathbb {R} ^{n}$ , और के सेट पर पर्यवेक्षित शिक्षण द्वारा इसे अच्छे बनाता है $(x,x',{\text{PerceptualDifference}}(x,x'))$ , जहाँ $x$ छवि है, $x'$ इसका परेशान संस्करण है, और ${\text{PerceptualDifference}}(x,x')$ यह कितना भिन्न है, जैसा कि मानव विषयों द्वारा रिपोर्ट किया गया है। मॉडल को फ़ाइनट्यून किया गया है जिससे यह अनुमानित हो सके $\|f_{\theta }(x)-f_{\theta }(x')\|\approx {\text{PerceptualDifference}}(x,x')$ . यह परिष्कृत मॉडल तब परिभाषित करने के लिए उपयोग किया जाता है ${\text{LPIPS}}(x,x'):=\|f_{\theta }(x)-f_{\theta }(x')\|$ .^[22]

में अन्य मूल्यांकन विधियों की समीक्षा की जाती है।^[23]

वेरिएंट

GAN वेरिएंट का वास्तविक चिड़ियाघर है।^[24] कुछ सबसे प्रमुख इस प्रकार हैं:

सशर्त गण

सशर्त जीएएन मानक जीएएन के समान हैं, सिवाय इसके कि वे अतिरिक्त जानकारी के आधार पर मॉडल को सशर्त रूप से नमूने उत्पन्न करने की अनुमति देते हैं। उदाहरण के लिए, यदि हम एक कुत्ते की चित्र के साथ बिल्ली का चेहरा उत्पन्न करना चाहते हैं, तो हम सशर्त जीएएन का उपयोग कर सकते हैं।

GAN गेम में जनरेटर $\mu _{G}$ उत्पन्न करता है, प्रायिकता स्थान पर प्रायिकता बंटन $\Omega$ . यह सशर्त जीएएन के विचार की ओर जाता है, जहां पर संभाव्यता वितरण उत्पन्न करने के अतिरिक्त $\Omega$ , जनरेटर अलग संभाव्यता वितरण उत्पन्न करता है $\mu _{G}(c)$ पर $\Omega$ , प्रत्येक दिए गए वर्ग लेबल के लिए $c$ .है।

उदाहरण के लिए, इमेज नेट की तरह दिखने वाली छवियों को उत्पन्न करने के लिए, जनरेटर को कैट लेबल दिए जाने पर बिल्ली की चित्र उत्पन्न करने में सक्षम होना चाहिए।

मूल पेपर में,^[3] लेखकों ने नोट किया कि जेनरेटर और भेदभाव करने वाला दोनों को लेबल प्रदान करके जीएएन को तुच्छ रूप से सशर्त जीएएन तक बढ़ाया जा सकता है।

विशेष रूप से, सशर्त जीएएन गेम केवल जीएएन गेम है जिसमें क्लास लेबल दिए गए हैं:

L(\mu _{G},D):=\mathbb {E} _{c\sim \mu _{C},x\sim \mu _{ref}(c)}[\ln D(x,c)]+\mathbb {E} _{c\sim \mu _{C},x\sim \mu _{G}(c)}[\ln(1-D(x,c))]

जहाँ

\mu _{C}

वर्गों पर संभाव्यता वितरण है,

\mu _{ref}(c)

कक्षा की वास्तविक छवियों का संभाव्यता वितरण है

c

, और

\mu _{G}(c)

वर्ग लेबल दिए जाने पर जेनरेटर द्वारा उत्पन्न छवियों की संभाव्यता वितरण

c

.

2017 में, सशर्त जीएएन ने इमेजनेट की 1000 छवि कक्षाएं उत्पन्न करना सीखा जाता है।^[25]

GAN वैकल्पिक आर्किटेक्चर के साथ

GAN गेम सामान्य ढांचा है और इसे जनरेटर के किसी भी उचित पैरामीट्रिजेशन के साथ चलाया जा सकता है $G$ और भेदभाव करनेवाला $D$ . मूल पेपर में, लेखकों ने बहुपरत परसेप्ट्रॉन नेटवर्क और दृढ़ तंत्रिका नेटवर्क का उपयोग करके इसका प्रदर्शन किया। कई वैकल्पिक आर्किटेक्चर की कोशिश की गई है।

डीप कन्वेन्शनल जीएएन (DCGAN):^[26] जनरेटर और भेदभाव करने वाला दोनों के लिए, केवल गहरे नेटवर्क का उपयोग किया जाता है, जिसमें पूरी तरह से कनवल्शन-डिकोनवोल्यूशन लेयर्स होते हैं, यानी पूरी तरह से कन्वेन्शनल नेटवर्क^[27] आत्म-ध्यान जीएएन (सागन):^[28] डीसीजीएएन के साथ प्रारंभ होता है, फिर जनरेटर और भेदभाव करने वाला के लिए अवशिष्ट रूप से जुड़े मानक ध्यान तंत्र आत्म-ध्यान मॉड्यूल जोड़ता है।

परिवर्तनशील ऑटोएन्कोडर जीएएन (वेगन):^[29] जनरेटर के लिए परिवर्तनशील ऑटोएन्कोडर (वीएई) का उपयोग करता है।

ट्रांसफार्मर गण (ट्रांसगान):^[30] जेनरेटर और भेदभाव करने वाला दोनों के लिए शुद्ध ट्रांसफॉर्मर (मशीन लर्निंग मॉडल) आर्किटेक्चर का उपयोग करता है, जो पूरी तरह से कनवल्शन-डिकोनवोल्यूशन लेयर्स से रहित है।

प्रवाह-गण:^[31] जनरेटर के लिए फ्लो-आधारित जनरेटिव मॉडल का उपयोग करता है, जिससे संभावित कार्य की कुशल गणना की अनुमति मिलती है।

वैकल्पिक उद्देश्यों के साथजीएएन

जेनरेटर और भेदभाव करने वाला के हानि कार्यों को बदलकर कई जीएएन वेरिएंट प्राप्त किए जाते हैं।

मूल गण:

हम मूल जीएएन उद्देश्य को तुलना के लिए अधिक सुविधाजनक रूप में पुन: व्यवस्थित करते हैं:

{\begin{cases}\min _{D}L_{D}(D,\mu _{G})=-\mathbb {E} _{x\sim \mu _{G}}[\ln D(x)]-\mathbb {E} _{x\sim \mu _{ref}}[\ln(1-D(x))]\\\min _{G}L_{G}(D,\mu _{G})=-\mathbb {E} _{x\sim \mu _{G}}[\ln(1-D(x))]\end{cases}}

मूलजीएएन, गैर-संतृप्त हानि:

तीव्रता से अभिसरण के लिए मूल पेपर में जनरेटर के लिए इस उद्देश्य की सिफारिश की गई थी।^[3]

L_{G}=\mathbb {E} _{x\sim \mu _{G}}[\ln D(x)]

इस उद्देश्य का उपयोग करने के प्रभाव का विश्लेषण Arjovsky et al की धारा 2.2.2 में किया गया है।^[32] मूलजीएएन, अधिकतम संभावना:

L_{G}=\mathbb {E} _{x\sim \mu _{G}}[(\exp \circ \sigma ^{-1}\circ D)(x)]

जहाँ

\sigma

लॉजिस्टिक फलन है। जब विवेचक इष्टतम होता है, तो जनरेटर ग्रेडिएंट अधिकतम संभावना अनुमान के समान होता है, तथापि जीएएन स्वयं अधिकतम संभावना अनुमान नहीं लगा सकता है।^[33]^[34]

काज हानि जीएएन:^[35]

L_{D}=-\mathbb {E} _{x\sim {p}_{ref}}\left[\min \left(0,-1+D\left(x\right)\right)\right]-\mathbb {E} _{x\sim \mu _{G}}\left[\min \left(0,-1-D\left(x\right)\right)\right]

L_{G}=-\mathbb {E} _{x\sim \mu _{G}}[D\left(x\right)]

न्यूनतम वर्ग जीएएन:^[36]

L_{D}=\mathbb {E} _{x\sim \mu _{ref}}[(D(x)-b)^{2}]+\mathbb {E} _{x\sim \mu _{G}}[(D(x)-a)^{2}]

L_{G}=\mathbb {E} _{x\sim \mu _{G}}[(D(x)-c)^{2}]

जहाँ

a,b,c

चुने जाने वाले पैरामीटर हैं। लेखकों ने सिफारिश की

a=-1,b=1,c=0

.

वासेरस्टीन बाय (डब्ल्यूजीएएन)

वासरस्टीन जीएएन जीएएन गेम को दो बिंदुओं पर संशोधित करता है:

विवेचक की रणनीति सेट प्रकार के मापने योग्य कार्यों का सेट है $D:\Omega \to \mathbb {R}$ बंधे हुए लिप्सचिट्ज़ मानदंड के साथ: $\|D\|_{L}\leq K$ , जहाँ $K$ निश्चित सकारात्मक स्थिरांक है।
उद्देश्य है $L_{WGAN}(\mu _{G},D):=\mathbb {E} _{x\sim \mu _{G}}[D(x)]-\mathbb {E} _{x\sim \mu _{ref}}[D(x)]$

इसका उद्देश्य मोड पतन की समस्या को हल करना है (ऊपर देखें)^[12]लेखकों का दावा है कि किसी भी प्रयोग में हमने डब्ल्यूजीएएन एल्गोरिथम के लिए मोड पतन का प्रमाण नहीं देखा।

2 से अधिक खिलाड़ियों वालेजीएएन

प्रतिकूल ऑटोएन्कोडर

प्रतिकूल ऑटोएन्कोडर (AAE)^[37] जीएएन की तुलना में अधिक ऑटो एनकोडर है। विचार सादे ऑटोएन्कोडर के साथ प्रारंभ करना है, लेकिन संदर्भ वितरण (अधिकांशतः सामान्य वितरण) से अव्यक्त वैक्टरों में भेदभाव करने के लिए विवेचक को प्रशिक्षित करें।

इन्फोगन

सशर्त जीएएन में, जनरेटर शोर वेक्टर दोनों प्राप्त करता है $z$ और लेबल $c$ , और छवि बनाता है $G(z,c)$ . विवेचक छवि-लेबल जोड़े प्राप्त करता है $(x,c)$ , और गणना करता $D(x,c)$ है

जब प्रशिक्षण डेटासेट को लेबल नहीं किया जाता है, सशर्त जीएएन सीधे काम नहीं करता है।

इन्फोगन का विचार यह तय करना है कि अव्यक्त स्थान में प्रत्येक अव्यक्त वेक्टर को विघटित किया जा सकता है $(z,c)$ : असंपीड्य शोर भाग $z$ , और जानकारीपूर्ण लेबल भाग $c$ , और जनरेटर को अधिकतम करने के लिए प्रोत्साहित करके, डिक्री का पालन करने के लिए प्रोत्साहित करें $I(c,G(z,c))$ , के बीच आपसी जानकारी $c$ और $G(z,c)$ , आपसी जानकारी पर कोई मांग नहीं करते हुए $z$ बीच में $G(z,c)$ है

दुर्भाग्य से, $I(c,G(z,c))$ सामान्य रूप से अट्रैक्टिव है, इन्फोगन का मुख्य विचार वैरिएशनल म्यूचुअल इंफॉर्मेशन मैक्सिमाइजेशन है:^[38] निचली सीमा को अधिकतम करके अप्रत्यक्ष रूप से इसे अधिकतम करें

{\hat {I}}(G,Q)=\mathbb {E} _{z\sim \mu _{Z},c\sim \mu _{C}}[\ln Q(c|G(z,c))];\quad I(c,G(z,c))\geq \sup _{Q}{\hat {I}}(G,Q)

जहाँ

Q

प्रकार के सभी मार्कोव गुठली पर पर्वतमाला

Q:\Omega _{Y}\to {\mathcal {P}}(\Omega _{C})

.

इन्फोगन गेम को इस प्रकार परिभाषित किया गया है:^[39]

तीन प्रायिकता स्थान इन्फोगन गेम को परिभाषित करते हैं:
$(\Omega _{X},\mu _{ref})$ , संदर्भ छवियों का स्थान।

$(\Omega _{Z},\mu _{Z})$ निश्चित यादृच्छिक शोर जनरेटर।

$(\Omega _{C},\mu _{C})$ निश्चित यादृच्छिक सूचना जनरेटर।

2 टीमों में 3 खिलाड़ी हैं: जनरेटर, क्यू, और विवेचक टीम में जनरेटर और Q हैं, और दूसरी टीम में भेदभाव करने वाला है।
उद्देश्य फलन है
$L(G,Q,D)=L_{GAN}(G,D)-\lambda {\hat {I}}(G,Q)$ जहाँ $L_{GAN}(G,D)=\mathbb {E} _{x\sim \mu _{ref},}[\ln D(x)]+\mathbb {E} _{z\sim \mu _{Z}}[\ln(1-D(G(z,c)))]$ मूल जीएएन गेम उद्देश्य है, और ${\hat {I}}(G,Q)=\mathbb {E} _{z\sim \mu _{Z},c\sim \mu _{C}}[\ln Q(c|G(z,c))]$
जेनरेटर-q टीम का उद्देश्य उद्देश्य को कम करना है, और विवेचक का लक्ष्य इसे अधिकतम करना है:
$\min _{G,Q}\max _{D}L(G,Q,D)$

द्विदिश गण (बिगन)

मानक जीएएन जनरेटर प्रकार का कार्य है $G:\Omega _{Z}\to \Omega _{X}$ , यानी यह अव्यक्त स्थान से मानचित्रण है $\Omega _{Z}$ छवि स्थान के लिए $\Omega _{X}$ . इसे डिकोडिंग प्रक्रिया के रूप में समझा जा सकता है, जिससे प्रत्येक अव्यक्त वेक्टर $z\in \Omega _{Z}$ छवि के लिए कोड $x\in \Omega _{X}$ है और जनरेटर डिकोडिंग करता है। यह स्वाभाविक रूप से एक अन्य नेटवर्क को प्रशिक्षित करने के विचार की ओर जाता है जो एनकोडर-जनरेटर जोड़ी से ऑटोएन्कोडर बनाकर एन्कोडिंग करता है।
पहले से ही मूल पेपर में,^[3] लेखकों ने नोट किया कि भविष्यवाणी करने के लिए सहायक नेटवर्क को प्रशिक्षित करके अनुमानित अनुमान लगाया जा सकता है $z$ दिया गया $x$ . द्विदिश जीएएन आर्किटेक्चर ठीक यही करता है।^[40]
BiGAN को इस प्रकार परिभाषित किया गया है:
दो प्रायिकता स्थान BiGAN गेम को परिभाषित करते हैं:
$(\Omega _{X},\mu _{X})$ , संदर्भ छवियों का स्थान।

$(\Omega _{Z},\mu _{Z})$ , गुप्त स्थान।

2 टीमों में 3 खिलाड़ी हैं: जनरेटर, एनकोडर और भेदभाव करने वाला। जनरेटर और एनकोडर टीम में हैं, और भेदभाव करने वाला दूसरी टीम में हैं।
जनरेटर की रणनीतियाँ कार्य हैं $G:\Omega _{Z}\to \Omega _{X}$ , और एनकोडर की रणनीतियाँ कार्य हैं $E:\Omega _{X}\to \Omega _{Z}$ . विवेचक की रणनीतियाँ कार्य $D:\Omega _{X}\to [0,1]$ हैं।
उद्देश्य फलन है।
$L(G,E,D)=\mathbb {E} _{x\sim \mu _{X}}[\ln D(x,E(x))]+\mathbb {E} _{z\sim \mu _{Z}}[\ln(1-D(G(z),z))]$
जेनरेटर-एनकोडर टीम का उद्देश्य उद्देश्य को कम करना है, और विवेचक का लक्ष्य इसे अधिकतम करना है:
$\min _{G,E}\max _{D}L(G,E,D)$
पेपर में, उन्होंने उद्देश्य की अधिक सारगर्भित परिभाषा इस प्रकार दी:
$L(G,E,D)=\mathbb {E} _{(x,z)\sim \mu _{E,X}}[\ln D(x,z)]+\mathbb {E} _{(x,z)\sim \mu _{G,Z}}[\ln(1-D(x,z))]$ जहाँ $\mu _{E,X}(dx,dz)=\mu _{X}(dx)\cdot \delta _{E(x)}(dz)$ संभाव्यता वितरण चालू है $\Omega _{X}\times \Omega _{Z}$ पुशफॉरवर्ड माप | पुशिंग द्वारा प्राप्त किया गया $\mu _{X}$ के माध्यम से अग्रेषित करें $x\mapsto (x,E(x))$ , और $\mu _{G,Z}(dx,dz)=\delta _{G(z)}(dx)\cdot \mu _{Z}(dz)$ संभाव्यता वितरण चालू है $\Omega _{X}\times \Omega _{Z}$ धक्का देकर प्राप्त किया $\mu _{Z}$ के माध्यम से अग्रेषित करें $z\mapsto (G(x),z)$ .
द्विदिश मॉडल के अनुप्रयोगों में अर्ध-पर्यवेक्षित शिक्षण सम्मिलित है,^[41] व्याख्यात्मक कृत्रिम बुद्धि,^[42] और तंत्रिका मशीन अनुवाद है।^[43]

साइकिलगण

साइकिलगैन दो डोमेन के बीच अनुवाद करने के लिए आर्किटेक्चर है, जैसे कि घोड़ों की चित्र और जेब्रा की चित्र, या रात के शहरों की चित्र और दिन के शहरों की चित्र।
साइकिलगैन गेम को इस प्रकार परिभाषित किया गया है:^[44]
दो प्रायिकता स्थान हैं $(\Omega _{X},\mu _{X}),(\Omega _{Y},\mu _{Y})$ , आगे और पीछे अनुवाद के लिए आवश्यक दो डोमेन के अनुरूप।
2 टीमों में 4 खिलाड़ी हैं: जनरेटर $G_{X}:\Omega _{X}\to \Omega _{Y},G_{Y}:\Omega _{Y}\to \Omega _{X}$ , और भेदभाव करने वाले $D_{X}:\Omega _{X}\to [0,1],D_{Y}:\Omega _{Y}\to [0,1]$ .
उद्देश्य फलन है
$L(G_{X},G_{Y},D_{X},D_{Y})=L_{GAN}(G_{X},D_{X})+L_{GAN}(G_{Y},D_{Y})+\lambda L_{cycle}(G_{X},G_{Y})$ जहाँ $\lambda$ सकारात्मक समायोज्य पैरामीटर है, $L_{GAN}$ जीएएन गेम का उद्देश्य है, और $L_{cycle}$ चक्र संगति हानि है: $L_{cycle}(G_{X},G_{Y})=E_{x\sim \mu _{X}}\|G_{X}(G_{Y}(x))-x\|+E_{y\sim \mu _{Y}}\|G_{Y}(G_{X}(y))-y\|$ जनरेटर का लक्ष्य उद्देश्य को कम करना है, और भेदभाव करने वालों का लक्ष्य इसे अधिकतम करना है: $\min _{G_{X},G_{Y}}\max _{D_{X},D_{Y}}L(G_{X},G_{Y},D_{X},D_{Y})$
pix2pix जैसे पिछले काम के विपरीत,^[45] जिसके लिए युग्मित प्रशिक्षण डेटा की आवश्यकता होती है, साइकिलगैन को युग्मित डेटा की आवश्यकता नहीं होती है। उदाहरण के लिए, Pix2pix मॉडल को प्रशिक्षित करने के लिए गर्मियों के दृश्यों के फोटो को सर्दियों के दृश्यों के फोटो और बैक में बदलने के लिए, डेटासेट में गर्मियों और सर्दियों में एक ही स्थान के जोड़े होने चाहिए, एक ही कोण पर शूट किए गए; साइकिलगैन को केवल गर्मियों के दृश्यों की चित्रों के सेट और सर्दियों के दृश्यों की चित्रों के असंबंधित सेट की आवश्यकता होगी।
जीएएन विशेष रूप से बड़े या छोटे पैमाने के साथ

बिगगैन

बिगगैन अनिवार्य रूप से स्व-ध्यान जीएएन है जिसे बड़े पैमाने पर (80 मिलियन मापदंडों तक) इमेजनेट की बड़ी छवियां (512 x 512 रिज़ॉल्यूशन तक) उत्पन्न करने के लिए प्रशिक्षित किया गया है, जिसमें इसे अभिसरण करने के लिए कई इंजीनियरिंग ट्रिक्स हैं।^[19]^[46]

उलटा डेटा वृद्धि

अपर्याप्त प्रशिक्षण डेटा होने पर, संदर्भ वितरण $\mu _{ref}$ प्रशिक्षण डाटासेट द्वारा दिए गए अनुभवजन्य उपाय द्वारा अच्छी तरह से अनुमानित नहीं किया जा सकता है। ऐसे मामलों में, जीएएन को छोटे डेटासेट पर प्रशिक्षण देने के लिए डेटा संवर्द्धन प्रयुक्त किया जा सकता है। चूँकि, भोली डेटा वृद्धि अपनी समस्याएं लाती है।
मूल जीएएन गेम पर विचार करें, जिसे थोड़ा सुधारा गया है:
${\begin{cases}\min _{D}L_{D}(D,\mu _{G})=-\mathbb {E} _{x\sim \mu _{ref}}[\ln D(x)]-\mathbb {E} _{x\sim \mu _{G}}[\ln(1-D(x))]\\\min _{G}L_{G}(D,\mu _{G})=-\mathbb {E} _{x\sim \mu _{G}}[\ln(1-D(x))]\end{cases}}$ अब हम सिमेंटिक-संरक्षित रूपांतरणों को बेतरतीब ढंग से नमूना करके डेटा वृद्धि का उपयोग करते हैं $T:\Omega \to \Omega$ और सुधारित जीएएन गेम प्राप्त करने के लिए उन्हें डेटासेट पर प्रयुक्त करना: ${\begin{cases}\min _{D}L_{D}(D,\mu _{G})=-\mathbb {E} _{x\sim \mu _{ref},T\sim \mu _{trans}}[\ln D(T(x))]-\mathbb {E} _{x\sim \mu _{G}}[\ln(1-D(x))]\\\min _{G}L_{G}(D,\mu _{G})=-\mathbb {E} _{x\sim \mu _{G}}[\ln(1-D(x))]\end{cases}}$ यह भिन्न वितरण वाले जीएएन गेम के समतुल्य है $\mu _{ref}'$ , द्वारा नमूना लिया गया $T(x)$ , साथ $x\sim \mu _{ref},T\sim \mu _{trans}$ . उदाहरण के लिए, यदि $\mu _{ref}$ इमेजनेट में छवियों का वितरण है, और $\mu _{trans}$ नमूने पहचान-संभाव्यता 0.5 के साथ बदलते हैं, और क्षैतिज-प्रतिबिंब प्रायिकता 0.5 के साथ, फिर $\mu _{ref}'$ इमेजनेट में छवियों का वितरण और क्षैतिज रूप से प्रतिबिंबित इमेजनेट, संयुक्त है।
इस तरह के प्रशिक्षण का परिणाम एक जनरेटर होगा जो नकल करता है $\mu _{ref}'$ . उदाहरण के लिए, यदि डेटा संवर्द्धन यादृच्छिक काट-छाँट का उपयोग करता है, तो यह उन छवियों को उत्पन्न करेगा जो ऐसी दिखती हैं जैसे वे यादृच्छिक रूप से क्रॉप की गई हों।
समाधान उत्पन्न और वास्तविक दोनों छवियों के लिए डेटा वृद्धि को प्रयुक्त करना है:
${\begin{cases}\min _{D}L_{D}(D,\mu _{G})=-\mathbb {E} _{x\sim \mu _{ref},T\sim \mu _{trans}}[\ln D(T(x))]-\mathbb {E} _{x\sim \mu _{G},T\sim \mu _{trans}}[\ln(1-D(T(x)))]\\\min _{G}L_{G}(D,\mu _{G})=-\mathbb {E} _{x\sim \mu _{G},T\sim \mu _{trans}}[\ln(1-D(T(x)))]\end{cases}}$ लेखकों ने केवल 100-चित्र-बड़े डेटासेट का उपयोग करके उच्च-गुणवत्ता वाली पीढ़ी का प्रदर्शन किया।^[47] स्टाइलगैन-2-ADA पेपर डेटा वृद्धि पर एक और बिंदु बताता है: यह उलटा होना चाहिए।^[48] इमेजनेट चित्र बनाने के उदाहरण के साथ जारी रखें। यदि डेटा संवर्द्धन बेतरतीब ढंग से चित्र को 0, 90, 180, 270 डिग्री से समान संभावना के साथ घुमाता है, तो जनरेटर के लिए यह जानने का कोई विधि नहीं है कि सही अभिविन्यास कौन सा है: दो जनरेटर पर विचार करें $G,G'$ , ऐसा कि किसी भी अव्यक्त के लिए $z$ , उत्पन्न छवि $G(z)$ का 90 डिग्री का घुमाव है $G'(z)$ . उन्हें ठीक वैसी ही अपेक्षित हानि होगी, और इसलिए न तो दूसरे पर वरीयता दी जाती है।
समाधान केवल उलटा डेटा वृद्धि का उपयोग करना है: समान संभावना के साथ चित्र को 0, 90, 180, 270 डिग्री से बेतरतीब ढंग से घुमाने के अतिरिक्त, चित्र को 0.1 संभावना के साथ 90, 180, 270 डिग्री से बेतरतीब ढंग से घुमाने के लिए उपयोग करें, और चित्र को ऐसे ही रखें यह 0.7 संभावना के साथ है। इस तरह, जनरेटर को अभी भी छवियों को उसी तरह से उन्मुख रखने के लिए पुरस्कृत किया जाता है जैसे कि अन-ऑगमेंटेड इमेजनेट पिक्चर्स है
संक्षेप में, यादृच्छिक रूप से नमूना परिवर्तन का प्रभाव $T:\Omega \to \Omega$ वितरण से $\mu _{trans}$ मार्कोव कर्नेल को परिभाषित करना है $K_{trans}:\Omega \to {\mathcal {P}}(\Omega )$ . फिर, डेटा-संवर्धित जीएएन गेम जनरेटर को कुछ खोजने के लिए प्रेरित करता है ${\hat {\mu }}_{G}\in {\mathcal {P}}(\Omega )$ , ऐसा है कि
$K_{trans}*\mu _{ref}=K_{trans}*{\hat {\mu }}_{G}$ जहाँ $*$ प्रायिकता बंटन का कनवल्शन है। मार्कोव कर्नेल होने पर डेटा-वृद्धि विधि को उलटा होने के लिए परिभाषित किया जाता है $K_{trans}$ बिगगैन $K_{trans}*\mu =K_{trans}*\mu '\implies \mu =\mu '\quad \forall \mu ,\mu '\in {\mathcal {P}}(\Omega )$ परिभाषा के तुरंत बाद, हम देखते हैं कि कई व्युत्क्रमणीय डेटा-वृद्धि विधियों की रचना के परिणामस्वरूप एक और व्युत्क्रमणीय विधि होती है। साथ ही परिभाषा के अनुसार, यदि डेटा-संवर्द्धन विधि व्युत्क्रमणीय है, तो इसे जीएएन गेम में उपयोग करने से इष्टतम रणनीति नहीं बदलती है ${\hat {\mu }}_{G}$ जनरेटर के लिए, जो अभी भी $\mu _{ref}$ है।
उल्टे मार्कोव गुठली के दो प्रोटोटाइपिक उदाहरण हैं:
असतत स्थितियों: उलटा स्टोकेस्टिक मैट्रिक्स , कब $\Omega$ परिमित है।
उदाहरण के लिए, यदि $\Omega =\{\uparrow ,\downarrow ,\leftarrow ,\rightarrow \}$ तीर की चार छवियों का सेट है, जो 4 दिशाओं में इंगित करता है, और डेटा संवर्द्धन संभावना के साथ चित्र को 90, 180, 270 डिग्री से बेतरतीब ढंग से घुमाता है $p$ , और चित्र को संभाव्यता के साथ वैसा ही रखें $(1-3p)$ , फिर मार्कोव कर्नेल $K_{trans}$ स्टोकेस्टिक मैट्रिक्स के रूप में दर्शाया जा सकता है:
$[K_{trans}]={\begin{bmatrix}(1-3p)&p&p&p\\p&(1-3p)&p&p\\p&p&(1-3p)&p\\p&p&p&(1-3p)\end{bmatrix}}$ और $K_{trans}$ उलटा कर्नेल iff है $[K_{trans}]$ व्युत्क्रमणीय मैट्रिक्स है, अर्थात $p\neq 1/4$ .
सतत स्थितियों: गॉसियन कर्नेल, कब $\Omega =\mathbb {R} ^{n}$ कुछ के लिए $n\geq 1$ .
उदाहरण के लिए, यदि $\Omega =\mathbb {R} ^{256^{2}}$ 256x256 छवियों का स्थान है, और डेटा-वृद्धि विधि गाऊसी शोर उत्पन्न करती है $z\sim {\mathcal {N}}(0,I_{256^{2}})$ , फिर जोड़िए $\epsilon z$ छवि के लिए, फिर $K_{trans}$ के घनत्व फलन द्वारा सिर्फ कनवल्शन है ${\mathcal {N}}(0,\epsilon ^{2}I_{256^{2}})$ . यह उलटा है, क्योंकि गॉसियन द्वारा कनवल्शन सिर्फ गर्म गिरी द्वारा कनवल्शन है, इसलिए कोई भी $\mu \in {\mathcal {P}}(\mathbb {R} ^{n})$ , जटिल वितरण $K_{trans}*\mu$ गर्म करके प्राप्त किया जा सकता है $\mathbb {R} ^{n}$ के अनुसार ठीक है $\mu$ , फिर समय की प्रतीक्षा करें $\epsilon ^{2}/4$ . इससे हम संभल सकते हैं $\mu$ के लिए समय में ऊष्मा समीकरण को पीछे की ओर चलाकर $\epsilon ^{2}/4$ है।
उलटे डेटा संवर्द्धन के अधिक उदाहरण कागज में पाए जाते हैं।^[48]

सिंगन

सिंगन प्रशिक्षण डेटा के रूप में केवल छवि का उपयोग करके और उस पर डेटा वृद्धि करके डेटा वृद्धि को सीमित करता है। जीएएन आर्किटेक्चर को मल्टी-स्केल पाइपलाइन का उपयोग करके इस प्रशिक्षण पद्धति के अनुकूल बनाया गया है।
जनरेटर $G$ जनरेटर के पिरामिड में विघटित हो जाता है $G=G_{1}\circ G_{2}\circ \cdots \circ G_{N}$ , जिसमें सबसे कम छवि उत्पन्न होती है $G_{N}(z_{N})$ सबसे कम रिज़ॉल्यूशन पर, फिर जेनरेट की गई इमेज को स्केल अप किया जाता है $r(G_{N}(z_{N}))$ , और छवि उत्पन्न करने के लिए अगले स्तर तक खिलाया गया $G_{N-1}(z_{N-1}+r(G_{N}(z_{N})))$ उच्च संकल्प पर, और इसी तरह। विवेचक पिरामिड में भी विघटित हो जाता है।^[49]

स्टाइलगैन श्रृंखला

Main article: स्टाइलगैन

स्टाइलगैन परिवार ए NVIDIA के अनुसंधान प्रभाग द्वारा प्रकाशित आर्किटेक्चर की श्रृंखला है।

प्रगतिशील गण

प्रगतिशील गण^[13] बड़े पैमाने पर छवि निर्माण के लिए जीएएन को प्रशिक्षित करने की विधि है, जीएएन जनरेटर को छोटे से बड़े पैमाने पर पिरामिड फैशन में विकसित करके। सिंगन की तरह, यह जनरेटर को विघटित करता है $G=G_{1}\circ G_{2}\circ \cdots \circ G_{N}$ , और विवेचक के रूप में $D=D_{1}\circ D_{2}\circ \cdots \circ D_{N}$ है।
प्रशिक्षण के समय, सबसे पहले $G_{N},D_{N}$ जीएएन गेम में 4x4 चित्र बनाने के लिए उपयोग किया जाता है। तब $G_{N-1},D_{N-1}$ जीएएन गेम के दूसरे चरण तक पहुंचने के लिए जोड़ा जाता है, 8x8 इमेज जेनरेट करने के लिए, और इसी तरह, जब तक हम 1024x1024 इमेज जेनरेट करने के लिए जीएएन गेम तक नहीं पहुंच जाते है।
GAN गेम के चरणों के बीच झटके से बचने के लिए, प्रत्येक नई परत को मिश्रित किया जाता है (कागज का चित्र 2^[13]) उदाहरण के लिए, दूसरे चरण का जीएएन गेम इस तरह प्रारंभ होता है:

ठीक पहले, जीएएन गेम में जोड़ी होती है $G_{N},D_{N}$ 4x4 छवियों का निर्माण और भेदभाव करना।

इसके ठीक बाद, जीएएन गेम में जोड़ी होती है $((1-\alpha )+\alpha \cdot G_{N-1})\circ u\circ G_{N},D_{N}\circ d\circ ((1-\alpha )+\alpha \cdot D_{N-1})$ 8x8 छवियों को उत्पन्न करना और विभेद करना। यहाँ, कार्य $u,d$ इमेज अप- और डाउन-सैंपलिंग फलन हैं, और $\alpha$ ब्लेंड-इन फैक्टर है (इमेज कंपोज़िंग में अल्फा रचना की तरह) जो सरलता से 0 से 1 तक ग्लाइड होता है।

स्टाइलगैन-1

स्टाइलगैन-1 और स्टाइलगैन-2 का मुख्य आर्किटेक्चर
स्टाइलगैन-1 को तंत्रिका शैली हस्तांतरण के साथ प्रगतिशील जीएएन के संयोजन के रूप में डिज़ाइन किया गया है।^[50]
स्टाइलगैन-1 का प्रमुख वास्तुशिल्प विकल्प प्रगतिशील जीएएन के समान प्रगतिशील विकास तंत्र है। प्रत्येक उत्पन्न छवि स्थिर के रूप में प्रारंभ होती है $4\times 4\times 512$ सरणी, और बार-बार स्टाइल ब्लॉक के माध्यम से पारित किया गया। प्रत्येक स्टाइल ब्लॉक एफाइन ट्रांसफ़ॉर्म (एडेप्टिव इंस्टेंस नॉर्मलाइज़ेशन) के माध्यम से स्टाइल लेटेंट वेक्टर को प्रयुक्त करता है, ठीक उसी तरह जैसे न्यूरल स्टाइल ट्रांसफर ग्रामियन मैट्रिक्स का उपयोग करता है। यह तब शोर जोड़ता है, और सामान्य करता है (अर्थ घटाएं, फिर विचरण से विभाजित करें)।
प्रशिक्षण के समय, सामान्यतः प्रति छवि केवल शैली के अव्यक्त वेक्टर का उपयोग किया जाता है, लेकिन कभी-कभी दो (नियमित मिश्रण मिश्रण) प्रत्येक शैली ब्लॉक को अन्य शैली ब्लॉकों से सहायता की अपेक्षा किए बिना स्वतंत्र रूप से अपनी शैलीकरण करने के लिए प्रोत्साहित करने के लिए (क्योंकि वे पूरी तरह से अलग प्राप्त कर सकते हैं) शैली अव्यक्त वेक्टर) प्रशिक्षण के बाद, प्रत्येक स्टाइल ब्लॉक में कई स्टाइल लेटेंट वैक्टर डाले जा सकते हैं। निचली परतों को खिलाए गए वे बड़े पैमाने की शैलियों को नियंत्रित करते हैं, और जो उच्च परतों को खिलाए जाते हैं वे बारीक-बारीक शैलियों को नियंत्रित करते हैं।
शैली-दो छवियों के बीच मिश्रण $x,x'$ भी किया जा सकता है। सबसे पहले, खोजने के लिए ग्रेडिएंट डिसेंट रन करें $z,z'$ ऐसा है कि $G(z)\approx x,G(z')\approx x'$ . इसे स्टाइल लेटेंट स्पेस में इमेज को वापस प्रोजेक्ट करना कहा जाता है। तब, $z$ निम्न शैली ब्लॉकों को खिलाया जा सकता है, और $z'$ उच्च शैली के ब्लॉक के लिए, समग्र छवि उत्पन्न करने के लिए जिसमें बड़े पैमाने की शैली है $x$ , और की बारीक-बारीक शैली $x'$ . इस तरह से कई चित्र भी बनाए जा सकते हैं।

स्टाइलगैन-2

स्टाइलगैन-2, स्टाइलगैन-1 पर सुधार करता है, इसके अतिरिक्त कनवल्शन लेयर के वेट को बदलने के लिए स्टाइल लेटेंट वेक्टर का उपयोग करके, इस प्रकार बूँद की समस्या को हल करता है।^[51]
यह स्टाइलगैन-2-ADA द्वारा अद्यतन किया गया था (ADA अनुकूली के लिए खड़ा है),^[48] जो ऊपर वर्णित के रूप में उलटा डेटा वृद्धि का उपयोग करता है। यह शून्य से प्रारंभ करके प्रयुक्त किए गए डेटा संवर्द्धन की मात्रा को भी ट्यून करता है, और धीरे-धीरे इसे तब तक बढ़ाता है जब तक कि ओवरफिटिंग ह्यूरिस्टिक लक्ष्य स्तर तक नहीं पहुंच जाता, इस प्रकार अनुकूली नाम है।

स्टाइलगैन-3

स्टाइलगण-3^[52] बनावट चिपकाने की समस्या को हल करके स्टाइलगैन-2 में सुधार करता है, जिसे आधिकारिक वीडियो में देखा जा सकता है।^[53] उन्होंने निक्विस्ट-शैनन सैंपलिंग प्रमेय द्वारा समस्या का विश्लेषण किया, और तर्क दिया कि जनरेटर में परतें उन पिक्सेल में उच्च-आवृत्ति सिग्नल का लाभ उठाना सीखती हैं, जिन पर वे काम करते हैं।
इसे हल करने के लिए, उन्होंने प्रत्येक जनरेटर की परतों के बीच सख्त लो पास फिल्टर लगाने का प्रस्ताव दिया, जिससे जनरेटर को पिक्सेल पर तरह से संचालित करने के लिए मजबूर किया जा सके, जो निरंतर संकेतों का प्रतिनिधित्व करते हैं, अतिरिक्त उन पर केवल असतत संकेतों के संचालन के। उन्होंने और अधिक फ़िल्टर (सिग्नल प्रोसेसिंग) का उपयोग करके घूर्णी और अनुवादात्मक आक्रमण को प्रयुक्त किया। परिणामी स्टाइलगैन-3 बनावट से चिपकी समस्या को हल करने में सक्षम है, साथ ही ऐसी छवियां उत्पन्न करता है जो सरलता से घूमती हैं और अनुवाद करती हैं।

अनुप्रयोग

GAN एप्लिकेशन तीव्रता से बढ़े हैं।^[54]

फैशन, कला और विज्ञापन

यूएस कॉपीराइट कार्यालय का कहना है कि एआई अपनी कला को कॉपीराइट नहीं कर सकता है।^[55]
कला उत्पन्न करने के लिए जीएएन का उपयोग किया जा सकता है; कगार ने मार्च 2019 में लिखा था कि जीएएन द्वारा बनाई गई छवियां समकालीन एआई कला का परिभाषित रूप बन गई हैं।^[56] जीएएन का उपयोग चित्रों को पेंट करने के लिए भी किया जा सकता है^[57] या किसी मॉडल, फोटोग्राफर या मेकअप कलाकार को किराए पर लेने या स्टूडियो और परिवहन के लिए भुगतान करने की आवश्यकता के बिना काल्पनिक फैशन मॉडल की चित्र बनाएं।^[58] वर्चुअल शैडो जेनरेशन के लिए जीएएन का भी प्रयोग किया गया है।^[59]

इंटरएक्टिव मीडिया

2020 में, मनोवैज्ञानिक वेब हॉरर श्रृंखला बेन डूब दया की अगली कड़ी में मुख्य प्रतिपक्षी बनाने के लिए व्यापक कला का उपयोग किया गया था। लेखक बाद में स्वतंत्र कलाकारों के लिए संपत्ति उत्पन्न करने में सहायता करने की उनकी क्षमता के लिए जीएएन अनुप्रयोगों की प्रशंसा करने के लिए आगे बढ़ेंगे जो बजट और जनशक्ति पर कम हैं।^[60]^[61]

विज्ञान

जीएएन छवि बहाली खगोल फोटोग्राफी कर सकते हैं^[62] और डार्क मैटर रिसर्च के लिए गुरुत्वाकर्षण लेंस िंग का अनुकरण करें।^[63]^[64]^[65] उनका उपयोग 2019 में अंतरिक्ष में एक विशेष दिशा में गहरे द्रव्य के वितरण को सफलतापूर्वक मॉडल करने और गुरुत्वाकर्षण लेंसिंग की भविष्यवाणी करने के लिए किया गया था।^[66]^[67]
जीएएन को उच्च ऊर्जा जेट गठन के मॉडलिंग के तेज़ और सटीक विधि के रूप में प्रस्तावित किया गया है^[68] और कण भौतिकी के कैलोरीमीटर (कण भौतिकी) के माध्यम से कण बौछार की मॉडलिंग | उच्च-ऊर्जा भौतिकी प्रयोग।^[69]^[70]^[71]^[72] कण भौतिकी प्रयोगों के कम्प्यूटेशनल रूप से महंगे सिमुलेशन में जीएएन को सटीक रूप से अनुमानित अड़चनों के लिए प्रशिक्षित किया गया है। वर्तमान और प्रस्तावित सीईआरएन प्रयोगों के संदर्भ में अनुप्रयोगों ने सिमुलेशन में तीव्रता लाने और/या सिमुलेशन निष्ठा में सुधार के लिए इन विधियों की क्षमता का प्रदर्शन किया है।^[73]^[74]

वीडियो गेम

2018 में, छवि स्केलिंग की विधि के रूप में जीएएन मॉड (वीडियो गेमिंग) समुदाय तक पहुंच गया| उन्हें खेल के मूल संकल्प में फिट करने के लिए (परिणामों के साथ स्थानिक एंटी-अलियासिंग की सुपर सैंपलिंग विधि। एंटी-अलियासिंग)।^[75] उचित प्रशिक्षण के साथ, जीएएन मूल विवरण, रंग आदि के मूल स्तर को पूरी तरह से बनाए रखते हुए, मूल की तुलना में उच्च गुणवत्ता में स्पष्ट और तेज 2d बनावट छवि परिमाण प्रदान करते हैं। व्यापक जीएएन उपयोग के ज्ञात उदाहरणों में फाइनल फैंटेसी VIII, अंतिम काल्पनिक IX, रेजिडेंट सम्मिलित हैं। एविल (2002 वीडियो गेम) एचडी रेमास्टर, और मैक्स पायने है।

एआई उत्पन्न वीडियो

वीडियो के लिए आर्टिफिशियल इंटेलिजेंस कला टेक्स्ट-टू-वीडियो मॉडल के रूप में टेक्स्ट से वीडियो उत्पन्न करने के लिए एआई का उपयोग करता है।^[76]

ऑडियो संश्लेषण

दुर्भावनापूर्ण एप्लिकेशन के बारे में चिंताएं

Main article: डीपफेक

स्टाइलगैन द्वारा बनाई गई एक छवि जो भ्रामक रूप से वास्तविक व्यक्ति की चित्र की तरह दिखती है। यह चित्र स्टाइलगैन द्वारा पोर्ट्रेट के विश्लेषण के आधार पर तैयार किया गया था।

जनरेट किए गए पोर्ट्रेट का एक और उदाहरण
भयावह उद्देश्यों के लिए जीएएन-आधारित मानव छवि संश्लेषण के संभावित उपयोग के बारे में चिंता व्यक्त की गई है, उदाहरण के लिए, नकली, संभवतः आपत्तिजनक, चित्र और वीडियो बनाने के लिए^[77] नकली सोशल मीडिया प्रोफाइल के निर्माण को स्वचालित करने के लिए जीएएन का उपयोग उन लोगों की अद्वितीय, यथार्थवादी प्रोफ़ाइल फ़ोटो बनाने के लिए किया जा सकता है जो उपस्थित नहीं हैं।
डोयले, माइकल (May 16, 2019). "जॉन ब्यासली इवांसविले में सैडलहॉर्स ड्राइव पर रहते हैं। या वह करता है?". कूरियर और प्रेस.2019 में कैलिफोर्निया राज्य पर विचार किया गया
Targett, Ed (May 16, 2019). "कैलिफोर्निया डीपफेक पोर्नोग्राफी को अवैध बनाने के करीब पहुंच गया है". कंप्यूटर व्यवसाय की समीक्षा.और 3 अक्टूबर, 2019 को पारित बिल AB-602, जो मानव छवि संश्लेषण के उपयोग पर प्रतिबंध लगाता है। दर्शाए गए लोगों की सहमति के बिना नकली पोर्नोग्राफ़ी बनाने की तकनीकें, और बिल AB-730, जो किसी के हेरफेर किए गए वीडियो के वितरण पर रोक लगाता है चुनाव के 60 दिनों के भीतर राजनीतिक उम्मीदवार। दोनों विधेयक विधानसभा सदस्य मार्क बर्मन द्वारा लिखे गए थे और गवर्नर गेविन न्यूसम द्वारा हस्ताक्षरित थे। 2020 में नियम प्रयुक्त हुए।
मिहालसिक, कैरी (2019-10-04). "कैलिफोर्निया के कानून राजनीति और पोर्न में डीपफेक पर नकेल कसना चाहते हैं". cnet.com. सीएनईटी. Retrieved 2019-10-13.

डीएआरपीए का मीडिया फोरेंसिक कार्यक्रम नकली मीडिया का मुकाबला करने के विधियों का अध्ययन करता है, जिसमें जीएएन का उपयोग करके निर्मित नकली मीडिया भी सम्मिलित है।
के नाईट, विल (Aug 7, 2018). "रक्षा विभाग ने डीपफेक पकड़ने के लिए पहला उपकरण तैयार किया है". एमआईटी प्रौद्योगिकी समीक्षा.</ref>

सीखने को स्थानांतरित करें

स्टेट-ऑफ-आर्ट ट्रांसफर लर्निंग रिसर्च जीएएन का उपयोग अव्यक्त सुविधा स्थान के संरेखण को प्रयुक्त करने के लिए करता है, जैसे कि गहन सुदृढीकरण सीखने में।^[78] यह उस विवेचक को स्रोत और लक्ष्य कार्य के एम्बेडिंग को फीड करके काम करता है जो संदर्भ का अनुमान लगाने की कोशिश करता है। परिणामी हानि तब (उलटा) एनकोडर के माध्यम से वापस प्रचारित किया जाता है।

विविध अनुप्रयोग

जीएएन का उपयोग प्रारंभिक निदान में सहायता करने वाली ग्लूकोमैटस छवियों का पता लगाने के लिए किया जा सकता है जो आंशिक या कुल हानि से बचने के लिए आवश्यक है।
दृष्टि का^[79] जीएएन जो फोटोयथार्थवादी प्रतिपादन छवियों का उत्पादन करते हैं, का उपयोग आंतरिक डिजाइन, औद्योगिक डिजाइन, जूते, की कल्पना करने के लिए किया जा सकता है।^[80] बैग, और कपड़ों के सामान या पीसी गेम्स के दृश्यों के लिए आइटम। फेसबुक द्वारा ऐसे नेटवर्कों के उपयोग की सूचना मिली थी।^[81] मृत ऐतिहासिक आंकड़ों के फोरेंसिक चेहरे के पुनर्निर्माण के लिए जीएएन का प्रयोग किया गया है।^[82]
जीएएन कई छवियों से 3D पुनर्निर्माण कर सकते हैं,^[83] 3डी बिंदु बादलों के रूप में उपन्यास वस्तुओं को उत्पन्न करें,^[84] और वीडियो में गति के मॉडल पैटर्न^[85] जीएएन का उपयोग चेहरे की चित्रों को यह दिखाने के लिए किया जा सकता है कि किसी व्यक्ति की उपस्थिति उम्र के साथ कैसे बदल सकती है।^[86]
जीएएन का उपयोग नक्शों में अनुपलब्ध सुविधाओं को पेंट करने, मानचित्रकला में मानचित्र शैलियों को स्थानांतरित करने के लिए भी किया जा सकता है^[87] या सड़क दृश्य इमेजरी में वृद्धि करें^[88] जीएएन पर प्रासंगिक प्रतिक्रिया का उपयोग छवियों को उत्पन्न करने और छवि खोज प्रणालियों को बदलने के लिए किया जा सकता है।^[89]
गैर-रैखिक गतिशील प्रणालियों के लिए इष्टतम नियंत्रण इनपुट उत्पन्न करने के लिए नेटवर्क को प्रशिक्षित करने के लिए जीएएन की भिन्नता का उपयोग किया जाता है। जहां भेदभावपूर्ण नेटवर्क को एक आलोचक के रूप में जाना जाता है जो समाधान की इष्टतमता की जांच करता है और जनरेटिव नेटवर्क को अनुकूली नेटवर्क के रूप में जाना जाता है जो इष्टतम नियंत्रण उत्पन्न करता है। आलोचक और अनुकूली नेटवर्क एक दूसरे को एक गैर-रैखिक इष्टतम नियंत्रण का अनुमान लगाने के लिए प्रशिक्षित करते हैं।^[90]
विशिष्ट घरों पर जलवायु परिवर्तन के प्रभाव की कल्पना करने के लिए जीएएन का उपयोग किया गया है।^[91]
Speech2Face नामक एक जीएएन मॉडल किसी व्यक्ति की आवाज़ सुनने के बाद उसके चेहरे की एक छवि का पुनर्निर्माण कर सकता है।^[92]
2016 में जीएएन का उपयोग कैंसर, सूजन और फाइब्रोसिस में फंसे विभिन्न प्रकार के प्रोटीन लक्ष्यों के लिए नए अणु उत्पन्न करने के लिए किया गया था। 2019 में जीएएन-जनित अणुओं को प्रायोगिक रूप से चूहों में सभी तरह से मान्य किया गया था।^[93]^[94]
जबकि अधिकांश जीएएन एप्लिकेशन इमेज प्रोसेसिंग में हैं, समय-श्रृंखला डेटा के साथ भी काम किया गया है। उदाहरण के लिए, मशीन सीखने के लिए ऊर्जा डेटा उत्पन्न करने के लिए पुनरावर्ती जीएएन (R-जीएएन) का उपयोग किया गया है।^[95]

इतिहास

1991 में, जुएरगेन श्मिटुबर ने जनरेटिव और एडवर्सेरियल न्यूरल नेटवर्क प्रकाशित किए जो शून्य-राशि के खेल के रूप में एक दूसरे के साथ प्रतिस्पर्धा करते हैं, जहां एक नेटवर्क का लाभ दूसरे नेटवर्क का हानि होता है।^[96]^[97]^[98] पहला नेटवर्क प्रसंभाव्यता वाला एक जनरेटिव मॉडल है जो आउटपुट पैटर्न पर प्रायिकता वितरण को मॉडल करता है। दूसरा नेटवर्क इन पैटर्नों के लिए पर्यावरण की प्रतिक्रियाओं की भविष्यवाणी करने के लिए ग्रेडिएंट डिसेंट द्वारा सीखता है। इसे कृत्रिम जिज्ञासा कहा जाता था। आधुनिक जीएएन (2014) के लिए,^[3] पहले नेटवर्क का आउटपुट दिए गए सेट में है या नहीं, इसके आधार पर पर्यावरणीय प्रतिक्रिया 1 या 0 है।^[98]
अन्य लोगों के समान विचार थे लेकिन उन्हें समान रूप से विकसित नहीं किया। 2010 में ओली नीमिटालो द्वारा ब्लॉग पोस्ट में प्रतिकूल नेटवर्क से जुड़े एक विचार को प्रकाशित किया गया था।^[99] इस विचार को कभी प्रयुक्त नहीं किया गया था और इसमें जनरेटर में स्टोचैस्टिसिटी सम्मिलित नहीं थी और इस तरह यह एक जनरेटिव मॉडल नहीं था। इसे अब एक सशर्त जीएएन या cGAN के रूप में जाना जाता है।^[100] 2013 में ली, गौसी और ग्रॉस द्वारा जानवरों के व्यवहार को मॉडल करने के लिए जीएएन के समान एक विचार का प्रयोग किया गया था।^[101]
जीएएन के लिए एक अन्य प्रेरणा शोर-विपरीत अनुमान था,^[102] जो जीएएन के समान हानि फलन का उपयोग करता है और गुडफेलो ने 2010-2014 में पीएचडी के समय अध्ययन किया था।
प्रतिकूल मशीन लर्निंग के जनरेटिव मॉडलिंग के अतिरिक्त अन्य उपयोग हैं और इसे तंत्रिका नेटवर्क के अतिरिक्त अन्य मॉडलों पर प्रयुक्त किया जा सकता है। नियंत्रण सिद्धांत में, तंत्रिका नेटवर्क पर आधारित प्रतिकूल शिक्षा का उपयोग 2006 में एक गेम थ्योरिटिक अर्थ में मजबूत नियंत्रकों को प्रशिक्षित करने के लिए किया गया था, एक मिनिमाइज़र पॉलिसी, कंट्रोलर और एक मैक्सिमाइज़र पॉलिसी, गड़बड़ी के बीच पुनरावृत्तियों को वैकल्पिक करके।^[103]^[104]
2017 में, पिक्सेल-सटीकता के अतिरिक्त यथार्थवादी बनावट पर ध्यान केंद्रित करने वाली छवि वृद्धि के लिए एक जीएएन का उपयोग किया गया था, जो उच्च आवर्धन पर उच्च छवि गुणवत्ता का उत्पादन करता था।^[105] 2017 में, पहले चेहरे उत्पन्न हुए थे।^[106] इन्हें फरवरी 2018 में ग्रैंड पैलैस में प्रदर्शित किया गया था।^[107]^[108] स्टाइलगैन द्वारा उत्पन्न चेहरे^[109] 2019 में डीपफेक के साथ तुलना की।^[110]^[111] स्टाइल-आधारित जीएएन - यथार्थवादी कृत्रिम चेहरे बनाना और ट्यूनिंग करना होरेव, रानी (2018-12-26). "शैली-आधारित GAN - यथार्थवादी कृत्रिम चेहरे बनाना और ट्यूनिंग करना". Lyrn.AI. Archived from the original on November 5, 2020. Retrieved 2019-02-16.</ref>
2017 की प्रारंभ में, जीएएन प्रौद्योगिकी ने एक नए विकसित कार्यान्वयन की उपस्थिति के साथ ललित कला क्षेत्र में अपनी उपस्थिति महसूस करना प्रारंभ कर दिया था, जिसके बारे में कहा जाता था कि वह अद्वितीय और आकर्षक अमूर्त चित्रों को उत्पन्न करने में सक्षम होने की दहलीज को पार कर गया था, और इस प्रकार एक कैन को डब किया गया था। रचनात्मक विरोधात्मक नेटवर्क के लिए।
क्रिएटिव प्रतिकूल नेटवर्क्स, स्टाइल्स के बारे में सीखकर और स्टाइल नॉर्म्स से हटकर "कला" उत्पन्न करना 2018 की पेंटिंग एडमंड डी बेलामी को बनाने के लिए जीएएन प्रणाली का उपयोग किया गया था, जो US$432,500 में बिकी की एआई कला $432,500 में बिकती है मूल कैन टीम के सदस्यों द्वारा 2019 के आरंभिक लेख में उस प्रणाली के साथ आगे की प्रगति पर चर्चा की गई, और एआई-सक्षम कला के लिए समग्र संभावनाओं पर भी विचार किया गया।
मई 2019 में, सैमसंग के शोधकर्ताओं ने एक जीएएन-आधारित प्रणाली का प्रदर्शन किया, जो उस व्यक्ति की केवल एक चित्र को देखते हुए बोलने वाले व्यक्ति के वीडियो बनाती है।
कुलप, पैट्रिक (May 23, 2019). "सैमसंग की एआई लैब सिंगल हेडशॉट से फेक वीडियो फुटेज बना सकती है". विज्ञापन सप्ताह.
अगस्त 2019 में, सशर्तजीएएन-LSTM (GitHub पर स्रोतों का संदर्भ लें का उपयोग करके गीत से न्यूरल मेलोडी जनरेशन के लिए पेयर लिरिक्स और मेलोडी अलाइनमेंट के साथ 12,197 MIDI गानों वाला एक बड़ा डेटासेट बनाया गया था। -कंडीशन्ड-न्यूरल-मेलोडी-जेनरेशन एआई मेलोडी जेनरेशन लिरिक्स)।
यु, Yi; कैनेलेस, साइमन (2021). "लिरिक्स से मेलोडी जनरेशन के लिए सशर्त LSTM-GAN". मल्टीमीडिया कम्प्यूटिंग, संचार और अनुप्रयोगों पर एसीएम लेनदेन. 17: 1–20. arXiv:1908.05551. doi:10.1145/3424116. ISSN 1551-6857. S2CID 199668828.
मई 2020 में, एनवीडिया के शोधकर्ताओं ने पीएसी-मैन के खेल को केवल खेलते हुए देखकर उसे फिर से बनाने के लिए एक एआई प्रणाली (जिसे गेमगैन कहा जाता है) सिखाया।
"एनवीडिया का एआई पीएसी-मैन को शुरू से ही बजाते हुए देख कर उसे फिर से तैयार करता है". द वर्ज. 2020-05-22.^[112]

संदर्भ

↑ https://pub.towardsai.net/generative-ai-and-future-c3b1695876f2

↑ https://www.computer.org/csdl/magazine/co/2022/10/09903869/1H0G6xvtREk

↑ ^{Jump up to: 3.0} ^3.1 ^3.2 ^3.3 ^3.4 ^3.5 ^3.6 ^3.7 ^3.8 ^3.9 Goodfellow, Ian; Pouget-Abadie, Jean; Mirza, Mehdi; Xu, Bing; Warde-Farley, David; Ozair, Sherjil; Courville, Aaron; Bengio, Yoshua (2014). जनरेटिव एडवरसैरियल नेट्स (PDF). Proceedings of the International Conference on Neural Information Processing Systems (NIPS 2014). pp. 2672–2680.

↑ Salimans, Tim; Goodfellow, Ian; Zaremba, Wojciech; Cheung, Vicki; Radford, Alec; Chen, Xi (2016). "GAN के प्रशिक्षण के लिए बेहतर तकनीकें". arXiv:1606.03498 [cs.LG].

↑ Luc, Pauline; Couprie, Camille; Chintala, Soumith; Verbeek, Jakob (2016-11-25). "एडवरसैरियल नेटवर्क का उपयोग करते हुए सिमेंटिक सेगमेंटेशन". NIPS Workshop on Adversarial Training, Dec, Barcelona, Spain. 2016. arXiv:1611.08408.

↑ {{citation |author1=Andrej Karpathy |title=Generative Models |url=https://openai.com/blog/generative-models/ |publisher=OpenAI |access-date=April 7, 2016 |author2=Pieter Abbeel |author3=Greg Brockman |author4=Peter Chen |author5=Vicki Cheung |author6=Rocky Duan |author7=Ian Goodfellow |author8=Durk Kingma |author9=Jonathan Ho |author-link1=Andrej Karpathy |author-link2=Pieter Abbeel |author10=Rein Houthooft |author11=Tim Salimans |author12=John Schulman |author13=Ilya Sutskever |author14=Wojciech Zaremba}

↑ Mohamed, Shakir; Lakshminarayanan, Balaji (2016). "निहित जनरेटिव मॉडल में सीखना". arXiv:1610.03483 [stat.ML].

↑ ^{Jump up to: 8.0} ^8.1 Goodfellow, Ian (2017-04-03). "NIPS 2016 Tutorial: Generative Adversarial Networks". arXiv:1701.00160 [cs.LG].

↑ Kingma, Diederik P.; Welling, Max (2014-05-01). "ऑटो-एन्कोडिंग वेरिएशनल बेज़". arXiv:1312.6114 [stat.ML].

↑ Rezende, Danilo Jimenez; Mohamed, Shakir; Wierstra, Daan (2014-06-18). "डीप जनरेटिव मॉडल में स्टोचैस्टिक बैकप्रोपैजेशन और अनुमानित अनुमान". International Conference on Machine Learning (in English). PMLR: 1278–1286. arXiv:1401.4082.

↑ ^{Jump up to: 11.0} ^11.1 Farnia, Farzan; Ozdaglar, Asuman (2020-11-21). "Do GANs always have Nash equilibria?". International Conference on Machine Learning (in English). PMLR: 3029–3039.

↑ ^{Jump up to: 12.0} ^12.1 ^12.2 Weng, Lilian (2019-04-18). "GAN से WGAN तक". arXiv:1904.08994 [cs.LG].

↑ ^{Jump up to: 13.0} ^13.1 ^13.2 Karras, Tero; Aila, Timo; Laine, Samuli; Lehtinen, Jaakko (2017-10-01). "बेहतर गुणवत्ता, स्थिरता और भिन्नता के लिए जीएएन का प्रगतिशील विकास". arXiv:1710.10196 [cs.NE].

↑ Soviany, Petru; Ardei, Claudiu; Ionescu, Radu Tudor; Leordeanu, Marius (2019-10-22). "जनरेटिव एडवरसैरियल नेटवर्क्स (CuGAN) के लिए छवि कठिनाई पाठ्यक्रम". arXiv:1910.08967 [cs.LG].

↑ Hacohen, Guy; Weinshall, Daphna (2019-05-24). "डीप नेटवर्क्स के प्रशिक्षण में पाठ्यचर्या सीखने की शक्ति पर". International Conference on Machine Learning (in English). PMLR: 2535–2544. arXiv:1904.03626.

↑ "r/MachineLearning - Comment by u/ian_goodfellow on "[R] [1701.07875] Wasserstein GAN". reddit (in English). January 30, 2017. Retrieved 2022-07-15.

↑ Lin, Zinan; et al. (December 2018). PacGAN: the power of two samples in generative adversarial networks. 32nd International Conference on Neural Information Processing Systems. pp. 1505–1514. arXiv:1712.04086.

↑ Mescheder, Lars; Geiger, Andreas; Nowozin, Sebastian (2018-07-31). "Which Training Methods for GANs do actually Converge?". arXiv:1801.04406 [cs.LG].

↑ ^{Jump up to: 19.0} ^19.1 Brock, Andrew; Donahue, Jeff; Simonyan, Karen (2018-09-01). उच्च निष्ठा प्राकृतिक छवि संश्लेषण के लिए बड़े पैमाने पर GAN प्रशिक्षण. International Conference on Learning Representations 2019. arXiv:1809.11096.

↑ Heusel, Martin; Ramsauer, Hubert; Unterthiner, Thomas; Nessler, Bernhard; Hochreiter, Sepp (2017). "दो टाइम-स्केल अपडेट नियम द्वारा प्रशिक्षित गण स्थानीय नैश इक्विलिब्रियम में अभिसरण करते हैं". Advances in Neural Information Processing Systems. Curran Associates, Inc. 30. arXiv:1706.08500.

↑ Kingma, Diederik P.; Ba, Jimmy (2017-01-29). "Adam: A Method for Stochastic Optimization". arXiv:1412.6980 [cs.LG].

↑ Zhang, Richard; Isola, Phillip; Efros, Alexei A.; Shechtman, Eli; Wang, Oliver (2018). "एक अवधारणात्मक मीट्रिक के रूप में गहरी विशेषताओं की अनुचित प्रभावशीलता". pp. 586–595. arXiv:1801.03924 [cs.CV].

↑ Borji, Ali (2019-02-01). "जीएएन मूल्यांकन उपायों के पक्ष और विपक्ष". Computer Vision and Image Understanding (in English). 179: 41–65. arXiv:1802.03446. doi:10.1016/j.cviu.2018.10.009. ISSN 1077-3142. S2CID 3627712.

↑ Hindupur, Avinash (2022-07-15), The GAN Zoo, retrieved 2022-07-15

↑ Odena, Augustus; Olah, Christopher; Shlens, Jonathon (2017-07-17). "सहायक वर्गीकारक GANs के साथ सशर्त छवि संश्लेषण". International Conference on Machine Learning (in English). PMLR: 2642–2651. arXiv:1610.09585.

↑ Radford, Alec; Metz, Luke; Chintala, Soumith (2016). "डीप कन्वोल्यूशनल जनरेटिव एडवरसैरियल नेटवर्क्स के साथ अनसुपरवाइज्ड रिप्रेजेंटेशन लर्निंग". ICLR. S2CID 11758569.

↑ Long, Jonathan; Shelhamer, Evan; Darrell, Trevor (2015). "सिमेंटिक सेगमेंटेशन के लिए पूरी तरह से कनवॉल्यूशनल नेटवर्क". CVF: 3431–3440.

↑ Zhang, Han; Goodfellow, Ian; Metaxas, Dimitris; Odena, Augustus (2019-05-24). "सेल्फ-अटेंशन जनरेटिव एडवरसैरियल नेटवर्क". International Conference on Machine Learning (in English). PMLR: 7354–7363.

↑ Larsen, Anders Boesen Lindbo; Sønderby, Søren Kaae; Larochelle, Hugo; Winther, Ole (2016-06-11). "एक सीखी हुई समानता मीट्रिक का उपयोग करके पिक्सेल से परे ऑटोएन्कोडिंग". International Conference on Machine Learning (in English). PMLR: 1558–1566. arXiv:1512.09300.

↑ Jiang, Yifan; Chang, Shiyu; Wang, Zhangyang (2021-12-08). "TransGAN: Two Pure Transformers Can Make One Strong GAN, and That Can Scale Up". arXiv:2102.07074 [cs.CV].

↑ Grover, Aditya; Dhar, Manik; Ermon, Stefano (2017-05-01). "Flow-GAN: Combining Maximum Likelihood and Adversarial Learning in Generative Models". arXiv:1705.08868 [cs.LG].

↑ Arjovsky, Martin; Bottou, Léon (2017-01-01). "जनरेटिव एडवरसैरियल नेटवर्क्स के प्रशिक्षण के लिए सैद्धांतिक तरीकों की ओर". arXiv:1701.04862 [stat.ML].

↑ Goodfellow, Ian J. (2014-12-01). "जनरेटिव मॉडल का अनुमान लगाने के लिए अलग-अलग मानदंडों पर". arXiv:1412.6515 [stat.ML].

↑ Goodfellow, Ian (2016-08-31). "जनरेटिव एडवरसैरियल नेटवर्क्स (GANs), बर्कले आर्टिफिशियल इंटेलिजेंस लैब में प्रस्तुति" (PDF). Archived (PDF) from the original on 8 May 2022.

↑ Lim, Jae Hyun; Ye, Jong Chul (2017-05-08). "ज्यामितीय गण". arXiv:1705.02894 [stat.ML].

↑ Mao, Xudong; Li, Qing; Xie, Haoran; Lau, Raymond Y. K.; Wang, Zhen; Paul Smolley, Stephen (2017). "कम से कम वर्ग जनरेटिव एडवरसैरियल नेटवर्क": 2794–2802. {{cite journal}}: Cite journal requires |journal= (help)

↑ Makhzani, Alireza; Shlens, Jonathon; Jaitly, Navdeep; Goodfellow, Ian; Frey, Brendan (2016). "एडवरसैरियल ऑटोएन्कोडर्स". arXiv:1511.05644 [cs.LG].

↑ Barber, David; Agakov, Felix (2003-12-09). "The IM algorithm: a variational approach to Information Maximization". Proceedings of the 16th International Conference on Neural Information Processing Systems. NIPS'03. Cambridge, MA, USA: MIT Press: 201–208.

↑ Chen, Xi; Duan, Yan; Houthooft, Rein; Schulman, John; Sutskever, Ilya; Abbeel, Pieter (2016). "InfoGAN: Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets". Advances in Neural Information Processing Systems. Curran Associates, Inc. 29. arXiv:1606.03657.

↑ Donahue, Jeff; Krähenbühl, Philipp; Darrell, Trevor (2016). "एडवरसैरियल फीचर लर्निंग". arXiv:1605.09782 [cs.LG].

↑ Dumoulin, Vincent; Belghazi, Ishmael; Poole, Ben; Mastropietro, Olivier; Arjovsky, Alex; Courville, Aaron (2016). "प्रतिकूल रूप से सीखा अनुमान". arXiv:1606.00704 [stat.ML].

↑ Xi Chen; Yan Duan; Rein Houthooft; John Schulman; Ilya Sutskever; Pieter Abeel (2016). "InfoGAN: Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets". arXiv:1606.03657 [cs.LG].

↑ Zhirui Zhang; Shujie Liu; Mu Li; Ming Zhou; Enhong Chen (October 2018). "तंत्रिका मशीन अनुवाद के लिए द्विदिश जनरेटिव एडवरसैरियल नेटवर्क" (PDF). pp. 190–199.

↑ Zhu, Jun-Yan; Park, Taesung; Isola, Phillip; Efros, Alexei A. (2017). "अयुग्मित इमेज-टू-इमेज ट्रांसलेशन साइकिल-कंसिस्टेंट एडवरसैरियल नेटवर्क का उपयोग करना". pp. 2223–2232. arXiv:1703.10593 [cs.CV].

↑ Isola, Phillip; Zhu, Jun-Yan; Zhou, Tinghui; Efros, Alexei A. (2017). "सशर्त प्रतिकूल नेटवर्क के साथ इमेज-टू-इमेज अनुवाद". pp. 1125–1134. arXiv:1611.07004 [cs.CV].

↑ Brownlee, Jason (2019-08-22). "बिग जनरेटिव एडवरसैरियल नेटवर्क बिगगैन का एक सौम्य परिचय". Machine Learning Mastery (in English). Retrieved 2022-07-15.

↑ Shengyu, Zhao; Zhijian, Liu; Ji, Lin; Jun-Yan, Zhu; Song, Han (2020). "डेटा-कुशल GAN प्रशिक्षण के लिए भिन्नात्मक वृद्धि". Advances in Neural Information Processing Systems (in English). 33. arXiv:2006.10738.

↑ ^{Jump up to: 48.0} ^48.1 ^48.2 Tero, Karras; Miika, Aittala; Janne, Hellsten; Samuli, Laine; Jaakko, Lehtinen; Timo, Aila (2020). "सीमित डेटा के साथ जनरेटिव एडवरसैरियल नेटवर्क का प्रशिक्षण". Advances in Neural Information Processing Systems (in English). 33.

↑ Shaham, Tamar Rott; Dekel, Tali; Michaeli, Tomer (October 2019). "SinGAN: Learning a Generative Model From a Single Natural Image". 2019 IEEE/CVF International Conference on Computer Vision (ICCV). IEEE: 4569–4579. arXiv:1905.01164. doi:10.1109/iccv.2019.00467. ISBN 978-1-7281-4803-8. S2CID 145052179.

↑ Karras, Tero; Laine, Samuli; Aila, Timo (June 2019). "जनरेटिव एडवरसैरियल नेटवर्क्स के लिए एक स्टाइल-आधारित जेनरेटर आर्किटेक्चर". 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). IEEE: 4396–4405. arXiv:1812.04948. doi:10.1109/cvpr.2019.00453. ISBN 978-1-7281-3293-8. S2CID 54482423.

↑ Karras, Tero; Laine, Samuli; Aittala, Miika; Hellsten, Janne; Lehtinen, Jaakko; Aila, Timo (June 2020). "StyleGAN की छवि गुणवत्ता का विश्लेषण और सुधार". 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). IEEE: 8107–8116. arXiv:1912.04958. doi:10.1109/cvpr42600.2020.00813. ISBN 978-1-7281-7168-5. S2CID 209202273.

↑ Timo, Karras, Tero Aittala, Miika Laine, Samuli Härkönen, Erik Hellsten, Janne Lehtinen, Jaakko Aila (2021-06-23). अलियास-फ्री जनरेटिव एडवरसैरियल नेटवर्क. OCLC 1269560084.{{cite book}}: CS1 maint: multiple names: authors list (link)

↑ Karras, Tero; Aittala, Miika; Laine, Samuli; Härkönen, Erik; Hellsten, Janne; Lehtinen, Jaakko; Aila, Timo. "Alias-Free Generative Adversarial Networks (StyleGAN3)". nvlabs.github.io. Retrieved 2022-07-16.

↑ Caesar, Holger (2019-03-01), A list of papers on Generative Adversarial (Neural) Networks: nightrome/really-awesome-gan, retrieved 2019-03-02

↑ Robertson, Adi (2022-02-21). "यूएस कॉपीराइट कार्यालय का कहना है कि एआई अपनी कला को कॉपीराइट नहीं कर सकता है". The Verge (in English). Retrieved 2022-02-24.

↑ Vincent, James (5 March 2019). "एआई कला की कभी न खत्म होने वाली धारा नीलामी के लिए जाती है". The Verge (in English). Retrieved 13 June 2020.

↑ Yu, Jiahui, et al. "Generative image inpainting with contextual attention." Proceedings of the IEEE conference on computer vision and pattern recognition. 2018.

↑ Wong, Ceecee. "एआई सुपरमॉडल्स का उदय". CDO Trends.

↑ Taif, K.; Ugail, H.; Mehmood, I. (2020). "जनरेटिव एडवरसैरियल नेटवर्क का उपयोग करके कास्ट शैडो जेनरेशन". Computational Science – Iccs 2020. Lecture Notes in Computer Science. 12141: 481–495. doi:10.1007/978-3-030-50426-7_36. ISBN 978-3-030-50425-0. PMC 7302543.

↑ Allen, Eric Van (2020-07-08). "एक कुख्यात Zelda Creepypasta Saga अपने समापन को तैयार करने के लिए आर्टिफिशियल इंटेलिजेंस का उपयोग कर रहा है". USgamer (in English). Retrieved 2022-11-07.

↑ arcadeattack (2020-09-28). "Arcade Attack Podcast – September (4 of 4) 2020 - Alex Hall (Ben Drowned) - Interview". Arcade Attack (in British English). Retrieved 2022-11-07.

↑ Schawinski, Kevin; Zhang, Ce; Zhang, Hantian; Fowler, Lucas; Santhanam, Gokula Krishnan (2017-02-01). "जनरेटिव एडवरसैरियल नेटवर्क, डिकॉन्वोल्यूशन सीमा से परे आकाशगंगाओं की एस्ट्रोफिजिकल छवियों में सुविधाओं को पुनर्प्राप्त करते हैं". Monthly Notices of the Royal Astronomical Society: Letters. 467 (1): L110–L114. arXiv:1702.00403. Bibcode:2017MNRAS.467L.110S. doi:10.1093/mnrasl/slx008. S2CID 7213940.

↑ Kincade, Kathy. "शोधकर्ता डार्क मैटर का अध्ययन करने के लिए एक तंत्रिका नेटवर्क को प्रशिक्षित करते हैं". R&D Magazine.

↑ Kincade, Kathy (May 16, 2019). "CosmoGAN: Training a neural network to study dark matter". Phys.org.

↑ "डार्क मैटर का अध्ययन करने के लिए तंत्रिका नेटवर्क को प्रशिक्षित करना". Science Daily. May 16, 2019.

↑ at 06:13, Katyanna Quach 20 May 2019. "Cosmoboffins आसान तरीके से डार्क मैटर मैप बनाने के लिए तंत्रिका नेटवर्क का उपयोग करते हैं". www.theregister.co.uk (in English). Retrieved 2019-05-20.

↑ Mustafa, Mustafa; Bard, Deborah; Bhimji, Wahid; Lukić, Zarija; Al-Rfou, Rami; Kratochvil, Jan M. (2019-05-06). "CosmoGAN: creating high-fidelity weak lensing convergence maps using Generative Adversarial Networks". Computational Astrophysics and Cosmology. 6 (1): 1. arXiv:1706.02390. Bibcode:2019ComAC...6....1M. doi:10.1186/s40668-019-0029-9. ISSN 2197-7909. S2CID 126034204.

↑ Paganini, Michela; de Oliveira, Luke; Nachman, Benjamin (2017). "Learning Particle Physics by Example: Location-Aware Generative Adversarial Networks for Physics Synthesis". Computing and Software for Big Science. 1: 4. arXiv:1701.05927. Bibcode:2017arXiv170105927D. doi:10.1007/s41781-017-0004-6. S2CID 88514467.

↑ Paganini, Michela; de Oliveira, Luke; Nachman, Benjamin (2018). "Accelerating Science with Generative Adversarial Networks: An Application to 3D Particle Showers in Multi-Layer Calorimeters". Physical Review Letters. 120 (4): 042003. arXiv:1705.02355. Bibcode:2018PhRvL.120d2003P. doi:10.1103/PhysRevLett.120.042003. PMID 29437460. S2CID 3330974.

↑ Paganini, Michela; de Oliveira, Luke; Nachman, Benjamin (2018). "CaloGAN: Simulating 3D High Energy Particle Showers in Multi-Layer Electromagnetic Calorimeters with Generative Adversarial Networks". Phys. Rev. D. 97 (1): 014021. arXiv:1712.10321. Bibcode:2018PhRvD..97a4021P. doi:10.1103/PhysRevD.97.014021. S2CID 41265836.

↑ Erdmann, Martin; Glombitza, Jonas; Quast, Thorben (2019). "वैसरस्टीन जनरेटिव एडवरसैरियल नेटवर्क का उपयोग करके विद्युत चुम्बकीय कैलोरीमीटर वर्षा का सटीक अनुकरण". Computing and Software for Big Science. 3: 4. arXiv:1807.01954. doi:10.1007/s41781-018-0019-7. S2CID 54216502.

↑ Musella, Pasquale; Pandolfi, Francesco (2018). "जनरेटिव एडवरसैरियल नेटवर्क का उपयोग करके पार्टिकल डिटेक्टरों का तेज़ और सटीक अनुकरण". Computing and Software for Big Science. 2: 8. arXiv:1805.00850. Bibcode:2018arXiv180500850M. doi:10.1007/s41781-018-0015-y. S2CID 119474793.

↑ "एटलस में तेज शावर सिमुलेशन के लिए गहन जनरेटिव मॉडल". 2018.

↑ SHiP, Collaboration (2019). "जनरेटिव एडवरसैरियल नेटवर्क्स का उपयोग करके SHiP प्रयोग में निर्मित म्यूऑन का तेज़ अनुकरण". Journal of Instrumentation. 14 (11): P11028. arXiv:1909.04451. Bibcode:2019JInst..14P1028A. doi:10.1088/1748-0221/14/11/P11028. S2CID 202542604.

↑ Tang, Xiaoou; Qiao, Yu; Loy, Chen Change; Dong, Chao; Liu, Yihao; Gu, Jinjin; Wu, Shixiang; Yu, Ke; Wang, Xintao (2018-09-01). "ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks" (in English). arXiv:1809.00219. Bibcode:2018arXiv180900219W.

↑ Narain, Rohit (2021-12-29). "डीप न्यूरल नेटवर्क का उपयोग करके टेक्स्ट से स्मार्ट वीडियो जेनरेशन" (in English). Retrieved 2022-10-13.

↑ msmash (2019-02-14). "'यह व्यक्ति अस्तित्व में नहीं है' वेबसाइट एआई का उपयोग यथार्थवादी लेकिन भयानक चेहरे बनाने के लिए करती है". Slashdot. Retrieved 2019-02-16.

↑ Li, Bonnie; François-Lavet, Vincent; Doan, Thang; Pineau, Joelle (2021-02-14). "डोमेन एडवरसैरियल रीइन्फोर्समेंट लर्निंग". arXiv:2102.07097 [cs.LG].

↑ Bisneto, Tomaz Ribeiro Viana; de Carvalho Filho, Antonio Oseas; Magalhães, Deborah Maria Vieira (February 2020). "स्वचालित ग्लूकोमा का पता लगाने के लिए जनरेटिव प्रतिकूल नेटवर्क और बनावट सुविधाएँ लागू होती हैं". Applied Soft Computing. 90: 106165. doi:10.1016/j.asoc.2020.106165. S2CID 214571484.

↑ Wei, Jerry (2019-07-03). "मशीन लर्निंग के साथ जूता डिजाइन तैयार करना". Medium (in English). Retrieved 2019-11-06.

↑ Greenemeier, Larry (June 20, 2016). "When Will Computers Have Common Sense? Ask Facebook". Scientific American. Retrieved July 31, 2016.

↑ Reconstruction of the Roman Emperors: Interview with Daniel Voshart (in English), retrieved 2022-06-03

↑ "3D Generative Adversarial Network". 3dgan.csail.mit.edu.

↑ Achlioptas, Panos; Diamanti, Olga; Mitliagkas, Ioannis; Guibas, Leonidas (2018). "Learning Representations and Generative Models for 3D Point Clouds". arXiv:1707.02392 [cs.CV].

↑ Vondrick, Carl; Pirsiavash, Hamed; Torralba, Antonio (2016). "सीन डायनामिक्स के साथ वीडियो बनाना". carlvondrick.com. arXiv:1609.02612. Bibcode:2016arXiv160902612V.

↑ Antipov, Grigory; Baccouche, Moez; Dugelay, Jean-Luc (2017). "कंडिशनल जनरेटिव एडवरसैरियल नेटवर्क्स के साथ फेस एजिंग". arXiv:1702.01983 [cs.CV].

↑ Kang, Yuhao; Gao, Song; Roth, Rob (2019). "जनरेटिव एडवरसैरियल नेटवर्क का उपयोग करके मल्टीस्केल मैप स्टाइल्स को स्थानांतरित करना". International Journal of Cartography. 5 (2–3): 115–141. arXiv:1905.02200. Bibcode:2019arXiv190502200K. doi:10.1080/23729333.2019.1615729. S2CID 146808465.

↑ Wijnands, Jasper; Nice, Kerry; Thompson, Jason; Zhao, Haifeng; Stevenson, Mark (2019). "Streetscape augmentation using generative adversarial networks: Insights related to health and wellbeing". Sustainable Cities and Society. 49: 101602. arXiv:1905.06464. Bibcode:2019arXiv190506464W. doi:10.1016/j.scs.2019.101602. S2CID 155100183.

↑ Ukkonen, Antti; Joona, Pyry; Ruotsalo, Tuukka (2020). "Generating Images Instead of Retrieving Them: Relevance Feedback on Generative Adversarial Networks". Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval: 1329–1338. doi:10.1145/3397271.3401129. hdl:10138/328471. ISBN 9781450380164. S2CID 220730163.

↑ Padhi, Radhakant; Unnikrishnan, Nishant (2006). "गैर-रैखिक प्रणालियों के एक वर्ग के लिए इष्टतम नियंत्रण संश्लेषण के लिए एक एकल नेटवर्क अनुकूली आलोचक (SNAC) वास्तुकला". Neural Networks. 19 (10): 1648–1660. doi:10.1016/j.neunet.2006.08.010. PMID 17045458.

↑ "एआई हमें जलवायु परिवर्तन के कहर दिखा सकता है". MIT Technology Review. May 16, 2019.

↑ Christian, Jon (May 28, 2019). "अस्टाउंडिंग एआई आपकी आवाज के आधार पर अनुमान लगाता है कि आप कैसे दिखते हैं". Futurism.

↑ Zhavoronkov, Alex (2019). "डीप लर्निंग शक्तिशाली DDR1 किनेज अवरोधकों की तेजी से पहचान को सक्षम बनाता है". Nature Biotechnology. 37 (9): 1038–1040. doi:10.1038/s41587-019-0224-x. PMID 31477924. S2CID 201716327.

↑ Barber, Gregory. "एआई द्वारा डिज़ाइन किया गया एक अणु "ड्रगलाइक" गुणों को प्रदर्शित करता है". Wired.

↑ Mohammad Navid Fekri; Ananda Mohon Ghosh; Katarina Grolinger (2020). "आवर्ती जनरेटिव एडवरसैरियल नेटवर्क के साथ मशीन लर्निंग के लिए ऊर्जा डेटा उत्पन्न करना". Energies. 13 (1): 130. doi:10.3390/en13010130.

↑ Schmidhuber, Jürgen (1991). "मॉडल-निर्माण तंत्रिका नियंत्रकों में जिज्ञासा और ऊब को लागू करने की संभावना". Proc. SAB'1991. MIT Press/Bradford Books. pp. 222–227.

↑ Schmidhuber, Jürgen (2010). "Formal Theory of Creativity, Fun, and Intrinsic Motivation (1990-2010)". IEEE Transactions on Autonomous Mental Development. 2 (3): 230–247. doi:10.1109/TAMD.2010.2056368. S2CID 234198.

↑ ^{Jump up to: 98.0} ^98.1 Schmidhuber, Jürgen (2020). "Generative Adversarial Networks are Special Cases of Artificial Curiosity (1990) and also Closely Related to Predictability Minimization (1991)". Neural Networks (in English). 127: 58–66. arXiv:1906.04493. doi:10.1016/j.neunet.2020.04.008. PMID 32334341. S2CID 216056336.

↑ Niemitalo, Olli (February 24, 2010). "A method for training artificial neural networks to generate missing data within a variable context". Internet Archive (Wayback Machine). Archived from the original on March 12, 2012. Retrieved February 22, 2019.

↑ "GANs were invented in 2010?". reddit r/MachineLearning (in English). 2019. Retrieved 2019-05-28.

↑ Li, Wei; Gauci, Melvin; Gross, Roderich (July 6, 2013). "Proceeding of the fifteenth annual conference on Genetic and evolutionary computation conference - GECCO '13". Proceedings of the 15th Annual Conference on Genetic and Evolutionary Computation (GECCO 2013). Amsterdam, The Netherlands: ACM. pp. 223–230. doi:10.1145/2463372.2465801. ISBN 9781450319638.

↑ Gutmann, Michael; Hyvärinen, Aapo. "शोर-विपरीत अनुमान" (PDF). International Conference on AI and Statistics.

↑ Abu-Khalaf, Murad; Lewis, Frank L.; Huang, Jie (July 1, 2008). "विवश नियंत्रण प्रणालियों के लिए न्यूरोडायनामिक प्रोग्रामिंग और जीरो-सम गेम्स". IEEE Transactions on Neural Networks. 19 (7): 1243–1252. doi:10.1109/TNN.2008.2000204. S2CID 15680448.

↑ Abu-Khalaf, Murad; Lewis, Frank L.; Huang, Jie (December 1, 2006). "Policy Iterations on the Hamilton–Jacobi–Isaacs Equation for H_∞ State Feedback Control With Input Saturation". IEEE Transactions on Automatic Control. doi:10.1109/TAC.2006.884959. S2CID 1338976.

↑ Sajjadi, Mehdi S. M.; Schölkopf, Bernhard; Hirsch, Michael (2016-12-23). "EnhanceNet: Single Image Super-Resolution Through Automated Texture Synthesis". arXiv:1612.07919 [cs.CV].

↑ "This Person Does Not Exist: Neither Will Anything Eventually with AI". March 20, 2019.

↑ "आर्टिफिशियल इंटेलिजेंस कला के इतिहास में प्रवेश करता है". December 28, 2018.

↑ Tom Février (2019-02-17). "कृत्रिम बुद्धि घोटाला".

↑ "StyleGAN: Official TensorFlow Implementation". March 2, 2019 – via GitHub.

↑ Paez, Danny (2019-02-13). "This Person Does Not Exist Is the Best One-Off Website of 2019". Retrieved 2019-02-16.

↑ Beschizza, Rob (2019-02-15). "यह व्यक्ति मौजूद नहीं है". Boing-Boing. Retrieved 2019-02-16.

↑ Seung Wook Kim; Zhou, Yuhao; Philion, Jonah; Torralba, Antonio; Fidler, Sanja (2020). "GameGAN के साथ गतिशील वातावरण का अनुकरण करना सीखना". arXiv:2005.12126 [cs.CV].

बाहरी संबंध

Knight, Will. "5 Big Predictions for Artificial Intelligence in 2017". MIT Technology Review. Retrieved 2017-01-05.

Karras, Tero; Laine, Samuli; Aila, Timo (2018). "A Style-Based Generator Architecture for Generative Adversarial Networks". arXiv:1812.04948 [cs.NE].

This Person Does Not Exist – photorealistic images of people who do not exist, generated by स्टाइलगैन

This Cat Does Not Exist – photorealistic images of cats who do not exist, generated by स्टाइलगैन

Wang, Zhengwei; She, Qi; Ward, Tomas E. (2019). "Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy". arXiv:1906.01529 [cs.LG].

v
t
e
Differentiable computing
General

Differentiable programming

Information geometry

Statistical manifold

Neural Turing machine

Differentiable neural computer

Automatic differentiation

Neuromorphic engineering

Cable theory

Pattern recognition

Tensor calculus

Computational learning theory

Concepts

Gradient descent
SGD

Clustering

Regression
Overfitting

Adversary

Attention

Convolution

Loss functions

Backpropagation

Normalization

Activation
Softmax

Sigmoid

Rectifier

Regularization

Datasets
Augmentation

Diffusion

Autoregression

Programming languages

Python

Julia

Application

Machine learning

Artificial neural network
Deep learning

Scientific computing

Artificial Intelligence

Hardware

IPU

TPU

VPU

Memristor

SpiNNaker

Software library

TensorFlow

PyTorch

Keras

Theano

Implementation
Audio–visual

AlexNet

WaveNet

Human image synthesis

HWR

OCR

Speech synthesis

Speech recognition

Facial recognition

AlphaFold

DALL-E

Verbal

Word2vec

Transformer

BERT

LaMDA

NMT

Project Debater

IBM Watson

GPT-2

GPT-3

Decisional

AlphaGo

AlphaZero

Q-learning

SARSA

OpenAI Five

Self-driving car

MuZero

Action selection

Robot control

People

Alex Graves

Ian Goodfellow

Yoshua Bengio

Geoffrey Hinton

Yann LeCun

Andrew Ng

Demis Hassabis

David Silver

Fei-Fei Li

Organizations

DeepMind

OpenAI

MIT CSAIL

Mila

Google Brain

Meta AI

Architectures

Recurrent neural network (RNN)

Long short-term memory (LSTM)

Gated recurrent unit (GRU)

Echo state network

Multilayer perceptron (MLP)

Autoencoder

Variational autoencoder (VAE)

Generative adversarial network (GAN)

Portals
Computer programming

Technology

Category
Artificial neural networks

Machine learning

[1] ttps://pub.towardsai.net/generative-ai-and-future-c3b1695876f2

[2] ttps://www.computer.org/csdl/magazine/co/2022/10/09903869/1H0G6xvtREk

[GANnips-3] {Jump up to: 3.0} ^3.1 ^3.2 ^3.3 ^3.4 ^3.5 ^3.6 ^3.7 ^3.8 ^3.9 Goodfellow, Ian; Pouget-Abadie, Jean; Mirza, Mehdi; Xu, Bing; Warde-Farley, David; Ozair, Sherjil; Courville, Aaron; Bengio, Yoshua (2014). जनरेटिव एडवरसैरियल नेट्स (PDF). Proceedings of the International Conference on Neural Information Processing Systems (NIPS 2014). pp. 2672–2680.

[ITT_GANs-4] Salimans, Tim; Goodfellow, Ian; Zaremba, Wojciech; Cheung, Vicki; Radford, Alec; Chen, Xi (2016). "GAN के प्रशिक्षण के लिए बेहतर तकनीकें". arXiv:1606.03498 [cs.LG].

[5] Luc, Pauline; Couprie, Camille; Chintala, Soumith; Verbeek, Jakob (2016-11-25). "एडवरसैरियल नेटवर्क का उपयोग करते हुए सिमेंटिक सेगमेंटेशन". NIPS Workshop on Adversarial Training, Dec, Barcelona, Spain. 2016. arXiv:1611.08408.

[OpenAI_com-6] {{citation |author1=Andrej Karpathy |title=Generative Models |url=https://openai.com/blog/generative-models/ |publisher=OpenAI |access-date=April 7, 2016 |author2=Pieter Abbeel |author3=Greg Brockman |author4=Peter Chen |author5=Vicki Cheung |author6=Rocky Duan |author7=Ian Goodfellow |author8=Durk Kingma |author9=Jonathan Ho |author-link1=Andrej Karpathy |author-link2=Pieter Abbeel |author10=Rein Houthooft |author11=Tim Salimans |author12=John Schulman |author13=Ilya Sutskever |author14=Wojciech Zaremba}

[7] Mohamed, Shakir; Lakshminarayanan, Balaji (2016). "निहित जनरेटिव मॉडल में सीखना". arXiv:1610.03483 [stat.ML].

[:5-8] {Jump up to: 8.0} ^8.1 Goodfellow, Ian (2017-04-03). "NIPS 2016 Tutorial: Generative Adversarial Networks". arXiv:1701.00160 [cs.LG].

[9] Kingma, Diederik P.; Welling, Max (2014-05-01). "ऑटो-एन्कोडिंग वेरिएशनल बेज़". arXiv:1312.6114 [stat.ML].

[10] Rezende, Danilo Jimenez; Mohamed, Shakir; Wierstra, Daan (2014-06-18). "डीप जनरेटिव मॉडल में स्टोचैस्टिक बैकप्रोपैजेशन और अनुमानित अनुमान". International Conference on Machine Learning (in English). PMLR: 1278–1286. arXiv:1401.4082.

[:2-11] {Jump up to: 11.0} ^11.1 Farnia, Farzan; Ozdaglar, Asuman (2020-11-21). "Do GANs always have Nash equilibria?". International Conference on Machine Learning (in English). PMLR: 3029–3039.

[:3-12] {Jump up to: 12.0} ^12.1 ^12.2 Weng, Lilian (2019-04-18). "GAN से WGAN तक". arXiv:1904.08994 [cs.LG].

[:1-13] {Jump up to: 13.0} ^13.1 ^13.2 Karras, Tero; Aila, Timo; Laine, Samuli; Lehtinen, Jaakko (2017-10-01). "बेहतर गुणवत्ता, स्थिरता और भिन्नता के लिए जीएएन का प्रगतिशील विकास". arXiv:1710.10196 [cs.NE].

[14] Soviany, Petru; Ardei, Claudiu; Ionescu, Radu Tudor; Leordeanu, Marius (2019-10-22). "जनरेटिव एडवरसैरियल नेटवर्क्स (CuGAN) के लिए छवि कठिनाई पाठ्यक्रम". arXiv:1910.08967 [cs.LG].

[15] Hacohen, Guy; Weinshall, Daphna (2019-05-24). "डीप नेटवर्क्स के प्रशिक्षण में पाठ्यचर्या सीखने की शक्ति पर". International Conference on Machine Learning (in English). PMLR: 2535–2544. arXiv:1904.03626.

[16] "r/MachineLearning - Comment by u/ian_goodfellow on "[R] [1701.07875] Wasserstein GAN". reddit (in English). January 30, 2017. Retrieved 2022-07-15.

[17] Lin, Zinan; et al. (December 2018). PacGAN: the power of two samples in generative adversarial networks. 32nd International Conference on Neural Information Processing Systems. pp. 1505–1514. arXiv:1712.04086.

[18] Mescheder, Lars; Geiger, Andreas; Nowozin, Sebastian (2018-07-31). "Which Training Methods for GANs do actually Converge?". arXiv:1801.04406 [cs.LG].

[:0-19] {Jump up to: 19.0} ^19.1 Brock, Andrew; Donahue, Jeff; Simonyan, Karen (2018-09-01). उच्च निष्ठा प्राकृतिक छवि संश्लेषण के लिए बड़े पैमाने पर GAN प्रशिक्षण. International Conference on Learning Representations 2019. arXiv:1809.11096.

[20] Heusel, Martin; Ramsauer, Hubert; Unterthiner, Thomas; Nessler, Bernhard; Hochreiter, Sepp (2017). "दो टाइम-स्केल अपडेट नियम द्वारा प्रशिक्षित गण स्थानीय नैश इक्विलिब्रियम में अभिसरण करते हैं". Advances in Neural Information Processing Systems. Curran Associates, Inc. 30. arXiv:1706.08500.

[21] Kingma, Diederik P.; Ba, Jimmy (2017-01-29). "Adam: A Method for Stochastic Optimization". arXiv:1412.6980 [cs.LG].

[22] Zhang, Richard; Isola, Phillip; Efros, Alexei A.; Shechtman, Eli; Wang, Oliver (2018). "एक अवधारणात्मक मीट्रिक के रूप में गहरी विशेषताओं की अनुचित प्रभावशीलता". pp. 586–595. arXiv:1801.03924 [cs.CV].

[23] Borji, Ali (2019-02-01). "जीएएन मूल्यांकन उपायों के पक्ष और विपक्ष". Computer Vision and Image Understanding (in English). 179: 41–65. arXiv:1802.03446. doi:10.1016/j.cviu.2018.10.009. ISSN 1077-3142. S2CID 3627712.

[24] Hindupur, Avinash (2022-07-15), The GAN Zoo, retrieved 2022-07-15

[25] Odena, Augustus; Olah, Christopher; Shlens, Jonathon (2017-07-17). "सहायक वर्गीकारक GANs के साथ सशर्त छवि संश्लेषण". International Conference on Machine Learning (in English). PMLR: 2642–2651. arXiv:1610.09585.

[26] Radford, Alec; Metz, Luke; Chintala, Soumith (2016). "डीप कन्वोल्यूशनल जनरेटिव एडवरसैरियल नेटवर्क्स के साथ अनसुपरवाइज्ड रिप्रेजेंटेशन लर्निंग". ICLR. S2CID 11758569.

[27] Long, Jonathan; Shelhamer, Evan; Darrell, Trevor (2015). "सिमेंटिक सेगमेंटेशन के लिए पूरी तरह से कनवॉल्यूशनल नेटवर्क". CVF: 3431–3440.

[28] Zhang, Han; Goodfellow, Ian; Metaxas, Dimitris; Odena, Augustus (2019-05-24). "सेल्फ-अटेंशन जनरेटिव एडवरसैरियल नेटवर्क". International Conference on Machine Learning (in English). PMLR: 7354–7363.

[29] Larsen, Anders Boesen Lindbo; Sønderby, Søren Kaae; Larochelle, Hugo; Winther, Ole (2016-06-11). "एक सीखी हुई समानता मीट्रिक का उपयोग करके पिक्सेल से परे ऑटोएन्कोडिंग". International Conference on Machine Learning (in English). PMLR: 1558–1566. arXiv:1512.09300.

[30] Jiang, Yifan; Chang, Shiyu; Wang, Zhangyang (2021-12-08). "TransGAN: Two Pure Transformers Can Make One Strong GAN, and That Can Scale Up". arXiv:2102.07074 [cs.CV].

[31] Grover, Aditya; Dhar, Manik; Ermon, Stefano (2017-05-01). "Flow-GAN: Combining Maximum Likelihood and Adversarial Learning in Generative Models". arXiv:1705.08868 [cs.LG].

[32] Arjovsky, Martin; Bottou, Léon (2017-01-01). "जनरेटिव एडवरसैरियल नेटवर्क्स के प्रशिक्षण के लिए सैद्धांतिक तरीकों की ओर". arXiv:1701.04862 [stat.ML].

[33] Goodfellow, Ian J. (2014-12-01). "जनरेटिव मॉडल का अनुमान लगाने के लिए अलग-अलग मानदंडों पर". arXiv:1412.6515 [stat.ML].

[34] Goodfellow, Ian (2016-08-31). "जनरेटिव एडवरसैरियल नेटवर्क्स (GANs), बर्कले आर्टिफिशियल इंटेलिजेंस लैब में प्रस्तुति" (PDF). Archived (PDF) from the original on 8 May 2022.

[35] Lim, Jae Hyun; Ye, Jong Chul (2017-05-08). "ज्यामितीय गण". arXiv:1705.02894 [stat.ML].

[36] Mao, Xudong; Li, Qing; Xie, Haoran; Lau, Raymond Y. K.; Wang, Zhen; Paul Smolley, Stephen (2017). "कम से कम वर्ग जनरेटिव एडवरसैरियल नेटवर्क": 2794–2802. {{cite journal}}: Cite journal requires |journal= (help)

[37] Makhzani, Alireza; Shlens, Jonathon; Jaitly, Navdeep; Goodfellow, Ian; Frey, Brendan (2016). "एडवरसैरियल ऑटोएन्कोडर्स". arXiv:1511.05644 [cs.LG].

[38] Barber, David; Agakov, Felix (2003-12-09). "The IM algorithm: a variational approach to Information Maximization". Proceedings of the 16th International Conference on Neural Information Processing Systems. NIPS'03. Cambridge, MA, USA: MIT Press: 201–208.

[39] Chen, Xi; Duan, Yan; Houthooft, Rein; Schulman, John; Sutskever, Ilya; Abbeel, Pieter (2016). "InfoGAN: Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets". Advances in Neural Information Processing Systems. Curran Associates, Inc. 29. arXiv:1606.03657.

[40] Donahue, Jeff; Krähenbühl, Philipp; Darrell, Trevor (2016). "एडवरसैरियल फीचर लर्निंग". arXiv:1605.09782 [cs.LG].

[41] Dumoulin, Vincent; Belghazi, Ishmael; Poole, Ben; Mastropietro, Olivier; Arjovsky, Alex; Courville, Aaron (2016). "प्रतिकूल रूप से सीखा अनुमान". arXiv:1606.00704 [stat.ML].

[42] Xi Chen; Yan Duan; Rein Houthooft; John Schulman; Ilya Sutskever; Pieter Abeel (2016). "InfoGAN: Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets". arXiv:1606.03657 [cs.LG].

[43] Zhirui Zhang; Shujie Liu; Mu Li; Ming Zhou; Enhong Chen (October 2018). "तंत्रिका मशीन अनुवाद के लिए द्विदिश जनरेटिव एडवरसैरियल नेटवर्क" (PDF). pp. 190–199.

[44] Zhu, Jun-Yan; Park, Taesung; Isola, Phillip; Efros, Alexei A. (2017). "अयुग्मित इमेज-टू-इमेज ट्रांसलेशन साइकिल-कंसिस्टेंट एडवरसैरियल नेटवर्क का उपयोग करना". pp. 2223–2232. arXiv:1703.10593 [cs.CV].

[45] Isola, Phillip; Zhu, Jun-Yan; Zhou, Tinghui; Efros, Alexei A. (2017). "सशर्त प्रतिकूल नेटवर्क के साथ इमेज-टू-इमेज अनुवाद". pp. 1125–1134. arXiv:1611.07004 [cs.CV].

[46] Brownlee, Jason (2019-08-22). "बिग जनरेटिव एडवरसैरियल नेटवर्क बिगगैन का एक सौम्य परिचय". Machine Learning Mastery (in English). Retrieved 2022-07-15.

[47] Shengyu, Zhao; Zhijian, Liu; Ji, Lin; Jun-Yan, Zhu; Song, Han (2020). "डेटा-कुशल GAN प्रशिक्षण के लिए भिन्नात्मक वृद्धि". Advances in Neural Information Processing Systems (in English). 33. arXiv:2006.10738.

[:4-48] {Jump up to: 48.0} ^48.1 ^48.2 Tero, Karras; Miika, Aittala; Janne, Hellsten; Samuli, Laine; Jaakko, Lehtinen; Timo, Aila (2020). "सीमित डेटा के साथ जनरेटिव एडवरसैरियल नेटवर्क का प्रशिक्षण". Advances in Neural Information Processing Systems (in English). 33.

[49] Shaham, Tamar Rott; Dekel, Tali; Michaeli, Tomer (October 2019). "SinGAN: Learning a Generative Model From a Single Natural Image". 2019 IEEE/CVF International Conference on Computer Vision (ICCV). IEEE: 4569–4579. arXiv:1905.01164. doi:10.1109/iccv.2019.00467. ISBN 978-1-7281-4803-8. S2CID 145052179.

[50] Karras, Tero; Laine, Samuli; Aila, Timo (June 2019). "जनरेटिव एडवरसैरियल नेटवर्क्स के लिए एक स्टाइल-आधारित जेनरेटर आर्किटेक्चर". 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). IEEE: 4396–4405. arXiv:1812.04948. doi:10.1109/cvpr.2019.00453. ISBN 978-1-7281-3293-8. S2CID 54482423.

[51] Karras, Tero; Laine, Samuli; Aittala, Miika; Hellsten, Janne; Lehtinen, Jaakko; Aila, Timo (June 2020). "StyleGAN की छवि गुणवत्ता का विश्लेषण और सुधार". 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). IEEE: 8107–8116. arXiv:1912.04958. doi:10.1109/cvpr42600.2020.00813. ISBN 978-1-7281-7168-5. S2CID 209202273.

[52] Timo, Karras, Tero Aittala, Miika Laine, Samuli Härkönen, Erik Hellsten, Janne Lehtinen, Jaakko Aila (2021-06-23). अलियास-फ्री जनरेटिव एडवरसैरियल नेटवर्क. OCLC 1269560084.{{cite book}}: CS1 maint: multiple names: authors list (link)

[53] Karras, Tero; Aittala, Miika; Laine, Samuli; Härkönen, Erik; Hellsten, Janne; Lehtinen, Jaakko; Aila, Timo. "Alias-Free Generative Adversarial Networks (StyleGAN3)". nvlabs.github.io. Retrieved 2022-07-16.

[54] Caesar, Holger (2019-03-01), A list of papers on Generative Adversarial (Neural) Networks: nightrome/really-awesome-gan, retrieved 2019-03-02

[55] Robertson, Adi (2022-02-21). "यूएस कॉपीराइट कार्यालय का कहना है कि एआई अपनी कला को कॉपीराइट नहीं कर सकता है". The Verge (in English). Retrieved 2022-02-24.

[56] Vincent, James (5 March 2019). "एआई कला की कभी न खत्म होने वाली धारा नीलामी के लिए जाती है". The Verge (in English). Retrieved 13 June 2020.

[57] Yu, Jiahui, et al. "Generative image inpainting with contextual attention." Proceedings of the IEEE conference on computer vision and pattern recognition. 2018.

[58] Wong, Ceecee. "एआई सुपरमॉडल्स का उदय". CDO Trends.

[59] Taif, K.; Ugail, H.; Mehmood, I. (2020). "जनरेटिव एडवरसैरियल नेटवर्क का उपयोग करके कास्ट शैडो जेनरेशन". Computational Science – Iccs 2020. Lecture Notes in Computer Science. 12141: 481–495. doi:10.1007/978-3-030-50426-7_36. ISBN 978-3-030-50425-0. PMC 7302543.

[60] Allen, Eric Van (2020-07-08). "एक कुख्यात Zelda Creepypasta Saga अपने समापन को तैयार करने के लिए आर्टिफिशियल इंटेलिजेंस का उपयोग कर रहा है". USgamer (in English). Retrieved 2022-11-07.

[61] rcadeattack (2020-09-28). "Arcade Attack Podcast – September (4 of 4) 2020 - Alex Hall (Ben Drowned) - Interview". Arcade Attack (in British English). Retrieved 2022-11-07.

[62] Schawinski, Kevin; Zhang, Ce; Zhang, Hantian; Fowler, Lucas; Santhanam, Gokula Krishnan (2017-02-01). "जनरेटिव एडवरसैरियल नेटवर्क, डिकॉन्वोल्यूशन सीमा से परे आकाशगंगाओं की एस्ट्रोफिजिकल छवियों में सुविधाओं को पुनर्प्राप्त करते हैं". Monthly Notices of the Royal Astronomical Society: Letters. 467 (1): L110–L114. arXiv:1702.00403. Bibcode:2017MNRAS.467L.110S. doi:10.1093/mnrasl/slx008. S2CID 7213940.

[63] Kincade, Kathy. "शोधकर्ता डार्क मैटर का अध्ययन करने के लिए एक तंत्रिका नेटवर्क को प्रशिक्षित करते हैं". R&D Magazine.

[64] Kincade, Kathy (May 16, 2019). "CosmoGAN: Training a neural network to study dark matter". Phys.org.

[65] "डार्क मैटर का अध्ययन करने के लिए तंत्रिका नेटवर्क को प्रशिक्षित करना". Science Daily. May 16, 2019.

[66] t 06:13, Katyanna Quach 20 May 2019. "Cosmoboffins आसान तरीके से डार्क मैटर मैप बनाने के लिए तंत्रिका नेटवर्क का उपयोग करते हैं". www.theregister.co.uk (in English). Retrieved 2019-05-20.

[67] Mustafa, Mustafa; Bard, Deborah; Bhimji, Wahid; Lukić, Zarija; Al-Rfou, Rami; Kratochvil, Jan M. (2019-05-06). "CosmoGAN: creating high-fidelity weak lensing convergence maps using Generative Adversarial Networks". Computational Astrophysics and Cosmology. 6 (1): 1. arXiv:1706.02390. Bibcode:2019ComAC...6....1M. doi:10.1186/s40668-019-0029-9. ISSN 2197-7909. S2CID 126034204.

[68] Paganini, Michela; de Oliveira, Luke; Nachman, Benjamin (2017). "Learning Particle Physics by Example: Location-Aware Generative Adversarial Networks for Physics Synthesis". Computing and Software for Big Science. 1: 4. arXiv:1701.05927. Bibcode:2017arXiv170105927D. doi:10.1007/s41781-017-0004-6. S2CID 88514467.

[69] Paganini, Michela; de Oliveira, Luke; Nachman, Benjamin (2018). "Accelerating Science with Generative Adversarial Networks: An Application to 3D Particle Showers in Multi-Layer Calorimeters". Physical Review Letters. 120 (4): 042003. arXiv:1705.02355. Bibcode:2018PhRvL.120d2003P. doi:10.1103/PhysRevLett.120.042003. PMID 29437460. S2CID 3330974.

[70] Paganini, Michela; de Oliveira, Luke; Nachman, Benjamin (2018). "CaloGAN: Simulating 3D High Energy Particle Showers in Multi-Layer Electromagnetic Calorimeters with Generative Adversarial Networks". Phys. Rev. D. 97 (1): 014021. arXiv:1712.10321. Bibcode:2018PhRvD..97a4021P. doi:10.1103/PhysRevD.97.014021. S2CID 41265836.

[71] Erdmann, Martin; Glombitza, Jonas; Quast, Thorben (2019). "वैसरस्टीन जनरेटिव एडवरसैरियल नेटवर्क का उपयोग करके विद्युत चुम्बकीय कैलोरीमीटर वर्षा का सटीक अनुकरण". Computing and Software for Big Science. 3: 4. arXiv:1807.01954. doi:10.1007/s41781-018-0019-7. S2CID 54216502.

[72] Musella, Pasquale; Pandolfi, Francesco (2018). "जनरेटिव एडवरसैरियल नेटवर्क का उपयोग करके पार्टिकल डिटेक्टरों का तेज़ और सटीक अनुकरण". Computing and Software for Big Science. 2: 8. arXiv:1805.00850. Bibcode:2018arXiv180500850M. doi:10.1007/s41781-018-0015-y. S2CID 119474793.

[73] "एटलस में तेज शावर सिमुलेशन के लिए गहन जनरेटिव मॉडल". 2018.

[74] SHiP, Collaboration (2019). "जनरेटिव एडवरसैरियल नेटवर्क्स का उपयोग करके SHiP प्रयोग में निर्मित म्यूऑन का तेज़ अनुकरण". Journal of Instrumentation. 14 (11): P11028. arXiv:1909.04451. Bibcode:2019JInst..14P1028A. doi:10.1088/1748-0221/14/11/P11028. S2CID 202542604.

[75] Tang, Xiaoou; Qiao, Yu; Loy, Chen Change; Dong, Chao; Liu, Yihao; Gu, Jinjin; Wu, Shixiang; Yu, Ke; Wang, Xintao (2018-09-01). "ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks" (in English). arXiv:1809.00219. Bibcode:2018arXiv180900219W.

[76] Narain, Rohit (2021-12-29). "डीप न्यूरल नेटवर्क का उपयोग करके टेक्स्ट से स्मार्ट वीडियो जेनरेशन" (in English). Retrieved 2022-10-13.

[TPDNEwuaitcryhf|-77] smash (2019-02-14). "'यह व्यक्ति अस्तित्व में नहीं है' वेबसाइट एआई का उपयोग यथार्थवादी लेकिन भयानक चेहरे बनाने के लिए करती है". Slashdot. Retrieved 2019-02-16.

[78] Li, Bonnie; François-Lavet, Vincent; Doan, Thang; Pineau, Joelle (2021-02-14). "डोमेन एडवरसैरियल रीइन्फोर्समेंट लर्निंग". arXiv:2102.07097 [cs.LG].

[79] Bisneto, Tomaz Ribeiro Viana; de Carvalho Filho, Antonio Oseas; Magalhães, Deborah Maria Vieira (February 2020). "स्वचालित ग्लूकोमा का पता लगाने के लिए जनरेटिव प्रतिकूल नेटवर्क और बनावट सुविधाएँ लागू होती हैं". Applied Soft Computing. 90: 106165. doi:10.1016/j.asoc.2020.106165. S2CID 214571484.

[80] Wei, Jerry (2019-07-03). "मशीन लर्निंग के साथ जूता डिजाइन तैयार करना". Medium (in English). Retrieved 2019-11-06.

[81] Greenemeier, Larry (June 20, 2016). "When Will Computers Have Common Sense? Ask Facebook". Scientific American. Retrieved July 31, 2016.

[82] Reconstruction of the Roman Emperors: Interview with Daniel Voshart (in English), retrieved 2022-06-03

[83] "3D Generative Adversarial Network". 3dgan.csail.mit.edu.

[84] Achlioptas, Panos; Diamanti, Olga; Mitliagkas, Ioannis; Guibas, Leonidas (2018). "Learning Representations and Generative Models for 3D Point Clouds". arXiv:1707.02392 [cs.CV].

[85] Vondrick, Carl; Pirsiavash, Hamed; Torralba, Antonio (2016). "सीन डायनामिक्स के साथ वीडियो बनाना". carlvondrick.com. arXiv:1609.02612. Bibcode:2016arXiv160902612V.

[86] Antipov, Grigory; Baccouche, Moez; Dugelay, Jean-Luc (2017). "कंडिशनल जनरेटिव एडवरसैरियल नेटवर्क्स के साथ फेस एजिंग". arXiv:1702.01983 [cs.CV].

[87] Kang, Yuhao; Gao, Song; Roth, Rob (2019). "जनरेटिव एडवरसैरियल नेटवर्क का उपयोग करके मल्टीस्केल मैप स्टाइल्स को स्थानांतरित करना". International Journal of Cartography. 5 (2–3): 115–141. arXiv:1905.02200. Bibcode:2019arXiv190502200K. doi:10.1080/23729333.2019.1615729. S2CID 146808465.

[88] Wijnands, Jasper; Nice, Kerry; Thompson, Jason; Zhao, Haifeng; Stevenson, Mark (2019). "Streetscape augmentation using generative adversarial networks: Insights related to health and wellbeing". Sustainable Cities and Society. 49: 101602. arXiv:1905.06464. Bibcode:2019arXiv190506464W. doi:10.1016/j.scs.2019.101602. S2CID 155100183.

[89] Ukkonen, Antti; Joona, Pyry; Ruotsalo, Tuukka (2020). "Generating Images Instead of Retrieving Them: Relevance Feedback on Generative Adversarial Networks". Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval: 1329–1338. doi:10.1145/3397271.3401129. hdl:10138/328471. ISBN 9781450380164. S2CID 220730163.

[90] Padhi, Radhakant; Unnikrishnan, Nishant (2006). "गैर-रैखिक प्रणालियों के एक वर्ग के लिए इष्टतम नियंत्रण संश्लेषण के लिए एक एकल नेटवर्क अनुकूली आलोचक (SNAC) वास्तुकला". Neural Networks. 19 (10): 1648–1660. doi:10.1016/j.neunet.2006.08.010. PMID 17045458.

[91] "एआई हमें जलवायु परिवर्तन के कहर दिखा सकता है". MIT Technology Review. May 16, 2019.

[92] Christian, Jon (May 28, 2019). "अस्टाउंडिंग एआई आपकी आवाज के आधार पर अनुमान लगाता है कि आप कैसे दिखते हैं". Futurism.

[93] Zhavoronkov, Alex (2019). "डीप लर्निंग शक्तिशाली DDR1 किनेज अवरोधकों की तेजी से पहचान को सक्षम बनाता है". Nature Biotechnology. 37 (9): 1038–1040. doi:10.1038/s41587-019-0224-x. PMID 31477924. S2CID 201716327.

[94] Barber, Gregory. "एआई द्वारा डिज़ाइन किया गया एक अणु "ड्रगलाइक" गुणों को प्रदर्शित करता है". Wired.

[95] Mohammad Navid Fekri; Ananda Mohon Ghosh; Katarina Grolinger (2020). "आवर्ती जनरेटिव एडवरसैरियल नेटवर्क के साथ मशीन लर्निंग के लिए ऊर्जा डेटा उत्पन्न करना". Energies. 13 (1): 130. doi:10.3390/en13010130.

[curiosity1991-96] Schmidhuber, Jürgen (1991). "मॉडल-निर्माण तंत्रिका नियंत्रकों में जिज्ञासा और ऊब को लागू करने की संभावना". Proc. SAB'1991. MIT Press/Bradford Books. pp. 222–227.

[fun2010-97] Schmidhuber, Jürgen (2010). "Formal Theory of Creativity, Fun, and Intrinsic Motivation (1990-2010)". IEEE Transactions on Autonomous Mental Development. 2 (3): 230–247. doi:10.1109/TAMD.2010.2056368. S2CID 234198.

[gancurpm2020-98] {Jump up to: 98.0} ^98.1 Schmidhuber, Jürgen (2020). "Generative Adversarial Networks are Special Cases of Artificial Curiosity (1990) and also Closely Related to Predictability Minimization (1991)". Neural Networks (in English). 127: 58–66. arXiv:1906.04493. doi:10.1016/j.neunet.2020.04.008. PMID 32334341. S2CID 216056336.

[olli2010-99] Niemitalo, Olli (February 24, 2010). "A method for training artificial neural networks to generate missing data within a variable context". Internet Archive (Wayback Machine). Archived from the original on March 12, 2012. Retrieved February 22, 2019.

[reddit3-100] "GANs were invented in 2010?". reddit r/MachineLearning (in English). 2019. Retrieved 2019-05-28.

[Li-etal-GECCO2013-101] Li, Wei; Gauci, Melvin; Gross, Roderich (July 6, 2013). "Proceeding of the fifteenth annual conference on Genetic and evolutionary computation conference - GECCO '13". Proceedings of the 15th Annual Conference on Genetic and Evolutionary Computation (GECCO 2013). Amsterdam, The Netherlands: ACM. pp. 223–230. doi:10.1145/2463372.2465801. ISBN 9781450319638.

[102] Gutmann, Michael; Hyvärinen, Aapo. "शोर-विपरीत अनुमान" (PDF). International Conference on AI and Statistics.

[103] Abu-Khalaf, Murad; Lewis, Frank L.; Huang, Jie (July 1, 2008). "विवश नियंत्रण प्रणालियों के लिए न्यूरोडायनामिक प्रोग्रामिंग और जीरो-सम गेम्स". IEEE Transactions on Neural Networks. 19 (7): 1243–1252. doi:10.1109/TNN.2008.2000204. S2CID 15680448.

[104] Abu-Khalaf, Murad; Lewis, Frank L.; Huang, Jie (December 1, 2006). "Policy Iterations on the Hamilton–Jacobi–Isaacs Equation for H_∞ State Feedback Control With Input Saturation". IEEE Transactions on Automatic Control. doi:10.1109/TAC.2006.884959. S2CID 1338976.

[105] Sajjadi, Mehdi S. M.; Schölkopf, Bernhard; Hirsch, Michael (2016-12-23). "EnhanceNet: Single Image Super-Resolution Through Automated Texture Synthesis". arXiv:1612.07919 [cs.CV].

[106] "This Person Does Not Exist: Neither Will Anything Eventually with AI". March 20, 2019.

[107] "आर्टिफिशियल इंटेलिजेंस कला के इतिहास में प्रवेश करता है". December 28, 2018.

[108] Tom Février (2019-02-17). "कृत्रिम बुद्धि घोटाला".

[109] "StyleGAN: Official TensorFlow Implementation". March 2, 2019 – via GitHub.

[TPDNEitboowo2019-110] Paez, Danny (2019-02-13). "This Person Does Not Exist Is the Best One-Off Website of 2019". Retrieved 2019-02-16.

[TPDNE-111] Beschizza, Rob (2019-02-15). "यह व्यक्ति मौजूद नहीं है". Boing-Boing. Retrieved 2019-02-16.

[112] Seung Wook Kim; Zhou, Yuhao; Philion, Jonah; Torralba, Antonio; Fidler, Sanja (2020). "GameGAN के साथ गतिशील वातावरण का अनुकरण करना सीखना". arXiv:2005.12126 [cs.CV].

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]

[59]

[60]

[61]

[62]

[63]

[64]

[65]

[66]

[67]

[68]

[69]

[70]

[71]

[72]

[73]

[74]

[75]

[76]

[77]

[78]

[79]

[80]

[81]

[82]

[83]

[84]

[85]

[86]

[87]

[88]

[89]

[90]

[91]

[92]

[93]

[94]

[95]

[96]

[97]

[98]

[99]

[100]

Anonymous

Search

जनरेटिव प्रतिकूल नेटवर्क

परिभाषा

गणितीय

व्यवहार में

अन्य सांख्यिकीय मशीन सीखने के विधियों से संबंध

गणितीय गुण

उपाय-सैद्धांतिक विचार

रणनीति सेट का विकल्प

जनरेटिव रीपैरामेट्रिजेशन

मूव ऑर्डर और रणनीतिक संतुलन

GAN खेल के लिए मुख्य प्रमेय

GAN का प्रशिक्षण और मूल्यांकन

प्रशिक्षण

अस्थिर अभिसरण

मोड पतन

दो टाइम-स्केल अपडेट रूल

गायब हो रही ढाल

मूल्यांकन

वेरिएंट

सशर्त गण

GAN वैकल्पिक आर्किटेक्चर के साथ

वैकल्पिक उद्देश्यों के साथजीएएन

वासेरस्टीन बाय (डब्ल्यूजीएएन)

2 से अधिक खिलाड़ियों वालेजीएएन

प्रतिकूल ऑटोएन्कोडर

इन्फोगन

द्विदिश गण (बिगन)

साइकिलगण

जीएएन विशेष रूप से बड़े या छोटे पैमाने के साथ

बिगगैन

उलटा डेटा वृद्धि

सिंगन

स्टाइलगैन श्रृंखला

प्रगतिशील गण

स्टाइलगैन-1

स्टाइलगैन-2

स्टाइलगैन-3

अनुप्रयोग

फैशन, कला और विज्ञापन

इंटरएक्टिव मीडिया

विज्ञान

वीडियो गेम

एआई उत्पन्न वीडियो

ऑडियो संश्लेषण

दुर्भावनापूर्ण एप्लिकेशन के बारे में चिंताएं

सीखने को स्थानांतरित करें

विविध अनुप्रयोग

इतिहास

संदर्भ

बाहरी संबंध

Navigation

Wiki tools

Page tools

Other projects

Categories