वासेरस्टीन मेट्रिक: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|Distance function defined between probability distributions}} गणित में, लियोनिड वेसरस्टीन दूरी या...")
 
No edit summary
 
(9 intermediate revisions by 5 users not shown)
Line 1: Line 1:
{{Short description|Distance function defined between probability distributions}}
{{Short description|Distance function defined between probability distributions}}
गणित में, लियोनिड वेसरस्टीन दूरी या [[लियोनिद कांटोरोविच]]-गेनाडी रुबिनस्टीन मीट्रिक एक [[मीट्रिक (गणित)]] है जो किसी दिए गए [[मीट्रिक स्थान]] पर संभाव्यता वितरण के बीच परिभाषित किया गया है। <math>M</math>. इसका नाम लियोनिद वेसरस्टीन |लियोनिद वेसरस्टीन के नाम पर रखा गया है।
गणित में, वेसरस्टीन दूरी या [[लियोनिद कांटोरोविच|कांटोरोविच]]-रुबिनस्टीन मापीय एक दूरी का फलन है जो किसी दिए गए [[मीट्रिक स्थान|मापीय समष्टि]] <math>M</math> पर संभाव्यता वितरण के मध्य परिभाषित किया गया है। इसका नाम लियोनिद वेसरस्टीन के नाम पर रखा गया है।


सहज रूप से, यदि प्रत्येक वितरण को पृथ्वी (मिट्टी) की एक इकाई राशि के रूप में देखा जाता है<math>M</math>, मीट्रिक एक ढेर को दूसरे में बदलने की न्यूनतम लागत है, जिसे पृथ्वी की वह मात्रा माना जाता है जिसे स्थानांतरित करने के लिए औसत दूरी से गुणा करने की आवश्यकता होती है। इस समस्या को पहली बार 1781 में [[गैसपार्ड मोंगे]] द्वारा औपचारिक रूप दिया गया था। इस समानता के कारण, मीट्रिक को [[कंप्यूटर विज्ञान]] में अर्थ मूवर की दूरी के रूप में जाना जाता है।
सहज रूप से, यदि प्रत्येक वितरण को <math>M</math> पर पुंजित पृथ्वी (मिट्टी) की एक इकाई मात्रा के रूप में देखा जाता है, मापीय एक समूह को दूसरे में बदलने की न्यूनतम <nowiki>''लागत''</nowiki> है, जिसे पृथ्वी की वह मात्रा माना जाता है जिसे स्थानांतरित करने के लिए माध्य दूरी से गुणा करने की आवश्यकता होती है। इस समस्या को पहली बार 1781 में [[गैसपार्ड मोंगे]] द्वारा औपचारिक रूप दिया गया था। इस समानता के कारण, मापीय को [[कंप्यूटर विज्ञान]] में अर्थ स्थानांतरित की दूरी के रूप में जाना जाता है।


नाम वासेरस्टीन दूरी रोलैंड डोब्रुशिन द्वारा गढ़ा गया था|आर। 1970 में एल. डोब्रुशिन, लियोनिद वेसरस्टीन के काम में इसे सीखने के बाद | ऑटोमेटा की बड़ी प्रणालियों का वर्णन करने वाली मार्कोव प्रक्रियाओं पर लियोनिद वेसरस्टीन<ref>{{cite journal|title=मार्कोव ऑटोमेटा की बड़ी प्रणालियों का वर्णन करते हुए रिक्त स्थान के अगणनीय उत्पादों पर प्रक्रिया करता है|journal=Problemy Peredači Informacii|year=1969|volume=5|issue=3|pages=64–72| vauthors = Vaserstein LN |url=http://www.mathnet.ru/links/b90e28ab49fa878b215cbbdfa0235264/ppi1811.pdf}}</ref> (रूसी, 1969)। हालांकि मीट्रिक को पहली बार उत्पादन योजना और संगठन की गणितीय विधि में लियोनिद कांटोरोविच द्वारा परिभाषित किया गया था<ref>{{cite journal | vauthors = Kantorovich LV | year = 1939 | title = उत्पादन के आयोजन और योजना के गणितीय तरीके| journal = Management Science | volume = 6 | issue = 4| pages = 366–422 | jstor=2627082| doi = 10.1287/mnsc.6.4.366 }}</ref> (रूसी मूल 1939) माल और सामग्रियों की इष्टतम परिवहन योजना के संदर्भ में। कुछ विद्वान इस प्रकार कांटोरोविच मीट्रिक और कांटोरोविच दूरी शब्दों के उपयोग को प्रोत्साहित करते हैं। अधिकांश [[अंग्रेजी भाषा]]-भाषा के प्रकाशन [[जर्मन भाषा]] की वर्तनी वासेरस्टीन का उपयोग करते हैं (जर्मनिक भाषा मूल के होने के कारण वासेरस्टीन नाम के लिए जिम्मेदार)।
स्वचल प्ररूप (रूसी, 1969) की बड़ी प्रणालियों का वर्णन करने वाली मार्कोव प्रक्रियाओं पर लियोनिद वेसरस्टीन के काम में इसे सीखने के बाद, 1970 में आर. एल. डोब्रुशिन द्वारा <nowiki>''</nowiki>'''वासेरस्टीन दूरी'''<nowiki>''</nowiki> नाम अविष्कार किया गया था।<ref>{{cite journal|title=मार्कोव ऑटोमेटा की बड़ी प्रणालियों का वर्णन करते हुए रिक्त स्थान के अगणनीय उत्पादों पर प्रक्रिया करता है|journal=Problemy Peredači Informacii|year=1969|volume=5|issue=3|pages=64–72| vauthors = Vaserstein LN |url=http://www.mathnet.ru/links/b90e28ab49fa878b215cbbdfa0235264/ppi1811.pdf}}</ref> हालांकि मापन को पहली बार प्रदार्थ और सामग्रियों की इष्टतम परिवहन योजना के संदर्भ में उत्पादन योजना और संगठन की गणितीय विधि (रूसी मूल 1939) में लियोनिद कांटोरोविच द्वारा परिभाषित किया गया था।<ref>{{cite journal | vauthors = Kantorovich LV | year = 1939 | title = उत्पादन के आयोजन और योजना के गणितीय तरीके| journal = Management Science | volume = 6 | issue = 4| pages = 366–422 | jstor=2627082| doi = 10.1287/mnsc.6.4.366 }}</ref> कुछ विद्वान इस प्रकार <nowiki>''कांटोरोविच मापीय'' और ''कांटोरोविच दूरी''</nowiki> शब्दों के उपयोग को प्रोत्साहित करते हैं। अधिकांश [[अंग्रेजी भाषा]] के प्रकाशन [[जर्मन भाषा|जर्मन]] वर्तनी <nowiki>''वासेरस्टीन'' का उपयोग करते हैं (जर्मन मूल के होने के कारण ''वासेरस्टीन''</nowiki> नाम दिया गया)।


== परिभाषा ==
== परिभाषा ==


होने देना <math>(M,d)</math> एक मीट्रिक स्पेस बनें जो एक पोलिश_स्पेस#रेडॉन_स्पेस है। के लिए <math>p \in [1, \infty)</math>वासेरस्टीन <math>p</math>दो संभाव्यता उपायों के बीच की दूरी <math>\mu</math> और <math>\nu</math> पर <math>M</math> परिमित के साथ <math>p</math>-मोमेंट (गणित) है
अनुमान <math>(M,d)</math> एक मापीय समष्टि है जो एक राडोण समष्टि है। <math>p \in [1, \infty)</math> के लिए, परिमित <math>p</math>-क्षण के साथ <math>M</math> पर दो प्रायिकता उपायों <math>\mu</math> और <math>\nu</math> के मध्य वासरस्टीन <math>p</math>-दूरी है।
:<math>W_p(\mu, \nu) = \left( \inf_{\gamma \in \Gamma(\mu, \nu)} \mathbf{E}_{(x, y) \sim \gamma} d(x, y)^p \right)^{1/p}</math>
:<math>W_p(\mu, \nu) = \left( \inf_{\gamma \in \Gamma(\mu, \nu)} \mathbf{E}_{(x, y) \sim \gamma} d(x, y)^p \right)^{1/p}</math>
कहाँ <math>\Gamma(\mu, \nu)</math> के सभी युग्मन (संभाव्यता) का समुच्चय है <math>\mu</math> और <math>\nu</math>. एक युग्मन <math>\gamma</math> पर एक [[संयुक्त संभाव्यता]] माप है <math>M \times M</math> जिनका सीमान्त वितरण है <math>\mu</math> और <math>\nu</math> क्रमशः पहले और दूसरे कारकों पर। वह है,
जहाँ <math>\Gamma(\mu, \nu)</math> <math>\mu</math> और <math>\nu</math> के सभी युग्मन (संभाव्यता) का समुच्चय है। एक युग्मन <math>\gamma</math>, <math>M \times M</math> पर एक [[संयुक्त संभाव्यता]] मापक है, जिसके सीमान्त क्रमशः पहले और दूसरे कारकों पर <math>\mu</math> और <math>\nu</math> है। अर्थात,
:<math>\int_M \gamma(x, y) \,\mathrm{d}y = \mu(x)</math>
:<math>\int_M \gamma(x, y) \,\mathrm{d}y = \mu(x)</math>
:<math>\int_M \gamma(x, y) \,\mathrm{d}x = \nu(y)</math>
:<math>\int_M \gamma(x, y) \,\mathrm{d}x = \nu(y)</math>
 
== अंतर्ज्ञान और इष्टतम परिवहन के लिए संबंध ==
 
[[File:Transport-plan.svg|thumb|दो एक आयामी वितरण <math>\mu</math> और <math>\nu</math>, x और y अक्षों पर आलेखित किए गए हैं, और एक संभावित संयुक्त वितरण जो उनके मध्य एक परिवहन योजना को परिभाषित करता है। संयुक्त वितरण/परिवहन योजना अद्वितीय नहीं है।|186x186px]]उपरोक्त परिभाषा को समझने का प्रकार [[इष्टतम परिवहन समस्या]] पर विचार करना है। अर्थात समष्टि <math>X</math> पर द्रव्यमान <math>\mu(x)</math> के वितरण के लिए, हम द्रव्यमान को इस तरह से परिवहन करना चाहते हैं कि यह वितरण <math>\nu(x)</math> में परिवर्तित हो जाए; 'पृथ्वी के समूह' <math>\mu</math> के समूह <math>\nu</math> में बदलना है। यह समस्या केवल तभी समझ में आती है जब बनाए जाने वाले समूह का द्रव्यमान उतना ही हो जितना समूह को स्थानांतरित किया जाता है; इसलिए व्यापकता के हानि के बिना यह मान लें कि <math>\mu</math> और <math>\nu</math> संभाव्यता वितरण हैं जिनका कुल 1 द्रव्यमान है। यह भी मान लें कि कुछ लागत फलन दिया गया है
== अंतर्ज्ञान और इष्टतम परिवहन से संबंध ==
[[File:Transport-plan.svg|thumb|दो एक आयामी वितरण <math>\mu</math> और <math>\nu</math>, x और y कुल्हाड़ियों पर प्लॉट किया गया है, और एक संभावित संयुक्त वितरण जो उनके बीच एक परिवहन योजना को परिभाषित करता है। संयुक्त वितरण/परिवहन योजना अद्वितीय नहीं है]]उपरोक्त परिभाषा को समझने का एक तरीका [[इष्टतम परिवहन समस्या]] पर विचार करना है। यानी द्रव्यमान के वितरण के लिए <math>\mu(x)</math> एक स्थान पर <math>X</math>, हम द्रव्यमान को इस तरह से परिवहन करना चाहते हैं कि यह वितरण में परिवर्तित हो जाए <math>\nu(x)</math> एक ही स्थान पर; 'पृथ्वी के ढेर' को बदलना <math>\mu</math> ढेर के लिए <math>\nu</math>. यह समस्या केवल तभी समझ में आती है जब बनाए जाने वाले ढेर का द्रव्यमान उतना ही हो जितना ढेर को स्थानांतरित किया जाना है; इसलिए व्यापकता के नुकसान के बिना यह मान लें <math>\mu</math> और <math>\nu</math> प्रायिकता बंटन हैं जिनका कुल द्रव्यमान 1 है। यह भी मान लें कि कुछ लागत फलन दिया गया है


:<math>c(x,y) \geq 0</math>
:<math>c(x,y) \geq 0</math>
जो एक इकाई द्रव्यमान को बिंदु से ले जाने की लागत देता है <math>x</math> मुद्दे पर <math>y</math>.
यह एक इकाई द्रव्यमान को बिंदु <math>x</math> से बिंदु <math>y</math> तक ले जाने की लागत देता है। <math>\mu</math> को <math>\nu</math> ले जाने की एक परिवहन योजना को एक फलन <math>\gamma(x,y)</math> द्वारा वर्णित किया जा सकता है जो <math>x</math> से <math>y</math> तक जाने के लिए द्रव्यमान की मात्रा देता है। आप फलन की कल्पना कर सकते हैं कि आकृति <math>\nu</math> की जमीन में छेद करने के लिए <math>\mu</math> आकार की पृथ्वी के समूह को स्थानांतरित करने की आवश्यकता है, जैसे कि अंत में, मिट्टी का ढेर और जमीन में छेद दोनों पूरी तरह से लुप्त हो जाते हैं। इस योजना के सार्थक होने के लिए, इसे निम्नलिखित गुणों को पूरा करना होगा
स्थानांतरित करने के लिए एक परिवहन योजना <math>\mu</math> में <math>\nu</math> एक समारोह द्वारा वर्णित किया जा सकता है <math>\gamma(x,y)</math> जो स्थानांतरित करने के लिए द्रव्यमान की मात्रा देता है <math>x</math> को <math>y</math>. आप कल्पना कर सकते हैं कि आकार की पृथ्वी के ढेर को स्थानांतरित करने की आवश्यकता के रूप में कार्य <math>\mu</math> आकार की जमीन में छेद करने के लिए <math>\nu</math> ऐसा कि अंत में, मिट्टी का ढेर और जमीन में छेद दोनों पूरी तरह से गायब हो जाते हैं। इस योजना के सार्थक होने के लिए, इसे निम्नलिखित गुणों को पूरा करना होगा


:<math>
:<math>
Line 28: Line 25:
\end{align}
\end{align}
</math>
</math>
यही है, कि कुल द्रव्यमान एक असीम क्षेत्र से बाहर चला गया <math>x</math> के बराबर होना चाहिए <math>\mu(x) \mathrm{d}x</math> और कुल द्रव्यमान आसपास के क्षेत्र में चला गया <math>y</math> होना चाहिए <math>\nu(y)\mathrm{d}y</math>. यह उस आवश्यकता के बराबर है <math>\gamma</math> मार्जिन के साथ एक [[संयुक्त संभाव्यता वितरण]] हो <math>\mu</math> और <math>\nu</math>. इस प्रकार, अपरिमेय द्रव्यमान से पहुँचाया गया <math>x</math> को <math>y</math> है <math>\gamma(x,y) \, \mathrm{d} x \, \mathrm{d} y</math>, और चलने की लागत है <math>c(x,y) \gamma(x,y) \, \mathrm{d} x \, \mathrm{d} y</math>, लागत समारोह की परिभाषा के बाद। इसलिए, एक परिवहन योजना की कुल लागत <math>\gamma</math> है
अर्थात्, <math>x</math> के आसपास एक अतिसूक्ष्म क्षेत्र से बाहर चला गया कुल द्रव्यमान <math>\mu(x) \mathrm{d}x</math> के समान होना चाहिए और <math>y</math> के आसपास एक क्षेत्र में स्थानांतरित कुल द्रव्यमान <math>\nu(y)\mathrm{d}y</math> होना चाहिए। यह आवश्यकता के समान है कि <math>\gamma</math> सीमांत <math>\mu</math> और <math>\nu</math> के साथ एक [[संयुक्त संभाव्यता वितरण]] है। इस प्रकार, <math>x</math> से  <math>y</math> तक पहुँचाया गया अतिसूक्ष्म द्रव्यमान <math>\gamma(x,y) \, \mathrm{d} x \, \mathrm{d} y</math> है, और लागत फलन की परिभाषा के बाद चलने की लागत <math>c(x,y) \gamma(x,y) \, \mathrm{d} x \, \mathrm{d} y</math> है। इसलिए, परिवहन योजना <math>\gamma</math> की कुल लागत है।
:<math>
:<math>
\iint c(x,y) \gamma(x,y) \, \mathrm{d} x \, \mathrm{d} y = \int c(x,y) \, \mathrm{d} \gamma(x,y)
\iint c(x,y) \gamma(x,y) \, \mathrm{d} x \, \mathrm{d} y = \int c(x,y) \, \mathrm{d} \gamma(x,y)
</math>
</math>
योजना <math>\gamma</math> अद्वितीय नहीं है; इष्टतम परिवहन योजना सभी संभावित परिवहन योजनाओं में से न्यूनतम लागत वाली योजना है। जैसा कि उल्लेख किया गया है, एक योजना के वैध होने की आवश्यकता यह है कि यह सीमांत के साथ एक संयुक्त वितरण है <math>\mu</math> और <math>\nu</math>; दे <math>\Gamma</math> ऐसे सभी उपायों के सेट को निरूपित करें, जैसा कि पहले खंड में, इष्टतम योजना की लागत है
योजना <math>\gamma</math> अद्वितीय नहीं है; इष्टतम परिवहन योजना सभी संभावित परिवहन योजनाओं में से न्यूनतम लागत वाली योजना है। जैसा कि उल्लेख किया गया है, एक योजना के वैध होने की आवश्यकता यह है कि यह सीमांत <math>\mu</math> और <math>\nu</math> के साथ एक संयुक्त वितरण है; <math>\Gamma</math> पहले खंड के रूप में ऐसे सभी उपायों के समुच्चय को दर्शाता है, इष्टतम योजना की लागत है
:<math>
:<math>
C =  \inf_{\gamma \in \Gamma(\mu, \nu)} \int c(x,y) \, \mathrm{d} \gamma(x,y)
C =  \inf_{\gamma \in \Gamma(\mu, \nu)} \int c(x,y) \, \mathrm{d} \gamma(x,y)
</math>
</math>
यदि एक चाल की लागत केवल दो बिंदुओं के बीच की दूरी है, तो इष्टतम लागत की परिभाषा के समान है <math>W_1</math> दूरी।
यदि एक चाल की लागत केवल दो बिंदुओं के मध्य की दूरी है, तो इष्टतम लागत <math>W_1</math> दूरी की परिभाषा के समान है।


== उदाहरण ==
== उदाहरण ==
Line 44: Line 41:
==== नियतात्मक वितरण ====
==== नियतात्मक वितरण ====


होने देना <math>\mu_{1} = \delta_{a_{1}}</math> और <math>\mu_{2} = \delta_{a_{2}}</math> बिंदुओं पर स्थित दो पतित वितरण (अर्थात डायराक डेल्टा वितरण)। <math>a_{1}</math> और <math>a_{2}</math> में <math>\mathbb{R}</math>. इन दो मापों का केवल एक ही संभावित युग्मन है, अर्थात् बिंदु द्रव्यमान <math>\delta_{(a_{1}, a_{2})}</math> पर स्थित <math>(a_{1}, a_{2}) \in \mathbb{R}^{2}</math>. इस प्रकार, सामान्य निरपेक्ष मान फ़ंक्शन का उपयोग दूरी फ़ंक्शन के रूप में किया जाता है <math>\mathbb{R}</math>, किसी के लिए <math>p \geq 1</math>, <math>p</math>-वासेरस्टीन के बीच की दूरी <math>\mu_{1}</math> और <math>\mu_2</math> है
अनुमान <math>\mu_{1} = \delta_{a_{1}}</math> और <math>\mu_{2} = \delta_{a_{2}}</math> <math>\mathbb{R}</math> में बिंदुओं  <math>a_{1}</math> और <math>a_{2}</math> पर स्थित दो पतित वितरण (अर्थात डायराक डेल्टा वितरण) बनें है। इन दो मापों का केवल एक संभावित युग्मन है, अर्थात् बिंदु द्रव्यमान <math>\delta_{(a_{1}, a_{2})}</math> <math>(a_{1}, a_{2}) \in \mathbb{R}^{2}</math> पर स्थित है। इस प्रकार, किसी भी <math>p \geq 1</math> के लिए, <math>\mathbb{R}</math> पर दूरी फलन के रूप में सामान्य निरपेक्ष मान फलन का उपयोग करते हुए, <math>\mu_{1}</math> और <math>\mu_2</math> के मध्य <math>p</math>-वासेरस्टीन की दूरी है।
:<math>W_p (\mu_1, \mu_2) = | a_1 - a_2 | .</math>
:<math>W_p (\mu_1, \mu_2) = | a_1 - a_2 | .</math>
इसी तरह के तर्क से, अगर <math>\mu_{1} = \delta_{a_{1}}</math> और <math>\mu_{2} = \delta_{a_{2}}</math> बिंदुओं पर स्थित बिंदु द्रव्यमान हैं <math>a_{1}</math> और <math>a_{2}</math> में <math>\mathbb{R}^{n}</math>, और हम सामान्य [[यूक्लिडियन मानदंड]] का उपयोग करते हैं <math>\mathbb{R}^{n}</math> दूरी समारोह के रूप में, तब
इसी तरह के तर्क से, यदि <math>\mu_{1} = \delta_{a_{1}}</math> और <math>\mu_{2} = \delta_{a_{2}}</math> <math>\mathbb{R}^{n}</math> में बिंदु <math>a_{1}</math> और <math>a_{2}</math> पर स्थित बिंदु द्रव्यमान हैं, और दूरी फलन के रूप में <math>\mathbb{R}^{n}</math> पर सामान्य [[यूक्लिडियन मानदंड]] का उपयोग करते हैं, तब
:<math>W_p (\mu_1, \mu_2) = \| a_1 - a_2 \|_2 .</math>
:<math>W_p (\mu_1, \mu_2) = \| a_1 - a_2 \|_2 .</math>
==== अनुभवजन्य वितरण ====
==== अनुभवजन्य वितरण ====


=====एक आयाम=====
=====एक आयाम=====


अगर <math>P</math> नमूने के साथ एक [[अनुभवजन्य उपाय]] है <math>X_1, \ldots, X_n</math> और <math>Q</math> नमूने के साथ एक अनुभवजन्य उपाय है <math>Y_1, \ldots, Y_n</math>, दूरी आदेश आँकड़ों का एक सरल कार्य है:
अगर <math>P</math> प्रतिदर्श <math>X_1, \ldots, X_n</math> के साथ एक [[अनुभवजन्य उपाय|अनुभवजन्य माप]] है और <math>Q</math> प्रतिदर्श <math>Y_1, \ldots, Y_n</math> के साथ एक अनुभवजन्य माप है, तो दूरी क्रम के आँकड़ों का एक सरल फलन है:
:<math>W_p(P, Q) = \left( \frac{1}{n}\sum_{i=1}^n \|X_{(i)} - Y_{(i)}\|^p \right)^{1/p}</math>
:<math>W_p(P, Q) = \left( \frac{1}{n}\sum_{i=1}^n \|X_{(i)} - Y_{(i)}\|^p \right)^{1/p}</math>
===उच्च आयाम ===
===उच्च आयाम ===


अगर <math>P</math> और <math>Q</math> अनुभवजन्य वितरण हैं, प्रत्येक पर आधारित है <math>n</math> अवलोकन, फिर
यदि <math>P</math> और <math>Q</math> अनुभवजन्य वितरण हैं, प्रत्येक <math>n</math> अवलोकन पर आधारित है, तब


:<math>W_p(P, Q) = \inf_\pi \left( \sum_{i=1}^n \|X_i - Y_{\pi(i)}\|^p \right)^{1/p}</math>
:<math>W_p(P, Q) = \inf_\pi \left( \sum_{i=1}^n \|X_i - Y_{\pi(i)}\|^p \right)^{1/p}</math>
जहां infimum सभी क्रमपरिवर्तन से अधिक है <math>\pi</math> का <math>n</math> तत्व। यह एक रेखीय असाइनमेंट समस्या है, और [[हंगेरियन एल्गोरिथम]] द्वारा [[घन समय]] में हल किया जा सकता है।
जहां <math>n</math> तत्वों के सभी क्रमपरिवर्तन <math>\pi</math> पर सबसे कम है। यह एक रेखीय समनुदेश समस्या है, और [[हंगेरियन एल्गोरिथम|हंगेरियन कलनविधि]] द्वारा [[घन समय]] में समाधान किया जा सकता है।


=== सामान्य वितरण ===
=== सामान्य वितरण ===


होने देना <math>\mu_1 = \mathcal{N}(m_1, C_1)</math> और <math>\mu_2 = \mathcal{N}(m_2, C_2)</math> दो गैर-पतित गॉसियन उपायों (यानी [[सामान्य वितरण]]) पर हो <math>\mathbb{R}^n</math>, संबंधित [[अपेक्षित मूल्य]]ों के साथ <math>m_1</math> और <math>m_2 \in \mathbb{R}^n</math> और [[सममित सकारात्मक निश्चित]] | सममित सकारात्मक अर्ध-निश्चित सहप्रसरण मैट्रिक्स <math>C_{1}</math> और <math>C_2 \in \mathbb{R}^{n \times n}</math>. तब,<ref>{{cite journal | vauthors = Olkin I, Pukelsheim F | title = दिए गए फैलाव मैट्रिक्स के साथ दो यादृच्छिक वैक्टर के बीच की दूरी| journal = Linear Algebra and Its Applications | volume = 48 | date = October 1982 | pages = 257&ndash;263 | issn = 0024-3795 | doi = 10.1016/0024-3795(82)90112-4 | doi-access = free }}</ref> सामान्य यूक्लिडियन मानदंड के संबंध में <math>\mathbb{R}^{n}</math>, 2-वासेरस्टीन के बीच की दूरी <math>\mu_{1}</math> और <math>\mu_{2}</math> है
अनुमान <math>\mu_1 = \mathcal{N}(m_1, C_1)</math> और <math>\mu_2 = \mathcal{N}(m_2, C_2)</math> <math>\mathbb{R}^n</math> पर दो गैर-पतित गॉसियन मापक (यानी [[सामान्य वितरण]]) होने दें, संबंधित [[अपेक्षित मूल्य|अपेक्षित मूल्यों]] के साथ <math>m_1</math> और <math>m_2 \in \mathbb{R}^n</math> और [[सममित सकारात्मक निश्चित|सममित सकारात्मक]] अर्ध-निश्चित सहप्रसरण आव्यूह <math>C_{1}</math> और <math>C_2 \in \mathbb{R}^{n \times n}</math> है। तब,<ref>{{cite journal | vauthors = Olkin I, Pukelsheim F | title = दिए गए फैलाव मैट्रिक्स के साथ दो यादृच्छिक वैक्टर के बीच की दूरी| journal = Linear Algebra and Its Applications | volume = 48 | date = October 1982 | pages = 257&ndash;263 | issn = 0024-3795 | doi = 10.1016/0024-3795(82)90112-4 | doi-access = free }}</ref> <math>\mathbb{R}^{n}</math> पर सामान्य यूक्लिडियन मानदंड के संबंध में, <math>\mu_{1}</math> और <math>\mu_{2}</math> के मध्य 2-वासेरस्टीन की दूरी है।
:<math>W_{2} (\mu_1, \mu_2)^2 = \| m_1 - m_2 \|_2^2 + \mathop{\mathrm{trace}} \bigl( C_1 + C_2 - 2 \bigl( C_2^{1/2} C_1 C_2^{1/2} \bigr)^{1/2} \bigr) .</math>
:<math>W_{2} (\mu_1, \mu_2)^2 = \| m_1 - m_2 \|_2^2 + \mathop{\mathrm{trace}} \bigl( C_1 + C_2 - 2 \bigl( C_2^{1/2} C_1 C_2^{1/2} \bigr)^{1/2} \bigr) .</math>
ध्यान दें कि दूसरा शब्द (ट्रेस शामिल) ठीक (असामान्यीकृत) के बीच मीट्रिक है <math>C_1</math> और <math>C_2</math>.
ध्यान दें कि दूसरा शब्द (ट्रेस निहीत) यथार्थतः (असामान्यीकृत) <math>C_1</math> और <math>C_2</math> के मध्य मापीय है। यह परिणाम दो बिंदु द्रव्यमानों के मध्य वासेरस्टीन दूरी के पहले के उदाहरण को सामान्यीकृत करता है (कम से कम प्रकरण में <math>p = 2</math>), क्योंकि एक बिंदु द्रव्यमान को सामान्य वितरण के रूप में माना जा सकता है, जिसमें सहसंयोजक आव्यूह शून्य के समान होता है जिस प्रकरण में [[ट्रेस (रैखिक बीजगणित)]] शब्द लुप्त हो जाता है और केवल साधनों के मध्य यूक्लिडियन दूरी को सम्मलित करने वाला शब्द रहता है।
यह परिणाम दो बिंदुओं के द्रव्यमान (कम से कम मामले में) के बीच वासेरस्टीन दूरी के पहले के उदाहरण को सामान्य करता है <math>p = 2</math>), चूंकि एक बिंदु द्रव्यमान को सहप्रसरण मैट्रिक्स के साथ सामान्य वितरण के रूप में शून्य के बराबर माना जा सकता है, जिस स्थिति में [[ट्रेस (रैखिक बीजगणित)]] शब्द गायब हो जाता है और केवल साधनों के बीच यूक्लिडियन दूरी को शामिल करने वाला शब्द रहता है।


=== एक आयामी वितरण ===
=== एक आयामी वितरण ===


होने देना <math>\mu_1, \mu_2 \in P_p(\mathbb{R})</math> संभाव्यता उपायों पर हो <math>\mathbb{R}</math>, और उनके संचयी वितरण समारोह को निरूपित करें <math>F_1(x)</math> और <math>F_2(x)</math>. फिर परिवहन समस्या का एक विश्लेषणात्मक समाधान है: इष्टतम परिवहन संभाव्यता द्रव्यमान तत्वों के क्रम को संरक्षित करता है, इसलिए मात्रा पर द्रव्यमान <math>q</math> का <math>\mu_1</math> क्वांटाइल में जाता है <math>q</math> का <math>\mu_2</math>.
अनुमान  <math>\mu_1, \mu_2 \in P_p(\mathbb{R})</math> <math>\mathbb{R}</math> पर संभाव्यता मापक हैं, और <math>F_1(x)</math> और <math>F_2(x)</math> द्वारा उनके संचयी वितरण फलन को निरूपित करते हैं। फिर परिवहन समस्या का एक विश्लेषणात्मक समाधान है: इष्टतम परिवहन संभाव्यता द्रव्यमान तत्वों के क्रम को संरक्षित करता है, इसलिए <math>\mu_1</math> के विभाजक <math>q</math> पर द्रव्यमान <math>\mu_2</math> के विभाजक <math>q</math> में चला जाता है। इस प्रकार <math>\mu_1</math> और <math>\mu_2</math> के मध्य <math>p</math>-वासेरस्टीन की दूरी है।
इस प्रकार <math>p</math>-वासेरस्टीन के बीच की दूरी <math>\mu_1</math> और <math>\mu_2</math> है
:<math>W_p(\mu_1, \mu_2) = \left(\int_0^1 \left| F_1^{-1}(q) - F_2^{-1}(q) \right|^p \, \mathrm{d} q\right)^{1/p} </math>
:<math>W_p(\mu_1, \mu_2) = \left(\int_0^1 \left| F_1^{-1}(q) - F_2^{-1}(q) \right|^p \, \mathrm{d} q\right)^{1/p} </math>
कहाँ <math>F_1^{-1}</math> और <math>F_2^{-1}</math> [[मात्रात्मक समारोह]] (उलटा सीडीएफ) हैं।
जहाँ <math>F_1^{-1}</math> और <math>F_2^{-1}</math> [[मात्रात्मक समारोह|मात्रात्मक फलन]] (प्रतिलोम सीडीएफ) हैं। <math>p=1</math> के प्रकरण में, चर के परिवर्तन से सूत्र की ओर जाता है।
के मामले में <math>p=1</math>, चरों का परिवर्तन सूत्र की ओर ले जाता है
:<math>W_1(\mu_1, \mu_2) = \int_{\mathbb{R}} \left| F_1(x) - F_2(x) \right| \, \mathrm{d} x </math>.
:<math>W_1(\mu_1, \mu_2) = \int_{\mathbb{R}} \left| F_1(x) - F_2(x) \right| \, \mathrm{d} x </math>.


== अनुप्रयोग ==
== अनुप्रयोग ==


वासेरस्टीन मीट्रिक दो चर X और Y के प्रायिकता वितरण की तुलना करने का एक स्वाभाविक तरीका है, जहां एक चर दूसरे से छोटे, गैर-समान गड़बड़ी (यादृच्छिक या नियतात्मक) द्वारा प्राप्त किया जाता है।
वासेरस्टीन मापीय दो चर X और Y के प्रायिकता वितरण की तुलना करने का एक स्वाभाविक प्रकार है, जहां एक चर दूसरे से छोटे, गैर-समान क्षोभ (यादृच्छिक या नियतात्मक) द्वारा प्राप्त किया जाता है।
 
कंप्यूटर विज्ञान में, उदाहरण के लिए, मापीय W<sub>1</sub> का व्यापक रूप से असतत वितरणों की तुलना करने के लिए उपयोग किया जाता है, उदाहरण दो अंकीय प्रतिबिंब का [[रंग हिस्टोग्राम|रंग आयतचित्र]]; अधिक विवरण के लिए अर्थ स्थानांतरित की दूरी देखता है।


कंप्यूटर विज्ञान में, उदाहरण के लिए, मीट्रिक W<sub>1</sub> असतत वितरणों की तुलना करने के लिए व्यापक रूप से उपयोग किया जाता है, उदा। दो डिजिटल छवियों का [[रंग हिस्टोग्राम]]; अधिक विवरण के लिए अर्थ मूवर की दूरी देखें।
अपने काग़ज़ '[[वासेरस्टीन जीएएन]]' में, अरजोव्स्की एट अल<ref>{{Cite journal| vauthors = Arjovsky M, Chintala S, Bottou L |date= July 2017|title=वासेरस्टीन जनरेटिव एडवरसैरियल नेटवर्क|journal=International Conference on Machine Learning 214-223 | pages = 214–223|url=https://proceedings.mlr.press/v70/arjovsky17a.html}}</ref>और अन्य [[जनरेटिव प्रतिकूल नेटवर्क|प्रजनन विरोधात्मक संजाल]] (GAN) के मूल संरचना में सुधार करने के प्रकार के रूप में वासेरस्टीन-1 मापीय का उपयोग करते हैं, लुप्त होने वाले प्रवणता और विधि के निपात के परिणाम को कम करने के लिए है। सामान्य वितरण के विशेष प्रकरण का उपयोग फ़्रेचेट स्थापना दूरी में किया जाता है।


उनके पेपर '[[वासेरस्टीन जीएएन]]' में, अरजोव्स्की एट अल।<ref>{{Cite journal| vauthors = Arjovsky M, Chintala S, Bottou L |date= July 2017|title=वासेरस्टीन जनरेटिव एडवरसैरियल नेटवर्क|journal=International Conference on Machine Learning 214-223 | pages = 214–223|url=https://proceedings.mlr.press/v70/arjovsky17a.html}}</ref> वासेरस्टीन -1 मीट्रिक का उपयोग [[जनरेटिव प्रतिकूल नेटवर्क]] (GAN) के मूल ढांचे को बेहतर बनाने के तरीके के रूप में करें, ताकि लुप्त हो रही ढाल की समस्या और मोड के पतन के मुद्दों को कम किया जा सके। सामान्य वितरण के विशेष मामले का उपयोग फ़्रेचेट स्थापना दूरी में किया जाता है।
वासेरस्टीन मापीय का प्रोक्रिस्ट्स विश्लेषण के साथ एक औपचारिक श्रंखला है, जिसमें इंगित मापक के लिए आवेदन और विश्लेषण को आकार देने के लिए है।<ref>{{cite journal | vauthors = Petitjean M | title = चिरल मिश्रण| journal = Journal of Mathematical Physics | year = 2002 | volume = 43 | issue = 8 | pages = 4147–4157 | doi = 10.1063/1.1484559| bibcode = 2002JMP....43.4147P | url = https://hal.archives-ouvertes.fr/hal-02122882/file/PMP.JMP_2002.pdf }}</ref> <ref>{{cite journal | vauthors = Petitjean M | title =  From shape similarity to shape complementarity: toward a docking theory | journal = Journal of Mathematical Chemistry | year = 2004 | volume = 35 | issue = 3 | pages = 147–158 | doi = 10.1023/B:JOMC.0000033252.59423.6b| s2cid = 121320315 }}</ref>


वासेरस्टीन मेट्रिक का प्रोक्रिस्ट्स विश्लेषण के साथ एक औपचारिक लिंक है, जिसमें चिरायता उपायों के लिए आवेदन किया गया है,<ref>{{cite journal | vauthors = Petitjean M | title = चिरल मिश्रण| journal = Journal of Mathematical Physics | year = 2002 | volume = 43 | issue = 8 | pages = 4147–4157 | doi = 10.1063/1.1484559| bibcode = 2002JMP....43.4147P | url = https://hal.archives-ouvertes.fr/hal-02122882/file/PMP.JMP_2002.pdf }}</ref> और विश्लेषण को आकार देने के लिए।<ref>{{cite journal | vauthors = Petitjean M | title =  From shape similarity to shape complementarity: toward a docking theory | journal = Journal of Mathematical Chemistry | year = 2004 | volume = 35 | issue = 3 | pages = 147–158 | doi = 10.1023/B:JOMC.0000033252.59423.6b| s2cid = 121320315 }}</ref>
अभिकलन जीव विज्ञान में, वासेरस्टीन मापीय का उपयोग साइटोमेट्री आंकड़े समुच्चय के दृढ़ता आरेखों के मध्य तुलना करने के लिए किया जा सकता है।<ref>{{cite journal | vauthors = Mukherjee S, Wethington D, Dey TK, Das J | title = लगातार होमोलॉजी का उपयोग करके साइटोमेट्री डेटा में नैदानिक ​​​​रूप से प्रासंगिक विशेषताओं का निर्धारण| journal = PLOS Computational Biology | volume = 18 | issue = 3 | pages = e1009931 | date = March 2022 | pmid = 35312683 | pmc = 9009779 | doi = 10.1371/journal.pcbi.1009931 | arxiv = 2203.06263 | bibcode = 2022PLSCB..18E9931M }}</ref>
कम्प्यूटेशनल जीव विज्ञान में, साइटोमेट्री डेटासेट के [[लगातार समरूपता]] के बीच तुलना करने के लिए वासेरस्टीन मीट्रिक का उपयोग किया जा सकता है।<ref>{{cite journal | vauthors = Mukherjee S, Wethington D, Dey TK, Das J | title = लगातार होमोलॉजी का उपयोग करके साइटोमेट्री डेटा में नैदानिक ​​​​रूप से प्रासंगिक विशेषताओं का निर्धारण| journal = PLOS Computational Biology | volume = 18 | issue = 3 | pages = e1009931 | date = March 2022 | pmid = 35312683 | pmc = 9009779 | doi = 10.1371/journal.pcbi.1009931 | arxiv = 2203.06263 | bibcode = 2022PLSCB..18E9931M }}</ref>
भूभौतिकी में व्युत्क्रम समस्याओं में वासेरस्टीन मीट्रिक का भी उपयोग किया गया है।<ref>{{Cite journal |last1=Frederick |first1=Christina |last2=Yang |first2=Yunan |date=2022-05-06 |title=इष्टतम परिवहन की सहायता से चट्टान के आर-पार देखना|url=https://publications.mfo.de/handle/mfo/3941 |journal=Snapshots of Modern Mathematics from Oberwolfach|doi=10.14760/SNAP-2022-004-EN }}</ref>
वासेरस्टीन मीट्रिक का उपयोग [[एकीकृत सूचना सिद्धांत]] में अवधारणाओं और वैचारिक संरचनाओं के बीच अंतर की गणना करने के लिए किया जाता है।<ref>{{Cite journal |last1=Oizumi |first1=Masafumi|last2=Albantakis |first2=Larissa|last3=Tononi |first3=Giulio |date=2014-05-08 |title=From the Phenomenology to the Mechanisms of Consciousness: Integrated Information Theory 3.0 |journal=PLOS Computational Biology|volume=10 |issue=5 |pages=e1003588 |doi=10.1371/journal.pcbi.1003588|pmid=24811198 |pmc=4014402 |bibcode=2014PLSCB..10E3588O }}</ref>


भूभौतिकी में व्युत्क्रम समस्याओं में वासेरस्टीन मापीय का भी उपयोग किया गया है।<ref>{{Cite journal |last1=Frederick |first1=Christina |last2=Yang |first2=Yunan |date=2022-05-06 |title=इष्टतम परिवहन की सहायता से चट्टान के आर-पार देखना|url=https://publications.mfo.de/handle/mfo/3941 |journal=Snapshots of Modern Mathematics from Oberwolfach|doi=10.14760/SNAP-2022-004-EN }}</ref>


वासेरस्टीन मापीय का उपयोग [[एकीकृत सूचना सिद्धांत]] में अवधारणाओं और वैचारिक संरचनाओं के मध्य अंतर की गणना करने के लिए किया जाता है।<ref>{{Cite journal |last1=Oizumi |first1=Masafumi|last2=Albantakis |first2=Larissa|last3=Tononi |first3=Giulio |date=2014-05-08 |title=From the Phenomenology to the Mechanisms of Consciousness: Integrated Information Theory 3.0 |journal=PLOS Computational Biology|volume=10 |issue=5 |pages=e1003588 |doi=10.1371/journal.pcbi.1003588|pmid=24811198 |pmc=4014402 |bibcode=2014PLSCB..10E3588O }}</ref>
== गुण ==
== गुण ==


=== मीट्रिक संरचना ===
=== मापीय संरचना ===
 
यह दिखाया जा सकता है कि डब्ल्यू<sub>''p''</sub> ''पी'' पर एक मीट्रिक (गणित) के सभी सिद्धांतों को संतुष्ट करता है<sub>''p''</sub>(एम)। इसके अलावा, डब्ल्यू के संबंध में अभिसरण<sub>''p''</sub> उपायों के सामान्य कमजोर अभिसरण और पहले pth क्षणों के अभिसरण के बराबर है।<ref>{{Cite journal| vauthors = Clement P, Desch W |title=वासरस्टीन मीट्रिक के लिए त्रिभुज असमानता का एक प्रारंभिक प्रमाण|journal=Proceedings of the American Mathematical Society|volume=136|number=1|year=2008|pages=333–339|doi=10.1090/S0002-9939-07-09020-X|url=https://www.ams.org/journals/proc/2008-136-01/S0002-9939-07-09020-X/home.html|doi-access=free}}</ref>
 


=== डब्ल्यू का दोहरा प्रतिनिधित्व<sub>1</sub>===
यह दिखाया जा सकता है कि ''W<sub>p</sub>'', '''''P'''<sub>p</sub>(M)'' पर एक मापक (गणित) के सभी सिद्धांतों को संतुष्ट करता है। इसके अलावा, ''W<sub>p</sub>'' के संबंध में अभिसरण माप के सामान्य दुर्बल अभिसरण और पहले pth क्षणों के अभिसरण के समान है।<ref>{{Cite journal| vauthors = Clement P, Desch W |title=वासरस्टीन मीट्रिक के लिए त्रिभुज असमानता का एक प्रारंभिक प्रमाण|journal=Proceedings of the American Mathematical Society|volume=136|number=1|year=2008|pages=333–339|doi=10.1090/S0002-9939-07-09020-X|url=https://www.ams.org/journals/proc/2008-136-01/S0002-9939-07-09020-X/home.html|doi-access=free}}</ref>
W का निम्नलिखित दोहरा प्रतिनिधित्व<sub>1</sub> लियोनिद कांटोरोविच और रुबिनस्टीन (1958) के द्वैत प्रमेय का एक विशेष मामला है: जब μ और ν में [[ घिरा हुआ सेट ]] सपोर्ट (माप सिद्धांत) होता है,
=== ''W''<sub>1</sub> का दोहरा प्रतिनिधित्व===
''W''<sub>1</sub> का निम्नलिखित दोहरा प्रतिनिधित्व कांटोरोविच और रुबिनस्टीन (1958) के द्वैत प्रमेय का एक विशेष प्रकरण है: जब μ और ν का[[ घिरा हुआ सेट | परिबद्]] आश्रय होता है,


:<math>W_1 (\mu, \nu) = \sup \left\{ \left. \int_{M} f(x) \, \mathrm{d} (\mu - \nu) (x) \right| \text{continuous } f : M \to \mathbb{R}, \operatorname{Lip} (f) \leq 1 \right\},</math>
:<math>W_1 (\mu, \nu) = \sup \left\{ \left. \int_{M} f(x) \, \mathrm{d} (\mu - \nu) (x) \right| \text{continuous } f : M \to \mathbb{R}, \operatorname{Lip} (f) \leq 1 \right\},</math>
जहां लिप (एफ) एफ के लिए न्यूनतम लिप्सचिट्ज़ निरंतरता को दर्शाता है।
जहां लिप(f) ''f'' के लिए न्यूनतम लिप्सचिट्ज़ स्थिरांक को दर्शाता है।


इसकी तुलना रैडॉन मीट्रिक की परिभाषा से करें:
इसकी तुलना रैडॉन मापीय की परिभाषा से करें:


:<math>\rho (\mu, \nu) := \sup \left\{ \left. \int_M f(x) \, \mathrm{d} (\mu - \nu) (x) \right| \text{continuous } f : M \to [-1, 1] \right\}.</math>
:<math>\rho (\mu, \nu) := \sup \left\{ \left. \int_M f(x) \, \mathrm{d} (\mu - \nu) (x) \right| \text{continuous } f : M \to [-1, 1] \right\}.</math>
यदि मीट्रिक d कुछ स्थिर C से घिरा है, तब
यदि मापीय d कुछ स्थिर C से परिबद्ध है, तब


:<math>2 W_1 (\mu, \nu) \leq C \rho (\mu, \nu),</math>
:<math>2 W_1 (\mu, \nu) \leq C \rho (\mu, \nu),</math>
और इसलिए रैडॉन मीट्रिक में अभिसरण ('एम' एक [[पोलिश स्थान]] होने पर कुल भिन्नता अभिसरण के समान) का तात्पर्य वासरस्टीन मीट्रिक में अभिसरण से है, लेकिन इसके विपरीत नहीं।
और इसलिए रैडॉन मापीय में अभिसरण (कुल भिन्नता अभिसरण के समान जब '''M''<nowiki/>' एक [[पोलिश स्थान|पोलिश समष्टि]] है) का तात्पर्य वासरस्टीन मापीय में अभिसरण से है, लेकिन इसके विपरीत नहीं है।


== प्रमाण ==
== प्रमाण ==
निम्नलिखित एक सहज प्रमाण है जो तकनीकी बिंदुओं पर छोड़ देता है। में पूर्णतः कठोर प्रमाण मिलता है।<ref>{{Cite book |last=Villani |first=Cédric |url=https://www.worldcat.org/oclc/51477002 |title=इष्टतम परिवहन में विषय|date=2003 |publisher=American Mathematical Society |isbn=0-8218-3312-X |location=Providence, RI |chapter=Chapter 1: The Kantorovich Duality |oclc=51477002}}</ref>
निम्नलिखित एक सहज प्रमाण है जो तकनीकी बिंदुओं पर छोड़ देता है। पूर्णतः परिशुद्ध प्रमाण मिलता है।<ref>{{Cite book |last=Villani |first=Cédric |url=https://www.worldcat.org/oclc/51477002 |title=इष्टतम परिवहन में विषय|date=2003 |publisher=American Mathematical Society |isbn=0-8218-3312-X |location=Providence, RI |chapter=Chapter 1: The Kantorovich Duality |oclc=51477002}}</ref>
असतत मामला: कब <math>M</math> असतत है, 1-वासेरस्टीन दूरी के लिए हल करना रैखिक प्रोग्रामिंग में एक समस्या है:<math display="block">\begin{cases}
असतत प्रकरण: जब <math>M</math> असतत है, 1-वासेरस्टीन दूरी के लिए समाधान करना रैखिक क्रमादेशन में एक समस्या है:<math display="block">\begin{cases}
  \min_\gamma \sum_{x, y} c(x, y) \gamma(x, y) \\
  \min_\gamma \sum_{x, y} c(x, y) \gamma(x, y) \\
  \sum_y \gamma(x, y) = \mu(x) \\
  \sum_y \gamma(x, y) = \mu(x) \\
  \sum_x \gamma(x, y) = \nu(y) \\
  \sum_x \gamma(x, y) = \nu(y) \\
  \gamma \geq 0
  \gamma \geq 0
  \end{cases}</math>कहाँ <math>c: M \times M \to [0, \infty)</math> एक सामान्य लागत फलन है।
  \end{cases}</math>जहाँ <math>c: M \times M \to [0, \infty)</math> एक सामान्य <nowiki>''लागत फलन''</nowiki> है।


उपरोक्त समीकरणों को सावधानीपूर्वक मैट्रिक्स समीकरणों के रूप में लिखने पर, हमें इसका द्विरेखीय कार्यक्रम प्राप्त होता है<ref>{{Citation |last1=Matoušek |first1=Jiří |title=Duality of Linear Programming |url=http://dx.doi.org/10.1007/978-3-540-30717-4_6 |pages=81–104 |place=Berlin, Heidelberg |publisher=Springer Berlin Heidelberg |isbn=978-3-540-30697-9 |access-date=2022-07-15 |last2=Gärtner |first2=Bernd|series=Universitext |year=2007 |doi=10.1007/978-3-540-30717-4_6 }}</ref>:<math display="block">\begin{cases}
उपरोक्त समीकरणों को सावधानीपूर्वक आव्यूह समीकरणों के रूप में लिखने पर, हमें इसकी द्विरेखीय समस्या प्राप्त होती है<ref>{{Citation |last1=Matoušek |first1=Jiří |title=Duality of Linear Programming |url=http://dx.doi.org/10.1007/978-3-540-30717-4_6 |pages=81–104 |place=Berlin, Heidelberg |publisher=Springer Berlin Heidelberg |isbn=978-3-540-30697-9 |access-date=2022-07-15 |last2=Gärtner |first2=Bernd|series=Universitext |year=2007 |doi=10.1007/978-3-540-30717-4_6 }}</ref>:<math display="block">\begin{cases}
  \max_{f, g} \sum_x \mu(x)f(x) + \sum_y \nu(y)g(y)\\
  \max_{f, g} \sum_x \mu(x)f(x) + \sum_y \nu(y)g(y)\\
  f(x) + g(y) \leq c(x, y)
  f(x) + g(y) \leq c(x, y)
  \end{cases}</math>और दोहरे रेखीय कार्यक्रम # मजबूत द्वैत द्वारा, चूंकि मूल समस्या संभव और बंधी हुई है, इसलिए दोहरी समस्या है, और पहली समस्या में न्यूनतम दूसरी समस्या में अधिकतम के बराबर है। अर्थात्, समस्या युग्म प्रबल द्वैत प्रदर्शित करता है।
  \end{cases}</math>और रैखिक क्रमादेशनके द्वैत प्रमेय द्वारा, क्योंकि मूल समस्या संभव और परिबद्ध है, इसलिए दोहरी समस्या है, और पहली समस्या में न्यूनतम दूसरी समस्या में अधिकतम के समान है। अर्थात्, समस्या युग्म प्रबल द्वैत प्रदर्शित करता है।


सामान्य स्थिति के लिए, योगों को अभिन्न में परिवर्तित करके दोहरी समस्या पाई जाती है:<math display="block">\begin{cases}
सामान्य प्रकरण के लिए, योगों को अभिन्न में परिवर्तित करके दोहरी समस्या पाई जाती है:<math display="block">\begin{cases}
  \sup_{f, g} \mathbb E_{x\sim \mu}[f(x)] + \mathbb E_{y\sim \nu}[g(y)]\\
  \sup_{f, g} \mathbb E_{x\sim \mu}[f(x)] + \mathbb E_{y\sim \nu}[g(y)]\\
  f(x) + g(y) \leq c(x, y)
  f(x) + g(y) \leq c(x, y)
  \end{cases}</math>और मजबूत द्वैत अभी भी कायम है।
  \end{cases}</math>और प्रबलद्वैत अभी भी स्थिर है। सेड्रिक विलानी ने [[लुइस कैफरेली]] से निम्नलिखित व्याख्या की गणना की:<ref>{{Cite book |last=Villani |first=Cédric |url=https://www.worldcat.org/oclc/51477002 |title=इष्टतम परिवहन में विषय|date=2003 |publisher=American Mathematical Society |isbn=0-8218-3312-X |location=Providence, RI |chapter=1.1.3. The shipper's problem. |oclc=51477002}}</ref>
यह 'कांटोरोविच द्वैत प्रमेय' है। सेड्रिक विलानी ने [[लुइस कैफरेली]] से निम्नलिखित व्याख्या की गणना की:<ref>{{Cite book |last=Villani |first=Cédric |url=https://www.worldcat.org/oclc/51477002 |title=इष्टतम परिवहन में विषय|date=2003 |publisher=American Mathematical Society |isbn=0-8218-3312-X |location=Providence, RI |chapter=1.1.3. The shipper's problem. |oclc=51477002}}</ref>
 
<ब्लॉककोट>
मान लीजिए कि आप खानों से कुछ कोयले को <math>\mu</math> के रूप में वितरित करना चाहते हैं, कारखानों को, <math>\nu</math> के रूप में वितरित करना चाहते हैं। परिवहन का लागत फलन <math>c</math> है। अब एक शिपर आता है और आपके लिए परिवहन प्रस्तुत करता है। आप उसे <math>x</math> पर कोयला लोड करने के लिए प्रति कोयला <math>f(x)</math> भुगतान करेंगे, और <math>y</math> पर कोयले को उतारने के लिए उसे <math>g(y)</math> प्रति कोयला भुगतान करेंगे।
मान लीजिए कि आप खानों से कुछ कोयले को भेजना चाहते हैं, के रूप में वितरित किया गया <math>\mu</math>, कारखानों को, के रूप में वितरित किया गया <math>\nu</math>. परिवहन का लागत फलन है <math>c</math>. अब एक शिपर आता है और आपके लिए परिवहन करने की पेशकश करता है। आप उसे भुगतान करेंगे <math>f(x)</math> कोयले को लोड करने के लिए प्रति कोयला <math>x</math>, और उसे भुगतान करें <math>g(y)</math> कोयले को उतारने के लिए प्रति कोयला <math>y</math>.


आपके लिए सौदा स्वीकार करने के लिए, मूल्य अनुसूची को पूरा करना होगा <math>f(x) + g(y) \leq c(x, y)</math>. कांटोरोविच द्वैत कहता है कि शिपर एक मूल्य अनुसूची बना सकता है जो आपको लगभग उतना ही भुगतान करता है जितना आप स्वयं शिप करेंगे।</blockquote>इस परिणाम को प्राप्त करने के लिए आगे दबाया जा सकता है:{{Math theorem
आपके लिए सौदा स्वीकार करने के लिए, मूल्य अनुसूची को पूरा करना होगा <math>f(x) + g(y) \leq c(x, y)</math>. कांटोरोविच द्वैत कहता है कि शिपर एक मूल्य अनुसूची बना सकता है जो आपको लगभग उतना ही भुगतान करता है जितना आप स्वयं शिप करेंगे।इस परिणाम को प्राप्त करने के लिए आगे दबाया जा सकता है:{{Math theorem
| math_statement = When the probability space <math>\Omega</math> is a metric space, then   
| math_statement = When the probability space <math>\Omega</math> is a metric space, then   
for any fixed <math>K > 0</math>, <math display="block">W_1(\mu, \nu) = \frac 1 K\sup_{\|f\|_L \leq K} \mathbb{E}_{x\sim \mu}[f(x)] -\mathbb E_{y\sim \nu}[f(y)]</math>
for any fixed <math>K > 0</math>, <math display="block">W_1(\mu, \nu) = \frac 1 K\sup_{\|f\|_L \leq K} \mathbb{E}_{x\sim \mu}[f(x)] -\mathbb E_{y\sim \nu}[f(y)]</math>
Line 160: Line 148:
}}
}}


[[File:Infimal_convolution_of_a_cone_with_a_cubic_curve.svg|thumb|एक वक्र के साथ एक शंकु का अनंत कनवल्शन। ध्यान दें कि निचले लिफाफे में ढलान कैसे है <math>\leq 1</math>, और निचला लिफाफा उन हिस्सों पर वक्र के बराबर कैसे है जहां वक्र में ही ढलान है <math>\leq 1</math>.]]संभाव्यता स्थान होने पर दो अनौपचारिक दृढ़ संकल्प चरण स्पष्ट रूप से स्पष्ट होते हैं <math>\R</math>.
[[File:Infimal_convolution_of_a_cone_with_a_cubic_curve.svg|thumb|एक वक्र के साथ एक शंकु का अनंत संवलन। ध्यान दें कि कैसे निचले आवरण में ढलान <math>\leq 1</math> है, और कैसे निचला आवरण उन भागो पर वक्र के समान है जहां वक्र में ढलान <math>\leq 1</math> है।]]संभाव्यता समष्टि <math>\R</math> होने पर दो अनौपचारिक दृढ़ संकल्प पद दृष्टिगत रूप से स्पष्ट होते हैं।


सांकेतिक सुविधा के लिए, आइए <math>\square</math> अनंत कनवल्शन ऑपरेशन को निरूपित करें।
सांकेतिक सुविधा के लिए, अनुमान <math>\square</math> अनंत संवलन संचालन को निरूपित करता है।


पहले चरण के लिए, जहाँ हमने प्रयोग किया <math>f = cone\square (-g)</math>, का वक्र आरेखित करें <math>-g</math>, फिर प्रत्येक बिंदु पर, ढलान 1 का एक शंकु बनाएं, और शंकु के निचले लिफाफे को इस प्रकार लें <math>f</math>, जैसा कि आरेख में दिखाया गया है, तब <math>f</math> 1 से अधिक ढलान के साथ नहीं बढ़ सकता है। इस प्रकार इसके सभी छेदकों में ढलान है <math>\Big| \frac{f(x) - f(y)}{x-y}\Big| \leq 1</math>.
पहले पद के लिए, जहाँ हमने <math>f = cone\square (-g)</math> का प्रयोग किया था, <math>-g</math> का वक्र आरेखित करें, फिर प्रत्येक बिंदु पर, ढलान 1 का एक शंकु बनाएं, और शंकु के निचले आवरण को <math>f</math> के रूप में लें, जैसा कि आरेख में दिखाया गया है, तो <math>f</math> 1 से बड़े ढलान के साथ नहीं बढ़ सकता है। इस प्रकार इसके सभी व्युत्क्रम कोटिज्या का ढलान <math>\Big| \frac{f(x) - f(y)}{x-y}\Big| \leq 1</math> है।


दूसरे चरण के लिए, शिशु कनवल्शन को चित्रित करें <math>cone \square (-f)</math>, तो यदि सभी सेकेंट <math>f</math> अधिकतम 1 पर ढलान है, फिर का निचला लिफाफा <math>cone \square (-f) </math> इस प्रकार, केवल शंकु-शीर्ष हैं <math>cone \square (-f)=-f</math>.
दूसरे पद के लिए, अनंत संवलन <math>cone \square (-f)</math> को चित्रित करें, फिर यदि <math>f</math> के सभी व्युत्क्रम कोटिज्या अधिकतम 1 ढलान है, तो <math>cone \square (-f) </math> का निचला आवरण केवल शंकु-शीर्ष हैं, इस प्रकार <math>cone \square (-f)=-f</math> है।


1डी उदाहरण। कब दोनों <math>\mu, \nu</math> वितरण कर रहे हैं <math>\R</math>, फिर भागों द्वारा एकीकरण देते हैं<math display="block">\mathbb{E}_{x\sim \mu}[f(x)] - \mathbb E_{y\sim \nu}[f(y)] = \int f'(x) (F_\nu(x) - F_\mu(x)) dx</math>इस प्रकार<math display="block">
'''1D उदाहरण:''' जब दोनों <math>\mu, \nu</math> <math>\R</math> पर वितरण होते हैं, तो भागों द्वारा एकीकरण देते है।<math display="block">\mathbb{E}_{x\sim \mu}[f(x)] - \mathbb E_{y\sim \nu}[f(y)] = \int f'(x) (F_\nu(x) - F_\mu(x)) dx</math>इस प्रकार,<math display="block">
  f(x) = K \cdot \mathop{sign}(F_\nu(x) - F_\mu(x))</math>
  f(x) = K \cdot \mathop{sign}(F_\nu(x) - F_\mu(x))</math>
 
=== द्रव यांत्रिकी ''W''<sub>2</sub> की व्याख्या ===
 
बेनमौ और ब्रेनियर ने [[द्रव यांत्रिकी]] द्वारा <math>W_2</math> को दोहरा प्रतिनिधित्व मिला, जो [[उत्तल अनुकूलन]] द्वारा दक्ष समाधान की अनुमति देता है।<ref>{{Cite journal |last1=Benamou |first1=Jean-David |last2=Brenier |first2=Yann |date=2000-01-01 |title=Monge-Kantorovich मास ट्रांसफर समस्या के लिए एक कम्प्यूटेशनल द्रव यांत्रिकी समाधान|url=https://doi.org/10.1007/s002110050002 |journal=Numerische Mathematik |language=en |volume=84 |issue=3 |pages=375–393 |doi=10.1007/s002110050002 |s2cid=1100384 |issn=0945-3245}}</ref><ref>{{Cite journal |last1=Finlay |first1=Chris |last2=Jacobsen |first2=Joern-Henrik |last3=Nurbekyan |first3=Levon |last4=Oberman |first4=Adam |date=2020-11-21 |title=How to Train Your Neural ODE: the World of Jacobian and Kinetic Regularization |url=https://proceedings.mlr.press/v119/finlay20a.html |journal=International Conference on Machine Learning |language=en |publisher=PMLR |pages=3154–3164|arxiv=2002.02798 }}</ref>
=== डब्ल्यू की द्रव यांत्रिकी व्याख्या<sub>2</sub> ===
घनत्व <math>p, q</math> के साथ <math>\R^n</math> पर दो प्रायिकता वितरण दिए गए हैं, तब <math display="block">W_2(p, q) = \min_v \int_0^T \int_{\R^n} \|v(x, t)\|^2 \rho(x, t)dxdt</math>जहाँ <math>v(x, t)</math> एक वेग क्षेत्र है, और <math>\rho(x, t)</math> द्रव घनत्व क्षेत्र है, जैसे कि <math display="block">\begin{aligned}
बेनमौ और ब्रेनियर को इसका दोहरा प्रतिनिधित्व मिला <math>W_2</math> [[द्रव यांत्रिकी]] द्वारा, जो [[उत्तल अनुकूलन]] द्वारा कुशल समाधान की अनुमति देता है।<ref>{{Cite journal |last1=Benamou |first1=Jean-David |last2=Brenier |first2=Yann |date=2000-01-01 |title=Monge-Kantorovich मास ट्रांसफर समस्या के लिए एक कम्प्यूटेशनल द्रव यांत्रिकी समाधान|url=https://doi.org/10.1007/s002110050002 |journal=Numerische Mathematik |language=en |volume=84 |issue=3 |pages=375–393 |doi=10.1007/s002110050002 |s2cid=1100384 |issn=0945-3245}}</ref><ref>{{Cite journal |last1=Finlay |first1=Chris |last2=Jacobsen |first2=Joern-Henrik |last3=Nurbekyan |first3=Levon |last4=Oberman |first4=Adam |date=2020-11-21 |title=How to Train Your Neural ODE: the World of Jacobian and Kinetic Regularization |url=https://proceedings.mlr.press/v119/finlay20a.html |journal=International Conference on Machine Learning |language=en |publisher=PMLR |pages=3154–3164|arxiv=2002.02798 }}</ref>
पर दो प्रायिकता बंटन दिए गए हैं <math>\R^n</math> घनत्व के साथ <math>p, q</math>, तब <math display="block">W_2(p, q) = \min_v \int_0^T \int_{\R^n} \|v(x, t)\|^2 \rho(x, t)dxdt</math>कहाँ <math>v(x, t)</math> एक वेग क्षेत्र है, और <math>\rho(x, t)</math> द्रव घनत्व क्षेत्र है, जैसे कि <math display="block">\begin{aligned}
&\frac{\partial \rho(\cdot, t)}{\partial t}=-\operatorname{div}\left( \rho(\cdot, t) v \right) \\
&\frac{\partial \rho(\cdot, t)}{\partial t}=-\operatorname{div}\left( \rho(\cdot, t) v \right) \\
&\rho(x, 0)=p \\
&\rho(x, 0)=p \\
&\rho(x, T)=q
&\rho(x, T)=q
\end{aligned}</math>यही है, द्रव्यमान को संरक्षित किया जाना चाहिए, और वेग क्षेत्र को संभाव्यता वितरण को परिवहन करना चाहिए <math>p</math> को <math>q</math> समय अंतराल के दौरान <math>[0, T]</math>.
\end{aligned}</math>अर्थात्, द्रव्यमान को संरक्षित किया जाना चाहिए, और वेग क्षेत्र को समय अंतराल <math>[0, T]</math> के समय संभाव्यता वितरण  <math>p</math> को <math>q</math> तक ले जाना चाहिए।


=== डब्ल्यू की समानता<sub>2</sub> और एक नकारात्मक-क्रम सोबोलेव मानदंड ===
=== ''W''<sub>2</sub> की समतुल्यता और एक नकारात्मक-क्रम सोबोलेव मानदंड ===


उपयुक्त धारणाओं के तहत, वासेरस्टीन दूरी <math>W_2</math> ऑर्डर दो का लिप्सचिट्ज़ नकारात्मक-क्रम सजातीय सोबोलिव अंतरिक्ष के बराबर है।<ref>{{cite journal | vauthors = Peyre R | title = Comparison between ''W''<sub>2</sub> distance and ''H&#775;''<sup>&minus;1</sup> norm, and localization of Wasserstein distance | journal = ESAIM: Control, Optimisation and Calculus of Variations | volume = 24 | date = October 2018 | issue = 4 | pages = 1489&ndash;1501 | issn = 1292-8119 | doi = 10.1051/cocv/2017050 | doi-access = free }} (See Theorems 2.1 and 2.5.)</ref> अधिक सटीक, अगर हम लेते हैं <math>M</math> एक सकारात्मक माप से लैस एक [[जुड़ा हुआ स्थान]] [[रीमैनियन कई गुना]] होना <math>\pi</math>, तो हम के लिए परिभाषित कर सकते हैं <math>f \colon M \to \mathbb{R}</math> सेमिनोर्म
उपयुक्त धारणाओं के अंतर्गत, क्रम दो की वासेरस्टीन दूरी <math>W_2</math> लिप्सचिट्ज़ एक नकारात्मक-क्रम सजातीय सोबोलिव मानदंड के समान है।<ref>{{cite journal | vauthors = Peyre R | title = Comparison between ''W''<sub>2</sub> distance and ''H&#775;''<sup>&minus;1</sup> norm, and localization of Wasserstein distance | journal = ESAIM: Control, Optimisation and Calculus of Variations | volume = 24 | date = October 2018 | issue = 4 | pages = 1489&ndash;1501 | issn = 1292-8119 | doi = 10.1051/cocv/2017050 | doi-access = free }} (See Theorems 2.1 and 2.5.)</ref> अधिक सटीक रूप से, यदि हम <math>M</math> को एक सकारात्मक माप <math>\pi</math> से सुसज्जित एक [[जुड़ा हुआ स्थान|जुड़े हुए]] [[रीमैनियन कई गुना|रीमैनियन बहुरूपता]] के रूप में लेते हैं, तो हम <math>f \colon M \to \mathbb{R}</math> के लिए अर्धनॉर्मल परिभाषित कर सकते हैं। 
:<math>\| f \|_{\dot{H}^{1}(\pi)}^{2} = \int_{M} | \nabla f(x) |^{2} \, \pi(\mathrm{d} x)</math>
:<math>\| f \|_{\dot{H}^{1}(\pi)}^{2} = \int_{M} | \nabla f(x) |^{2} \, \pi(\mathrm{d} x)</math>
और एक [[हस्ताक्षरित उपाय]] के लिए <math>\mu</math> पर <math>M</math> दोहरा मानदंड
और <math>M</math> दोहरे मानदंड एक [[हस्ताक्षरित उपाय|हस्ताक्षरित मापक]] <math>\mu</math> के लिए 
:<math>\| \mu \|_{\dot{H}^{-1}(\pi)} = \sup \bigg\{ | \langle f, \mu \rangle | \,\bigg|\, \| f \|_{\dot{H}^{1}(\pi)} \leq 1 \bigg\} .</math>
:<math>\| \mu \|_{\dot{H}^{-1}(\pi)} = \sup \bigg\{ | \langle f, \mu \rangle | \,\bigg|\, \| f \|_{\dot{H}^{1}(\pi)} \leq 1 \bigg\} .</math>
तब किन्हीं दो प्रायिकता मापों को <math>\mu</math> और <math>\nu</math> पर <math>M</math> ऊपरी सीमा को संतुष्ट करें
तब <math>M</math> पर कोई भी दो प्रायिकता माप <math>\mu</math> और <math>\nu</math> ऊपरी सीमा को संतुष्ट करते हैं।
:<math>W_{2} (\mu, \nu) \leq 2 \| \mu - \nu \|_{\dot{H}^{-1}(\pi)} .</math>
:<math>W_{2} (\mu, \nu) \leq 2 \| \mu - \nu \|_{\dot{H}^{-1}(\pi)} .</math>
दूसरी दिशा में यदि <math>\mu</math> और <math>\nu</math> प्रत्येक में [[वॉल्यूम फॉर्म]] के संबंध में घनत्व होता है <math>M</math> जो दोनों कुछ से ऊपर बंधे हुए हैं <math>0 < C < \infty</math>, और <math>M</math> गैर-नकारात्मक रिक्की वक्रता है, तब
दूसरी दिशा में, यदि <math>\mu</math> और <math>\nu</math> प्रत्येक में <math>M</math> पर मानक मात्रा माप के संबंध में घनत्व है जो दोनों कुछ <math>0 < C < \infty</math> से ऊपर बंधे हैं, और <math>M</math> में गैर-नकारात्मक रिक्की वक्रता है, तब
:<math>\| \mu - \nu \|_{\dot{H}^{-1}(\pi)} \leq \sqrt{C} W_{2} (\mu, \nu) .</math>
:<math>\| \mu - \nu \|_{\dot{H}^{-1}(\pi)} \leq \sqrt{C} W_{2} (\mu, \nu) .</math>
=== पृथक्करणीयता और पूर्णता ===
=== पृथक्करणीयता और पूर्णता ===


किसी भी p ≥ 1 के लिए मीट्रिक स्थान ('P'<sub>''p''</sub>(एम), डब्ल्यू<sub>''p''</sub>) [[वियोज्य स्थान]] है, और पूर्ण स्थान है यदि (M, d) वियोज्य और पूर्ण है।<ref>{{cite journal| vauthors = Bogachev VI, Kolesnikov AV |title=The Monge–Kantorovich problem: achievements, connections, and perspectives|journal=[[Russian Mathematical Surveys]]| date = October 2012 |volume = 67|issue=5| pages= 785–890| doi= 10.1070/RM2012v067n05ABEH004808|bibcode=2012RuMaS..67..785B|s2cid=121411457 }}
किसी भी p ≥ 1 के लिए, मापीय समष्टि ('''''P'''<sub>p</sub>''(''M''), ''W<sub>p</sub>'') [[वियोज्य स्थान|वियोज्य]] है, और पूर्ण है यदि (M, d) वियोज्य और पूर्ण है।<ref>{{cite journal| vauthors = Bogachev VI, Kolesnikov AV |title=The Monge–Kantorovich problem: achievements, connections, and perspectives|journal=[[Russian Mathematical Surveys]]| date = October 2012 |volume = 67|issue=5| pages= 785–890| doi= 10.1070/RM2012v067n05ABEH004808|bibcode=2012RuMaS..67..785B|s2cid=121411457 }}
</ref>
</ref>
== यह भी देखें ==
== यह भी देखें ==


* [[हचिंसन मीट्रिक]]
* [[हचिंसन मीट्रिक|हचिंसन मापीय]]
* लेवी मीट्रिक
* [[लेवी मापीय]]
* लेवी-प्रोखोरोव मीट्रिक
* [[लेवी-प्रोखोरोव मापीय]]
* फ्रेचेट दूरी
* [[फ्रेचेट दूरी]]
* [[संभाव्यता उपायों की कुल भिन्नता दूरी]]
* [[संभाव्यता उपायों की कुल भिन्नता दूरी|संभाव्यता मापक की कुल भिन्नता दूरी]]
* [[परिवहन सिद्धांत (गणित)]]
* [[परिवहन सिद्धांत (गणित)]]
* पृथ्वी मूवर की दूरी
* [[पृथ्वी स्थानांतरित की दूरी]]
* वासेरस्टीन जीएएन
* [[वासेरस्टीन जीएएन]]


== संदर्भ ==
== संदर्भ ==
Line 215: Line 197:
== अग्रिम पठन ==
== अग्रिम पठन ==
{{refbegin}}
{{refbegin}}
* {{cite book | vauthors = Ambrosio L, Gigli N, Savaré G | title=Gradient Flows in Metric Spaces and in the Space of Probability Measures | publisher=ETH Zürich, Birkhäuser Verlag | location=Basel | year=2005 | isbn=978-3-7643-2428-5 }}
* {{cite book | vauthors = एम्ब्रोसियो एल, गिगली एन, सावरे जी | title=मीट्रिक स्पेस में ग्रेडिएंट फ्लो और प्रोबेबिलिटी मेजर्स के स्पेस में | publisher=ईटीएच ज्यूरिख, बिरखौसर वर्लाग | location=बासेल | year=2005 | isbn=978-3-7643-2428-5 }}
* {{cite journal | vauthors = Jordan R, Kinderlehrer D, Otto F | author3-link = Felix Otto (mathematician) | title = The variational formulation of the Fokker–Planck equation | journal = SIAM Journal on Mathematical Analysis | volume = 29 | date = January 1998 | pages = 1–17 (electronic) | issn = 0036-1410 | doi = 10.1137/S0036141096303359 | mr = 1617171 | issue = 1 | citeseerx = 10.1.1.6.8815 | s2cid = 13890235 }}
* {{cite journal | vauthors = जॉर्डन आर, किंडरलेहरर डी, ओटो एफ | author3-link = फेलिक्स ओटो (गणितज्ञ) | title = फोकर-प्लैंक समीकरण का परिवर्तनशील सूत्रीकरण | journal = गणितीय विश्लेषण पर SIAM जर्नल | volume = 29 | date = जनवरी 1998 | pages = 1–17 (इलेक्ट्रोनिक) | issn = 0036-1410 | doi = 10.1137/S0036141096303359 | mr = 1617171 | issue = 1 | citeseerx = 10.1.1.6.8815 | s2cid = 13890235 }}
* {{springer | vauthors = Rüschendorf L | id=Wasserstein_metric | title=Wasserstein metric}}
* {{springer | vauthors = रसचेंडॉर्फ  L | id=वासेरस्टीन मेट्रिक | title=वासेरस्टीन मेट्रिक}}
* {{cite book | vauthors = Villani C | title=Optimal Transport, Old and New | publisher=Springer | year=2008 | isbn=978-3-540-71050-9 }}
* {{cite book | vauthors = विलानी C | title=इष्टतम परिवहन, पुराना और नया | publisher=स्प्रिंगर | year=2008 | isbn=978-3-540-71050-9 }}
{{refend}}
{{refend}}




== बाहरी संबंध ==
== बाहरी संबंध ==
* {{cite web |url=https://stats.stackexchange.com/q/295617 |title=What is the advantages of Wasserstein metric compared to Kullback–Leibler divergence? |date=August 1, 2017 |work=[[Stack Exchange]] }}
* {{cite web |url=https://stats.stackexchange.com/q/295617 |title=कुल्बैक-लीब्लर विचलन की तुलना में वासेरस्टीन मीट्रिक के क्या फायदे हैं? |date=August 1, 2017 |work=[[Stack Exchange]] }}
[[Category: माप सिद्धांत]] [[Category: मीट्रिक ज्यामिति]] [[Category: संभाव्यता वितरण का सिद्धांत]] [[Category: सांख्यिकीय दूरी]]
 
 


[[Category: Machine Translated Page]]
[[Category:CS1 English-language sources (en)]]
[[Category:CS1 errors]]
[[Category:Created On 24/04/2023]]
[[Category:Created On 24/04/2023]]
[[Category:Lua-based templates]]
[[Category:Machine Translated Page]]
[[Category:Pages with maths render errors]]
[[Category:Pages with script errors]]
[[Category:Templates Vigyan Ready]]
[[Category:Templates that add a tracking category]]
[[Category:Templates that generate short descriptions]]
[[Category:Templates using TemplateData]]
[[Category:माप सिद्धांत]]
[[Category:मीट्रिक ज्यामिति]]
[[Category:संभाव्यता वितरण का सिद्धांत]]
[[Category:सांख्यिकीय दूरी]]

Latest revision as of 16:37, 17 October 2023

गणित में, वेसरस्टीन दूरी या कांटोरोविच-रुबिनस्टीन मापीय एक दूरी का फलन है जो किसी दिए गए मापीय समष्टि पर संभाव्यता वितरण के मध्य परिभाषित किया गया है। इसका नाम लियोनिद वेसरस्टीन के नाम पर रखा गया है।

सहज रूप से, यदि प्रत्येक वितरण को पर पुंजित पृथ्वी (मिट्टी) की एक इकाई मात्रा के रूप में देखा जाता है, मापीय एक समूह को दूसरे में बदलने की न्यूनतम ''लागत'' है, जिसे पृथ्वी की वह मात्रा माना जाता है जिसे स्थानांतरित करने के लिए माध्य दूरी से गुणा करने की आवश्यकता होती है। इस समस्या को पहली बार 1781 में गैसपार्ड मोंगे द्वारा औपचारिक रूप दिया गया था। इस समानता के कारण, मापीय को कंप्यूटर विज्ञान में अर्थ स्थानांतरित की दूरी के रूप में जाना जाता है।

स्वचल प्ररूप (रूसी, 1969) की बड़ी प्रणालियों का वर्णन करने वाली मार्कोव प्रक्रियाओं पर लियोनिद वेसरस्टीन के काम में इसे सीखने के बाद, 1970 में आर. एल. डोब्रुशिन द्वारा ''वासेरस्टीन दूरी'' नाम अविष्कार किया गया था।[1] हालांकि मापन को पहली बार प्रदार्थ और सामग्रियों की इष्टतम परिवहन योजना के संदर्भ में उत्पादन योजना और संगठन की गणितीय विधि (रूसी मूल 1939) में लियोनिद कांटोरोविच द्वारा परिभाषित किया गया था।[2] कुछ विद्वान इस प्रकार ''कांटोरोविच मापीय'' और ''कांटोरोविच दूरी'' शब्दों के उपयोग को प्रोत्साहित करते हैं। अधिकांश अंग्रेजी भाषा के प्रकाशन जर्मन वर्तनी ''वासेरस्टीन'' का उपयोग करते हैं (जर्मन मूल के होने के कारण ''वासेरस्टीन'' नाम दिया गया)।

परिभाषा

अनुमान एक मापीय समष्टि है जो एक राडोण समष्टि है। के लिए, परिमित -क्षण के साथ पर दो प्रायिकता उपायों और के मध्य वासरस्टीन -दूरी है।

जहाँ और के सभी युग्मन (संभाव्यता) का समुच्चय है। एक युग्मन , पर एक संयुक्त संभाव्यता मापक है, जिसके सीमान्त क्रमशः पहले और दूसरे कारकों पर और है। अर्थात,

अंतर्ज्ञान और इष्टतम परिवहन के लिए संबंध

दो एक आयामी वितरण और , x और y अक्षों पर आलेखित किए गए हैं, और एक संभावित संयुक्त वितरण जो उनके मध्य एक परिवहन योजना को परिभाषित करता है। संयुक्त वितरण/परिवहन योजना अद्वितीय नहीं है।

उपरोक्त परिभाषा को समझने का प्रकार इष्टतम परिवहन समस्या पर विचार करना है। अर्थात समष्टि पर द्रव्यमान के वितरण के लिए, हम द्रव्यमान को इस तरह से परिवहन करना चाहते हैं कि यह वितरण में परिवर्तित हो जाए; 'पृथ्वी के समूह' के समूह में बदलना है। यह समस्या केवल तभी समझ में आती है जब बनाए जाने वाले समूह का द्रव्यमान उतना ही हो जितना समूह को स्थानांतरित किया जाता है; इसलिए व्यापकता के हानि के बिना यह मान लें कि और संभाव्यता वितरण हैं जिनका कुल 1 द्रव्यमान है। यह भी मान लें कि कुछ लागत फलन दिया गया है

यह एक इकाई द्रव्यमान को बिंदु से बिंदु तक ले जाने की लागत देता है। को ले जाने की एक परिवहन योजना को एक फलन द्वारा वर्णित किया जा सकता है जो से तक जाने के लिए द्रव्यमान की मात्रा देता है। आप फलन की कल्पना कर सकते हैं कि आकृति की जमीन में छेद करने के लिए आकार की पृथ्वी के समूह को स्थानांतरित करने की आवश्यकता है, जैसे कि अंत में, मिट्टी का ढेर और जमीन में छेद दोनों पूरी तरह से लुप्त हो जाते हैं। इस योजना के सार्थक होने के लिए, इसे निम्नलिखित गुणों को पूरा करना होगा

अर्थात्, के आसपास एक अतिसूक्ष्म क्षेत्र से बाहर चला गया कुल द्रव्यमान के समान होना चाहिए और के आसपास एक क्षेत्र में स्थानांतरित कुल द्रव्यमान होना चाहिए। यह आवश्यकता के समान है कि सीमांत और के साथ एक संयुक्त संभाव्यता वितरण है। इस प्रकार, से तक पहुँचाया गया अतिसूक्ष्म द्रव्यमान है, और लागत फलन की परिभाषा के बाद चलने की लागत है। इसलिए, परिवहन योजना की कुल लागत है।

योजना अद्वितीय नहीं है; इष्टतम परिवहन योजना सभी संभावित परिवहन योजनाओं में से न्यूनतम लागत वाली योजना है। जैसा कि उल्लेख किया गया है, एक योजना के वैध होने की आवश्यकता यह है कि यह सीमांत और के साथ एक संयुक्त वितरण है; पहले खंड के रूप में ऐसे सभी उपायों के समुच्चय को दर्शाता है, इष्टतम योजना की लागत है

यदि एक चाल की लागत केवल दो बिंदुओं के मध्य की दूरी है, तो इष्टतम लागत दूरी की परिभाषा के समान है।

उदाहरण

बिंदु द्रव्यमान

नियतात्मक वितरण

अनुमान और में बिंदुओं और पर स्थित दो पतित वितरण (अर्थात डायराक डेल्टा वितरण) बनें है। इन दो मापों का केवल एक संभावित युग्मन है, अर्थात् बिंदु द्रव्यमान पर स्थित है। इस प्रकार, किसी भी के लिए, पर दूरी फलन के रूप में सामान्य निरपेक्ष मान फलन का उपयोग करते हुए, और के मध्य -वासेरस्टीन की दूरी है।

इसी तरह के तर्क से, यदि और में बिंदु और पर स्थित बिंदु द्रव्यमान हैं, और दूरी फलन के रूप में पर सामान्य यूक्लिडियन मानदंड का उपयोग करते हैं, तब

अनुभवजन्य वितरण

एक आयाम

अगर प्रतिदर्श के साथ एक अनुभवजन्य माप है और प्रतिदर्श के साथ एक अनुभवजन्य माप है, तो दूरी क्रम के आँकड़ों का एक सरल फलन है:

उच्च आयाम

यदि और अनुभवजन्य वितरण हैं, प्रत्येक अवलोकन पर आधारित है, तब

जहां तत्वों के सभी क्रमपरिवर्तन पर सबसे कम है। यह एक रेखीय समनुदेश समस्या है, और हंगेरियन कलनविधि द्वारा घन समय में समाधान किया जा सकता है।

सामान्य वितरण

अनुमान और पर दो गैर-पतित गॉसियन मापक (यानी सामान्य वितरण) होने दें, संबंधित अपेक्षित मूल्यों के साथ और और सममित सकारात्मक अर्ध-निश्चित सहप्रसरण आव्यूह और है। तब,[3] पर सामान्य यूक्लिडियन मानदंड के संबंध में, और के मध्य 2-वासेरस्टीन की दूरी है।

ध्यान दें कि दूसरा शब्द (ट्रेस निहीत) यथार्थतः (असामान्यीकृत) और के मध्य मापीय है। यह परिणाम दो बिंदु द्रव्यमानों के मध्य वासेरस्टीन दूरी के पहले के उदाहरण को सामान्यीकृत करता है (कम से कम प्रकरण में ), क्योंकि एक बिंदु द्रव्यमान को सामान्य वितरण के रूप में माना जा सकता है, जिसमें सहसंयोजक आव्यूह शून्य के समान होता है जिस प्रकरण में ट्रेस (रैखिक बीजगणित) शब्द लुप्त हो जाता है और केवल साधनों के मध्य यूक्लिडियन दूरी को सम्मलित करने वाला शब्द रहता है।

एक आयामी वितरण

अनुमान पर संभाव्यता मापक हैं, और और द्वारा उनके संचयी वितरण फलन को निरूपित करते हैं। फिर परिवहन समस्या का एक विश्लेषणात्मक समाधान है: इष्टतम परिवहन संभाव्यता द्रव्यमान तत्वों के क्रम को संरक्षित करता है, इसलिए के विभाजक पर द्रव्यमान के विभाजक में चला जाता है। इस प्रकार और के मध्य -वासेरस्टीन की दूरी है।

जहाँ और मात्रात्मक फलन (प्रतिलोम सीडीएफ) हैं। के प्रकरण में, चर के परिवर्तन से सूत्र की ओर जाता है।

.

अनुप्रयोग

वासेरस्टीन मापीय दो चर X और Y के प्रायिकता वितरण की तुलना करने का एक स्वाभाविक प्रकार है, जहां एक चर दूसरे से छोटे, गैर-समान क्षोभ (यादृच्छिक या नियतात्मक) द्वारा प्राप्त किया जाता है।

कंप्यूटर विज्ञान में, उदाहरण के लिए, मापीय W1 का व्यापक रूप से असतत वितरणों की तुलना करने के लिए उपयोग किया जाता है, उदाहरण दो अंकीय प्रतिबिंब का रंग आयतचित्र; अधिक विवरण के लिए अर्थ स्थानांतरित की दूरी देखता है।

अपने काग़ज़ 'वासेरस्टीन जीएएन' में, अरजोव्स्की एट अल[4]और अन्य प्रजनन विरोधात्मक संजाल (GAN) के मूल संरचना में सुधार करने के प्रकार के रूप में वासेरस्टीन-1 मापीय का उपयोग करते हैं, लुप्त होने वाले प्रवणता और विधि के निपात के परिणाम को कम करने के लिए है। सामान्य वितरण के विशेष प्रकरण का उपयोग फ़्रेचेट स्थापना दूरी में किया जाता है।

वासेरस्टीन मापीय का प्रोक्रिस्ट्स विश्लेषण के साथ एक औपचारिक श्रंखला है, जिसमें इंगित मापक के लिए आवेदन और विश्लेषण को आकार देने के लिए है।[5] [6]

अभिकलन जीव विज्ञान में, वासेरस्टीन मापीय का उपयोग साइटोमेट्री आंकड़े समुच्चय के दृढ़ता आरेखों के मध्य तुलना करने के लिए किया जा सकता है।[7]

भूभौतिकी में व्युत्क्रम समस्याओं में वासेरस्टीन मापीय का भी उपयोग किया गया है।[8]

वासेरस्टीन मापीय का उपयोग एकीकृत सूचना सिद्धांत में अवधारणाओं और वैचारिक संरचनाओं के मध्य अंतर की गणना करने के लिए किया जाता है।[9]

गुण

मापीय संरचना

यह दिखाया जा सकता है कि Wp, Pp(M) पर एक मापक (गणित) के सभी सिद्धांतों को संतुष्ट करता है। इसके अलावा, Wp के संबंध में अभिसरण माप के सामान्य दुर्बल अभिसरण और पहले pth क्षणों के अभिसरण के समान है।[10]

W1 का दोहरा प्रतिनिधित्व

W1 का निम्नलिखित दोहरा प्रतिनिधित्व कांटोरोविच और रुबिनस्टीन (1958) के द्वैत प्रमेय का एक विशेष प्रकरण है: जब μ और ν का परिबद् आश्रय होता है,

जहां लिप(f) f के लिए न्यूनतम लिप्सचिट्ज़ स्थिरांक को दर्शाता है।

इसकी तुलना रैडॉन मापीय की परिभाषा से करें:

यदि मापीय d कुछ स्थिर C से परिबद्ध है, तब

और इसलिए रैडॉन मापीय में अभिसरण (कुल भिन्नता अभिसरण के समान जब 'M' एक पोलिश समष्टि है) का तात्पर्य वासरस्टीन मापीय में अभिसरण से है, लेकिन इसके विपरीत नहीं है।

प्रमाण

निम्नलिखित एक सहज प्रमाण है जो तकनीकी बिंदुओं पर छोड़ देता है। पूर्णतः परिशुद्ध प्रमाण मिलता है।[11] असतत प्रकरण: जब असतत है, 1-वासेरस्टीन दूरी के लिए समाधान करना रैखिक क्रमादेशन में एक समस्या है:

जहाँ एक सामान्य ''लागत फलन'' है।

उपरोक्त समीकरणों को सावधानीपूर्वक आव्यूह समीकरणों के रूप में लिखने पर, हमें इसकी द्विरेखीय समस्या प्राप्त होती है[12]:

और रैखिक क्रमादेशनके द्वैत प्रमेय द्वारा, क्योंकि मूल समस्या संभव और परिबद्ध है, इसलिए दोहरी समस्या है, और पहली समस्या में न्यूनतम दूसरी समस्या में अधिकतम के समान है। अर्थात्, समस्या युग्म प्रबल द्वैत प्रदर्शित करता है।

सामान्य प्रकरण के लिए, योगों को अभिन्न में परिवर्तित करके दोहरी समस्या पाई जाती है:

और प्रबलद्वैत अभी भी स्थिर है। सेड्रिक विलानी ने लुइस कैफरेली से निम्नलिखित व्याख्या की गणना की:[13]

मान लीजिए कि आप खानों से कुछ कोयले को के रूप में वितरित करना चाहते हैं, कारखानों को, के रूप में वितरित करना चाहते हैं। परिवहन का लागत फलन है। अब एक शिपर आता है और आपके लिए परिवहन प्रस्तुत करता है। आप उसे पर कोयला लोड करने के लिए प्रति कोयला भुगतान करेंगे, और पर कोयले को उतारने के लिए उसे प्रति कोयला भुगतान करेंगे।

आपके लिए सौदा स्वीकार करने के लिए, मूल्य अनुसूची को पूरा करना होगा . कांटोरोविच द्वैत कहता है कि शिपर एक मूल्य अनुसूची बना सकता है जो आपको लगभग उतना ही भुगतान करता है जितना आप स्वयं शिप करेंगे।इस परिणाम को प्राप्त करने के लिए आगे दबाया जा सकता है:

Theorem (Kantorovich-Rubenstein duality) — When the probability space is a metric space, then for any fixed ,

where is the Lipschitz norm.

Proof

It suffices to prove the case of . Start with

Then, for any choice of , one can push the term higher by setting , making it an infimal convolution of with a cone. This implies for any , that is, .

Thus,

Next, for any choice of , can be optimized by setting . Since , this implies .

एक वक्र के साथ एक शंकु का अनंत संवलन। ध्यान दें कि कैसे निचले आवरण में ढलान है, और कैसे निचला आवरण उन भागो पर वक्र के समान है जहां वक्र में ढलान है।

संभाव्यता समष्टि होने पर दो अनौपचारिक दृढ़ संकल्प पद दृष्टिगत रूप से स्पष्ट होते हैं।

सांकेतिक सुविधा के लिए, अनुमान अनंत संवलन संचालन को निरूपित करता है।

पहले पद के लिए, जहाँ हमने का प्रयोग किया था, का वक्र आरेखित करें, फिर प्रत्येक बिंदु पर, ढलान 1 का एक शंकु बनाएं, और शंकु के निचले आवरण को के रूप में लें, जैसा कि आरेख में दिखाया गया है, तो 1 से बड़े ढलान के साथ नहीं बढ़ सकता है। इस प्रकार इसके सभी व्युत्क्रम कोटिज्या का ढलान है।

दूसरे पद के लिए, अनंत संवलन को चित्रित करें, फिर यदि के सभी व्युत्क्रम कोटिज्या अधिकतम 1 ढलान है, तो का निचला आवरण केवल शंकु-शीर्ष हैं, इस प्रकार है।

1D उदाहरण: जब दोनों पर वितरण होते हैं, तो भागों द्वारा एकीकरण देते है।

इस प्रकार,

द्रव यांत्रिकी W2 की व्याख्या

बेनमौ और ब्रेनियर ने द्रव यांत्रिकी द्वारा को दोहरा प्रतिनिधित्व मिला, जो उत्तल अनुकूलन द्वारा दक्ष समाधान की अनुमति देता है।[14][15] घनत्व के साथ पर दो प्रायिकता वितरण दिए गए हैं, तब

जहाँ एक वेग क्षेत्र है, और द्रव घनत्व क्षेत्र है, जैसे कि
अर्थात्, द्रव्यमान को संरक्षित किया जाना चाहिए, और वेग क्षेत्र को समय अंतराल के समय संभाव्यता वितरण को तक ले जाना चाहिए।

W2 की समतुल्यता और एक नकारात्मक-क्रम सोबोलेव मानदंड

उपयुक्त धारणाओं के अंतर्गत, क्रम दो की वासेरस्टीन दूरी लिप्सचिट्ज़ एक नकारात्मक-क्रम सजातीय सोबोलिव मानदंड के समान है।[16] अधिक सटीक रूप से, यदि हम को एक सकारात्मक माप से सुसज्जित एक जुड़े हुए रीमैनियन बहुरूपता के रूप में लेते हैं, तो हम के लिए अर्धनॉर्मल परिभाषित कर सकते हैं।

और दोहरे मानदंड एक हस्ताक्षरित मापक के लिए

तब पर कोई भी दो प्रायिकता माप और ऊपरी सीमा को संतुष्ट करते हैं।

दूसरी दिशा में, यदि और प्रत्येक में पर मानक मात्रा माप के संबंध में घनत्व है जो दोनों कुछ से ऊपर बंधे हैं, और में गैर-नकारात्मक रिक्की वक्रता है, तब

पृथक्करणीयता और पूर्णता

किसी भी p ≥ 1 के लिए, मापीय समष्टि (Pp(M), Wp) वियोज्य है, और पूर्ण है यदि (M, d) वियोज्य और पूर्ण है।[17]

यह भी देखें

संदर्भ

  1. Vaserstein LN (1969). "मार्कोव ऑटोमेटा की बड़ी प्रणालियों का वर्णन करते हुए रिक्त स्थान के अगणनीय उत्पादों पर प्रक्रिया करता है" (PDF). Problemy Peredači Informacii. 5 (3): 64–72.
  2. Kantorovich LV (1939). "उत्पादन के आयोजन और योजना के गणितीय तरीके". Management Science. 6 (4): 366–422. doi:10.1287/mnsc.6.4.366. JSTOR 2627082.
  3. Olkin I, Pukelsheim F (October 1982). "दिए गए फैलाव मैट्रिक्स के साथ दो यादृच्छिक वैक्टर के बीच की दूरी". Linear Algebra and Its Applications. 48: 257–263. doi:10.1016/0024-3795(82)90112-4. ISSN 0024-3795.
  4. Arjovsky M, Chintala S, Bottou L (July 2017). "वासेरस्टीन जनरेटिव एडवरसैरियल नेटवर्क". International Conference on Machine Learning 214-223: 214–223.
  5. Petitjean M (2002). "चिरल मिश्रण" (PDF). Journal of Mathematical Physics. 43 (8): 4147–4157. Bibcode:2002JMP....43.4147P. doi:10.1063/1.1484559.
  6. Petitjean M (2004). "From shape similarity to shape complementarity: toward a docking theory". Journal of Mathematical Chemistry. 35 (3): 147–158. doi:10.1023/B:JOMC.0000033252.59423.6b. S2CID 121320315.
  7. Mukherjee S, Wethington D, Dey TK, Das J (March 2022). "लगातार होमोलॉजी का उपयोग करके साइटोमेट्री डेटा में नैदानिक ​​​​रूप से प्रासंगिक विशेषताओं का निर्धारण". PLOS Computational Biology. 18 (3): e1009931. arXiv:2203.06263. Bibcode:2022PLSCB..18E9931M. doi:10.1371/journal.pcbi.1009931. PMC 9009779. PMID 35312683. {{cite journal}}: zero width space character in |title= at position 60 (help)
  8. Frederick, Christina; Yang, Yunan (2022-05-06). "इष्टतम परिवहन की सहायता से चट्टान के आर-पार देखना". Snapshots of Modern Mathematics from Oberwolfach. doi:10.14760/SNAP-2022-004-EN.
  9. Oizumi, Masafumi; Albantakis, Larissa; Tononi, Giulio (2014-05-08). "From the Phenomenology to the Mechanisms of Consciousness: Integrated Information Theory 3.0". PLOS Computational Biology. 10 (5): e1003588. Bibcode:2014PLSCB..10E3588O. doi:10.1371/journal.pcbi.1003588. PMC 4014402. PMID 24811198.
  10. Clement P, Desch W (2008). "वासरस्टीन मीट्रिक के लिए त्रिभुज असमानता का एक प्रारंभिक प्रमाण". Proceedings of the American Mathematical Society. 136 (1): 333–339. doi:10.1090/S0002-9939-07-09020-X.
  11. Villani, Cédric (2003). "Chapter 1: The Kantorovich Duality". इष्टतम परिवहन में विषय. Providence, RI: American Mathematical Society. ISBN 0-8218-3312-X. OCLC 51477002.
  12. Matoušek, Jiří; Gärtner, Bernd (2007), Duality of Linear Programming, Universitext, Berlin, Heidelberg: Springer Berlin Heidelberg, pp. 81–104, doi:10.1007/978-3-540-30717-4_6, ISBN 978-3-540-30697-9, retrieved 2022-07-15
  13. Villani, Cédric (2003). "1.1.3. The shipper's problem.". इष्टतम परिवहन में विषय. Providence, RI: American Mathematical Society. ISBN 0-8218-3312-X. OCLC 51477002.
  14. Benamou, Jean-David; Brenier, Yann (2000-01-01). "Monge-Kantorovich मास ट्रांसफर समस्या के लिए एक कम्प्यूटेशनल द्रव यांत्रिकी समाधान". Numerische Mathematik (in English). 84 (3): 375–393. doi:10.1007/s002110050002. ISSN 0945-3245. S2CID 1100384.
  15. Finlay, Chris; Jacobsen, Joern-Henrik; Nurbekyan, Levon; Oberman, Adam (2020-11-21). "How to Train Your Neural ODE: the World of Jacobian and Kinetic Regularization". International Conference on Machine Learning (in English). PMLR: 3154–3164. arXiv:2002.02798.
  16. Peyre R (October 2018). "Comparison between W2 distance and −1 norm, and localization of Wasserstein distance". ESAIM: Control, Optimisation and Calculus of Variations. 24 (4): 1489–1501. doi:10.1051/cocv/2017050. ISSN 1292-8119. (See Theorems 2.1 and 2.5.)
  17. Bogachev VI, Kolesnikov AV (October 2012). "The Monge–Kantorovich problem: achievements, connections, and perspectives". Russian Mathematical Surveys. 67 (5): 785–890. Bibcode:2012RuMaS..67..785B. doi:10.1070/RM2012v067n05ABEH004808. S2CID 121411457.


अग्रिम पठन

  • एम्ब्रोसियो एल, गिगली एन, सावरे जी (2005). मीट्रिक स्पेस में ग्रेडिएंट फ्लो और प्रोबेबिलिटी मेजर्स के स्पेस में. बासेल: ईटीएच ज्यूरिख, बिरखौसर वर्लाग. ISBN 978-3-7643-2428-5. {{cite book}}: Vancouver style error: name in name 1 (help)
  • जॉर्डन आर, किंडरलेहरर डी, ओटो एफ (जनवरी 1998). "फोकर-प्लैंक समीकरण का परिवर्तनशील सूत्रीकरण". गणितीय विश्लेषण पर SIAM जर्नल. 29 (1): 1–17 (इलेक्ट्रोनिक). CiteSeerX 10.1.1.6.8815. doi:10.1137/S0036141096303359. ISSN 0036-1410. MR 1617171. S2CID 13890235. {{cite journal}}: Check date values in: |date= (help); Vancouver style error: name in name 1 (help)
  • रसचेंडॉर्फ L (2001) [1994], "वासेरस्टीन मेट्रिक", Encyclopedia of Mathematics, EMS Press {{citation}}: Vancouver style error: non-Latin character in name 1 (help)
  • विलानी C (2008). इष्टतम परिवहन, पुराना और नया. स्प्रिंगर. ISBN 978-3-540-71050-9. {{cite book}}: Vancouver style error: non-Latin character in name 1 (help)


बाहरी संबंध