गणित और गणितीय अनुकूलन में, किसी फ़ंक्शन का उत्तल संयुग्म लीजेंड्रे परिवर्तन का एक सामान्यीकरण है जो गैर-उत्तल कार्यों पर लागू होता है। इसे पौराणिक परिवर्तन , फेनचेल ट्रांसफॉर्मेशन, या फेनचेल कंजुगेट (एड्रियन-मैरी लीजेंड्रे और वर्नर फेनेल के बाद) के रूप में भी जाना जाता है। यह विशेष रूप से लैग्रेंजियन द्वैत के दूरगामी सामान्यीकरण की अनुमति देता है।
परिभाषा
होने देना X {\displaystyle X} एक वास्तविक संख्या टोपोलॉजिकल वेक्टर स्पेस बनें और चलो X ∗ {\displaystyle X^{*}} करने के लिए दोहरी जगह हो X {\displaystyle X} . द्वारा निरूपित करें
⟨ ⋅ , ⋅ ⟩ : X ∗ × X → R {\displaystyle \langle \cdot ,\cdot \rangle :X^{*}\times X\to \mathbb {R} }
विहित दोहरी जोड़ी , जिसे द्वारा परिभाषित किया गया है ( x ∗ , x ) ↦ x ∗ ( x ) . {\displaystyle \left(x^{*},x\right)\mapsto x^{*}(x).} एक समारोह के लिए f : X → R ∪ { − ∞ , + ∞ } {\displaystyle f:X\to \mathbb {R} \cup \{-\infty ,+\infty \}} विस्तारित वास्तविक संख्या रेखा पर मान लेते हुए, यहconvex conjugate फ़ंक्शन है
f ∗ : X ∗ → R ∪ { − ∞ , + ∞ } {\displaystyle f^{*}:X^{*}\to \mathbb {R} \cup \{-\infty ,+\infty \}}
जिसका मूल्य पर x ∗ ∈ X ∗ {\displaystyle x^{*}\in X^{*}} सर्वोच्च के रूप में परिभाषित किया गया है:
f ∗ ( x ∗ ) := sup { ⟨ x ∗ , x ⟩ − f ( x ) : x ∈ X } , {\displaystyle f^{*}\left(x^{*}\right):=\sup \left\{\left\langle x^{*},x\right\rangle -f(x)~\colon ~x\in X\right\},}
या, समकक्ष, न्यूनतम के संदर्भ में:
f ∗ ( x ∗ ) := − inf { f ( x ) − ⟨ x ∗ , x ⟩ : x ∈ X } . {\displaystyle f^{*}\left(x^{*}\right):=-\inf \left\{f(x)-\left\langle x^{*},x\right\rangle ~\colon ~x\in X\right\}.}
इस परिभाषा की व्याख्या इसके सहायक हाइपरप्लेन के संदर्भ में फ़ंक्शन के एपिग्राफ (गणित) के उत्तल पतवार के एन्कोडिंग के रूप में की जा सकती है।[1]
उदाहरण
अधिक उदाहरणों के लिए देखें § Table of selected convex conjugates .
एक एफ़िन फ़ंक्शन का उत्तल संयुग्म f ( x ) = ⟨ a , x ⟩ − b {\displaystyle f(x)=\left\langle a,x\right\rangle -b} है f ∗ ( x ∗ ) = { b , x ∗ = a + ∞ , x ∗ ≠ a . {\displaystyle f^{*}\left(x^{*}\right)={\begin{cases}b,&x^{*}=a\\+\infty ,&x^{*}\neq a.\end{cases}}}
किसी शक्ति फलन का उत्तल संयुग्म f ( x ) = 1 p | x | p , 1 < p < ∞ {\displaystyle f(x)={\frac {1}{p}}|x|^{p},1<p<\infty } है f ∗ ( x ∗ ) = 1 q | x ∗ | q , 1 < q < ∞ , where 1 p + 1 q = 1. {\displaystyle f^{*}\left(x^{*}\right)={\frac {1}{q}}|x^{*}|^{q},1<q<\infty ,{\text{where}}{\tfrac {1}{p}}+{\tfrac {1}{q}}=1.}
निरपेक्ष मान फ़ंक्शन का उत्तल संयुग्म f ( x ) = | x | {\displaystyle f(x)=\left|x\right|} है f ∗ ( x ∗ ) = { 0 , | x ∗ | ≤ 1 ∞ , | x ∗ | > 1. {\displaystyle f^{*}\left(x^{*}\right)={\begin{cases}0,&\left|x^{*}\right|\leq 1\\\infty ,&\left|x^{*}\right|>1.\end{cases}}}
घातीय फलन का उत्तल संयुग्म f ( x ) = e x {\displaystyle f(x)=e^{x}} है f ∗ ( x ∗ ) = { x ∗ ln x ∗ − x ∗ , x ∗ > 0 0 , x ∗ = 0 ∞ , x ∗ < 0. {\displaystyle f^{*}\left(x^{*}\right)={\begin{cases}x^{*}\ln x^{*}-x^{*},&x^{*}>0\\0,&x^{*}=0\\\infty ,&x^{*}<0.\end{cases}}}
घातीय फ़ंक्शन के उत्तल संयुग्म और लीजेंड्रे ट्रांसफॉर्म सहमत हैं, सिवाय इसके कि उत्तल संयुग्म के फ़ंक्शन का डोमेन सख्ती से बड़ा है क्योंकि लीजेंड्रे ट्रांसफॉर्म केवल सकारात्मक वास्तविक संख्याओं के लिए परिभाषित किया गया है।
अपेक्षित कमी के साथ संबंध (जोखिम पर औसत मूल्य)
उदाहरण के लिए यह लेख देखें।
मान लीजिए F एक यादृच्छिक चर X के संचयी वितरण फ़ंक्शन को दर्शाता है। फिर (भागों द्वारा एकीकृत),
f ( x ) := ∫ − ∞ x F ( u ) d u = E [ max ( 0 , x − X ) ] = x − E [ min ( x , X ) ] {\displaystyle f(x):=\int _{-\infty }^{x}F(u)\,du=\operatorname {E} \left[\max(0,x-X)\right]=x-\operatorname {E} \left[\min(x,X)\right]}
उत्तल संयुग्म है
f ∗ ( p ) = ∫ 0 p F − 1 ( q ) d q = ( p − 1 ) F − 1 ( p ) + E [ min ( F − 1 ( p ) , X ) ] = p F − 1 ( p ) − E [ max ( 0 , F − 1 ( p ) − X ) ] . {\displaystyle f^{*}(p)=\int _{0}^{p}F^{-1}(q)\,dq=(p-1)F^{-1}(p)+\operatorname {E} \left[\min(F^{-1}(p),X)\right]=pF^{-1}(p)-\operatorname {E} \left[\max(0,F^{-1}(p)-X)\right].}
ऑर्डर करना
एक विशेष व्याख्या में परिवर्तन होता है
f inc ( x ) := arg sup t t ⋅ x − ∫ 0 1 max { t − f ( u ) , 0 } d u , {\displaystyle f^{\text{inc}}(x):=\arg \sup _{t}t\cdot x-\int _{0}^{1}\max\{t-f(u),0\}\,du,}
चूँकि यह प्रारंभिक फ़ंक्शन f की गैर-घटती पुनर्व्यवस्था है; विशेष रूप से,
f inc = f {\displaystyle f^{\text{inc}}=f} एफ गैर-घटने के लिए।
गुण
एक बंद उत्तल फ़ंक्शन का उत्तल संयुग्म फिर से एक बंद उत्तल फ़ंक्शन है। एक बहुफलकीय उत्तल कार्य का उत्तल संयुग्म (बहुतल एपिग्राफ (गणित) के साथ एक उत्तल फ़ंक्शन) फिर से एक पॉलीहेड्रल उत्तल फ़ंक्शन है।
आदेश उलटना
इसकी घोषणा करें f ≤ g {\displaystyle f\leq g} अगर और केवल अगर f ( x ) ≤ g ( x ) {\displaystyle f(x)\leq g(x)} सभी के लिए x . {\displaystyle x.} फिर उत्तल-संयुग्मन ऑर्डर सिद्धांत | ऑर्डर-रिवर्सिंग है, जिसकी परिभाषा का अर्थ है कि यदि f ≤ g {\displaystyle f\leq g} तब f ∗ ≥ g ∗ . {\displaystyle f^{*}\geq g^{*}.} कार्यों के एक परिवार के लिए ( f α ) α {\displaystyle \left(f_{\alpha }\right)_{\alpha }} यह इस तथ्य से निकलता है कि सर्वोच्चों को आपस में बदला जा सकता है
( inf α f α ) ∗ ( x ∗ ) = sup α f α ∗ ( x ∗ ) , {\displaystyle \left(\inf _{\alpha }f_{\alpha }\right)^{*}(x^{*})=\sup _{\alpha }f_{\alpha }^{*}(x^{*}),}
और अधिकतम-न्यूनतम असमानता से
( sup α f α ) ∗ ( x ∗ ) ≤ inf α f α ∗ ( x ∗ ) . {\displaystyle \left(\sup _{\alpha }f_{\alpha }\right)^{*}(x^{*})\leq \inf _{\alpha }f_{\alpha }^{*}(x^{*}).}
उभयलिंगी
किसी फ़ंक्शन का उत्तल संयुग्म हमेशा निचला अर्ध-निरंतर होता है। उभयलिंगी f ∗ ∗ {\displaystyle f^{**}} (उत्तल संयुग्म का उत्तल संयुग्म) बंद उत्तल पतवार भी है, यानी सबसे बड़ा निचला अर्ध-निरंतर उत्तल कार्य f ∗ ∗ ≤ f . {\displaystyle f^{**}\leq f.} उचित उत्तल कार्य के लिए f , {\displaystyle f,} :f = f ∗ ∗ {\displaystyle f=f^{**}} अगर और केवल अगर f {\displaystyle f} फ़ेंशेल-मोरो प्रमेय द्वारा उत्तल और निचला अर्ध-निरंतर है।
फ़ेंशेल की असमानता
किसी भी समारोह के लिए f और इसका उत्तल संयुग्म f * , फ़ेंचेल की असमानता (जिसे फ़ेंचेल-यंग असमानता के रूप में भी जाना जाता है) प्रत्येक के लिए लागू होती है x ∈ X {\displaystyle x\in X} और p ∈ X ∗ {\displaystyle p\in X^{*}} :
⟨ p , x ⟩ ≤ f ( x ) + f ∗ ( p ) . {\displaystyle \left\langle p,x\right\rangle \leq f(x)+f^{*}(p).}
इसके अलावा, समानता तभी कायम रहती है जब p ∈ ∂ f ( x ) {\displaystyle p\in \partial f(x)} .
प्रमाण उत्तल संयुग्म की परिभाषा से मिलता है: f ∗ ( p ) = sup x ~ { ⟨ p , x ~ ⟩ − f ( x ~ ) } ≥ ⟨ p , x ⟩ − f ( x ) . {\displaystyle f^{*}(p)=\sup _{\tilde {x}}\left\{\langle p,{\tilde {x}}\rangle -f({\tilde {x}})\right\}\geq \langle p,x\rangle -f(x).}
उत्तलता
दो कार्यों के लिए f 0 {\displaystyle f_{0}} और f 1 {\displaystyle f_{1}} और एक संख्या 0 ≤ λ ≤ 1 {\displaystyle 0\leq \lambda \leq 1} उत्तलता संबंध
( ( 1 − λ ) f 0 + λ f 1 ) ∗ ≤ ( 1 − λ ) f 0 ∗ + λ f 1 ∗ {\displaystyle \left((1-\lambda )f_{0}+\lambda f_{1}\right)^{*}\leq (1-\lambda )f_{0}^{*}+\lambda f_{1}^{*}}
धारण करता है. ∗ {\displaystyle {*}} h> ऑपरेशन स्वयं उत्तल मानचित्रण है।
अनंत कनवल्शन
दो कार्यों का अनंत कनवल्शन (या एपि-सम)। f {\displaystyle f} और g {\displaystyle g} परिभाषित किया जाता है
( f ◻ g ) ( x ) = inf { f ( x − y ) + g ( y ) ∣ y ∈ R n } . {\displaystyle \left(f\operatorname {\Box } g\right)(x)=\inf \left\{f(x-y)+g(y)\mid y\in \mathbb {R} ^{n}\right\}.}
होने देना f 1 , … , f m {\displaystyle f_{1},\ldots ,f_{m}} उचित उत्तल कार्य, उत्तल और अर्ध-निरंतरता कार्य पर होना R n . {\displaystyle \mathbb {R} ^{n}.} फिर अनंत कनवल्शन उत्तल और निचला अर्धविराम है (लेकिन जरूरी नहीं कि उचित हो),[2] और संतुष्ट करता है
( f 1 ◻ ⋯ ◻ f m ) ∗ = f 1 ∗ + ⋯ + f m ∗ . {\displaystyle \left(f_{1}\operatorname {\Box } \cdots \operatorname {\Box } f_{m}\right)^{*}=f_{1}^{*}+\cdots +f_{m}^{*}.}
दो कार्यों के अनंत कनवल्शन की एक ज्यामितीय व्याख्या होती है: दो कार्यों के अनंत कनवल्शन का (सख्त) एपिग्राफ (गणित) उन कार्यों के (सख्त) एपिग्राफ का मिन्कोव्स्की योग है।[3]
तर्क को अधिकतम करना
यदि फ़ंक्शन f {\displaystyle f} अवकलनीय है, तो इसका व्युत्पन्न उत्तल संयुग्म की गणना में अधिकतम तर्क है:
f ′ ( x ) = x ∗ ( x ) := arg sup x ∗ ⟨ x , x ∗ ⟩ − f ∗ ( x ∗ ) {\displaystyle f^{\prime }(x)=x^{*}(x):=\arg \sup _{x^{*}}{\langle x,x^{*}\rangle }-f^{*}\left(x^{*}\right)} और
f ∗ ′ ( x ∗ ) = x ( x ∗ ) := arg sup x ⟨ x , x ∗ ⟩ − f ( x ) ; {\displaystyle f^{{*}\prime }\left(x^{*}\right)=x\left(x^{*}\right):=\arg \sup _{x}{\langle x,x^{*}\rangle }-f(x);}
इस तरह
x = ∇ f ∗ ( ∇ f ( x ) ) , {\displaystyle x=\nabla f^{*}\left(\nabla f(x)\right),}
x ∗ = ∇ f ( ∇ f ∗ ( x ∗ ) ) , {\displaystyle x^{*}=\nabla f\left(\nabla f^{*}\left(x^{*}\right)\right),}
और इसके अलावा
f ′ ′ ( x ) ⋅ f ∗ ′ ′ ( x ∗ ( x ) ) = 1 , {\displaystyle f^{\prime \prime }(x)\cdot f^{{*}\prime \prime }\left(x^{*}(x)\right)=1,}
f ∗ ′ ′ ( x ∗ ) ⋅ f ′ ′ ( x ( x ∗ ) ) = 1. {\displaystyle f^{{*}\prime \prime }\left(x^{*}\right)\cdot f^{\prime \prime }\left(x(x^{*})\right)=1.}
स्केलिंग गुण
अगर कुछ के लिए γ > 0 , {\displaystyle \gamma >0,} g ( x ) = α + β x + γ ⋅ f ( λ x + δ ) {\displaystyle g(x)=\alpha +\beta x+\gamma \cdot f\left(\lambda x+\delta \right)} , तब
g ∗ ( x ∗ ) = − α − δ x ∗ − β λ + γ ⋅ f ∗ ( x ∗ − β λ γ ) . {\displaystyle g^{*}\left(x^{*}\right)=-\alpha -\delta {\frac {x^{*}-\beta }{\lambda }}+\gamma \cdot f^{*}\left({\frac {x^{*}-\beta }{\lambda \gamma }}\right).}
रैखिक परिवर्तनों के तहत व्यवहार
होने देना A : X → Y {\displaystyle A:X\to Y} एक परिबद्ध रैखिक संचालिका बनें। किसी भी उत्तल फलन के लिए f {\displaystyle f} पर X , {\displaystyle X,} :( A f ) ∗ = f ∗ A ∗ {\displaystyle \left(Af\right)^{*}=f^{*}A^{*}}
कहाँ
( A f ) ( y ) = inf { f ( x ) : x ∈ X , A x = y } {\displaystyle (Af)(y)=\inf\{f(x):x\in X,Ax=y\}}
की पूर्व छवि है f {\displaystyle f} इसके संबंध में A {\displaystyle A} और A ∗ {\displaystyle A^{*}} का सहायक संचालक है A . {\displaystyle A.} [4]
एक बंद उत्तल फलन f {\displaystyle f} किसी दिए गए सेट के संबंध में सममित है G {\displaystyle G} ऑर्थोगोनल मैट्रिक्स का,
f ( A x ) = f ( x ) {\displaystyle f(Ax)=f(x)} सभी के लिए x {\displaystyle x} और सभी A ∈ G {\displaystyle A\in G}
यदि और केवल यदि यह उत्तल संयुग्म है f ∗ {\displaystyle f^{*}} के संबंध में सममित है G . {\displaystyle G.}
चयनित उत्तल संयुग्मों की तालिका
निम्न तालिका कई सामान्य कार्यों के साथ-साथ कुछ उपयोगी गुणों के लिए लीजेंड्रे रूपांतरण प्रदान करती है।[5]
g ( x ) {\displaystyle g(x)}
dom ( g ) {\displaystyle \operatorname {dom} (g)}
g ∗ ( x ∗ ) {\displaystyle g^{*}(x^{*})}
dom ( g ∗ ) {\displaystyle \operatorname {dom} (g^{*})}
f ( a x ) {\displaystyle f(ax)} (where a ≠ 0 {\displaystyle a\neq 0} )
X {\displaystyle X}
f ∗ ( x ∗ a ) {\displaystyle f^{*}\left({\frac {x^{*}}{a}}\right)}
X ∗ {\displaystyle X^{*}}
f ( x + b ) {\displaystyle f(x+b)}
X {\displaystyle X}
f ∗ ( x ∗ ) − ⟨ b , x ∗ ⟩ {\displaystyle f^{*}(x^{*})-\langle b,x^{*}\rangle }
X ∗ {\displaystyle X^{*}}
a f ( x ) {\displaystyle af(x)} (where a > 0 {\displaystyle a>0} )
X {\displaystyle X}
a f ∗ ( x ∗ a ) {\displaystyle af^{*}\left({\frac {x^{*}}{a}}\right)}
X ∗ {\displaystyle X^{*}}
α + β x + γ ⋅ f ( λ x + δ ) {\displaystyle \alpha +\beta x+\gamma \cdot f(\lambda x+\delta )}
X {\displaystyle X}
− α − δ x ∗ − β λ + γ ⋅ f ∗ ( x ∗ − β γ λ ) ( γ > 0 ) {\displaystyle -\alpha -\delta {\frac {x^{*}-\beta }{\lambda }}+\gamma \cdot f^{*}\left({\frac {x^{*}-\beta }{\gamma \lambda }}\right)\quad (\gamma >0)}
X ∗ {\displaystyle X^{*}}
| x | p p {\displaystyle {\frac {|x|^{p}}{p}}} (where p > 1 {\displaystyle p>1} )
R {\displaystyle \mathbb {R} }
| x ∗ | q q {\displaystyle {\frac {|x^{*}|^{q}}{q}}} (where 1 p + 1 q = 1 {\displaystyle {\frac {1}{p}}+{\frac {1}{q}}=1} )
R {\displaystyle \mathbb {R} }
− x p p {\displaystyle {\frac {-x^{p}}{p}}} (where 0 < p < 1 {\displaystyle 0<p<1} )
R + {\displaystyle \mathbb {R} _{+}}
− ( − x ∗ ) q q {\displaystyle {\frac {-(-x^{*})^{q}}{q}}} (where 1 p + 1 q = 1 {\displaystyle {\frac {1}{p}}+{\frac {1}{q}}=1} )
R − − {\displaystyle \mathbb {R} _{--}}
1 + x 2 {\displaystyle {\sqrt {1+x^{2}}}}
R {\displaystyle \mathbb {R} }
− 1 − ( x ∗ ) 2 {\displaystyle -{\sqrt {1-(x^{*})^{2}}}}
[ − 1 , 1 ] {\displaystyle [-1,1]}
− log ( x ) {\displaystyle -\log(x)}
R + + {\displaystyle \mathbb {R} _{++}}
− ( 1 + log ( − x ∗ ) ) {\displaystyle -(1+\log(-x^{*}))}
R − − {\displaystyle \mathbb {R} _{--}}
e x {\displaystyle e^{x}}
R {\displaystyle \mathbb {R} }
{ x ∗ log ( x ∗ ) − x ∗ if x ∗ > 0 0 if x ∗ = 0 {\displaystyle {\begin{cases}x^{*}\log(x^{*})-x^{*}&{\text{if }}x^{*}>0\\0&{\text{if }}x^{*}=0\end{cases}}}
R + {\displaystyle \mathbb {R} _{+}}
log ( 1 + e x ) {\displaystyle \log \left(1+e^{x}\right)}
R {\displaystyle \mathbb {R} }
{ x ∗ log ( x ∗ ) + ( 1 − x ∗ ) log ( 1 − x ∗ ) if 0 < x ∗ < 1 0 if x ∗ = 0 , 1 {\displaystyle {\begin{cases}x^{*}\log(x^{*})+(1-x^{*})\log(1-x^{*})&{\text{if }}0<x^{*}<1\\0&{\text{if }}x^{*}=0,1\end{cases}}}
[ 0 , 1 ] {\displaystyle [0,1]}
− log ( 1 − e x ) {\displaystyle -\log \left(1-e^{x}\right)}
R − − {\displaystyle \mathbb {R} _{--}}
{ x ∗ log ( x ∗ ) − ( 1 + x ∗ ) log ( 1 + x ∗ ) if x ∗ > 0 0 if x ∗ = 0 {\displaystyle {\begin{cases}x^{*}\log(x^{*})-(1+x^{*})\log(1+x^{*})&{\text{if }}x^{*}>0\\0&{\text{if }}x^{*}=0\end{cases}}}
R + {\displaystyle \mathbb {R} _{+}}
यह भी देखें
दोहरी समस्या
फ़ेंशेल का द्वैत प्रमेय
पौराणिक परिवर्तन
उत्पादों के लिए यंग की असमानता
संदर्भ
↑ "लीजेंड्रे ट्रांसफॉर्म" . Retrieved April 14, 2019 .
↑ Phelps, Robert (1993). उत्तल कार्य, मोनोटोन संचालक और भिन्नता (2 ed.). Springer. p. 42 . ISBN 0-387-56715-1 .
↑ Bauschke, Heinz H.; Goebel, Rafal; Lucet, Yves; Wang, Xianfu (2008). "The Proximal Average: Basic Theory". SIAM Journal on Optimization . 19 (2): 766. CiteSeerX 10.1.1.546.4270 . doi :10.1137/070687542 .
↑ Ioffe, A.D. and Tichomirov, V.M. (1979), Theorie der Extremalaufgaben . Deutscher Verlag der Wissenschaften . Satz 3.4.3
↑ Borwein, Jonathan ; Lewis, Adrian (2006). Convex Analysis and Nonlinear Optimization: Theory and Examples (2 ed.). Springer. pp. 50 –51. ISBN 978-0-387-29570-1 .
अग्रिम पठन