गणित और गणितीय अनुकूलन में, किसी फलन का उत्तल संयुग्म लीजेंड्रे रूपांतरण का एक सामान्यीकरण है जो गैर-उत्तल कार्यों पर लागू होता है। इसे लेजेंड्रे–फेंचेल रूपांतरण , फेनचेल रूपांतरण, या फेनचेल संयुग्मन (एड्रियन-मैरी लीजेंड्रे और वर्नर फेनेल के बाद) के रूप में भी जाना जाता है। यह विशेष रूप से लैग्रेंजियन द्वैत के दूरगामी सामान्यीकरण की अनुमति देता है।
परिभाषा
मान लीजिये X {\displaystyle X} एक वास्तविक संख्या सांस्थितिक सदिश समष्टि है और मान लीजिये X ∗ {\displaystyle X^{*}} करने के लिए X {\displaystyle X} द्वैतसमष्टि हो। जिसे विहित द्वैध युग्मन रूप में दर्शाया जा सकता है
⟨ ⋅ , ⋅ ⟩ : X ∗ × X → R {\displaystyle \langle \cdot ,\cdot \rangle :X^{*}\times X\to \mathbb {R} }
जिसे ( x ∗ , x ) ↦ x ∗ ( x ) {\displaystyle \left(x^{*},x\right)\mapsto x^{*}(x)} द्वारा परिभाषित किया गया है
एक फलन f : X → R ∪ { − ∞ , + ∞ } {\displaystyle f:X\to \mathbb {R} \cup \{-\infty ,+\infty \}} के लिए विस्तारित वास्तविक संख्या रेखा पर मान लेते हुए, इसका मध्योन्नत संयुग्मन निम्न फलन है
f ∗ : X ∗ → R ∪ { − ∞ , + ∞ } {\displaystyle f^{*}:X^{*}\to \mathbb {R} \cup \{-\infty ,+\infty \}}
जिसका मूल्य x ∗ ∈ X ∗ {\displaystyle x^{*}\in X^{*}} पर सर्वोच्च के रूप में परिभाषित किया गया है:
f ∗ ( x ∗ ) := sup { ⟨ x ∗ , x ⟩ − f ( x ) : x ∈ X } , {\displaystyle f^{*}\left(x^{*}\right):=\sup \left\{\left\langle x^{*},x\right\rangle -f(x)~\colon ~x\in X\right\},}
या, समकक्ष, न्यूनतम के संदर्भ में:
f ∗ ( x ∗ ) := − inf { f ( x ) − ⟨ x ∗ , x ⟩ : x ∈ X } . {\displaystyle f^{*}\left(x^{*}\right):=-\inf \left\{f(x)-\left\langle x^{*},x\right\rangle ~\colon ~x\in X\right\}.}
इस परिभाषा की व्याख्या इसके सहायक अधिसमतल के संदर्भ में फलन के अभिलेख (गणित) के अवमुख समावरक के संकेतन के रूप में की जा सकती है। [1]
उदाहरण
अधिक उदाहरणों के लिए देखें § चयनित उत्तल संयुग्मों की तालिका .
एक सजातीय फलन का उत्तल संयुग्म f ( x ) = ⟨ a , x ⟩ − b {\displaystyle f(x)=\left\langle a,x\right\rangle -b} है f ∗ ( x ∗ ) = { b , x ∗ = a + ∞ , x ∗ ≠ a . {\displaystyle f^{*}\left(x^{*}\right)={\begin{cases}b,&x^{*}=a\\+\infty ,&x^{*}\neq a.\end{cases}}}
किसी घातांक फलन का उत्तल संयुग्म f ( x ) = 1 p | x | p , 1 < p < ∞ {\displaystyle f(x)={\frac {1}{p}}|x|^{p},1<p<\infty } है f ∗ ( x ∗ ) = 1 q | x ∗ | q , 1 < q < ∞ , where 1 p + 1 q = 1. {\displaystyle f^{*}\left(x^{*}\right)={\frac {1}{q}}|x^{*}|^{q},1<q<\infty ,{\text{where}}{\tfrac {1}{p}}+{\tfrac {1}{q}}=1.}
निरपेक्ष मान फलन का उत्तल संयुग्म f ( x ) = | x | {\displaystyle f(x)=\left|x\right|} है f ∗ ( x ∗ ) = { 0 , | x ∗ | ≤ 1 ∞ , | x ∗ | > 1. {\displaystyle f^{*}\left(x^{*}\right)={\begin{cases}0,&\left|x^{*}\right|\leq 1\\\infty ,&\left|x^{*}\right|>1.\end{cases}}}
घातीय फलन का उत्तल संयुग्म f ( x ) = e x {\displaystyle f(x)=e^{x}} है f ∗ ( x ∗ ) = { x ∗ ln x ∗ − x ∗ , x ∗ > 0 0 , x ∗ = 0 ∞ , x ∗ < 0. {\displaystyle f^{*}\left(x^{*}\right)={\begin{cases}x^{*}\ln x^{*}-x^{*},&x^{*}>0\\0,&x^{*}=0\\\infty ,&x^{*}<0.\end{cases}}}
घातीय फलन के उत्तल संयुग्म और लीजेंड्रे रूपांतर सहमत हैं, सिवाय इसके कि उत्तल संयुग्म के फलन का कार्यछेत्र अनुशासनपूर्वक से बड़ा है क्योंकि लीजेंड्रे रूपांतर केवल सकारात्मक वास्तविक संख्याओं के लिए परिभाषित किया गया है।
अपेक्षित कमी के साथ संबंध (जोखिम पर औसत मूल्य)
उदाहरण के लिए यह लेख देखें।
मान लीजिए F एक यादृच्छिक चर X के संचयी वितरण फलन को दर्शाता है। फिर (भागों द्वारा एकीकृत),
f ( x ) := ∫ − ∞ x F ( u ) d u = E [ max ( 0 , x − X ) ] = x − E [ min ( x , X ) ] {\displaystyle f(x):=\int _{-\infty }^{x}F(u)\,du=\operatorname {E} \left[\max(0,x-X)\right]=x-\operatorname {E} \left[\min(x,X)\right]}
उत्तल संयुग्म है
f ∗ ( p ) = ∫ 0 p F − 1 ( q ) d q = ( p − 1 ) F − 1 ( p ) + E [ min ( F − 1 ( p ) , X ) ] = p F − 1 ( p ) − E [ max ( 0 , F − 1 ( p ) − X ) ] . {\displaystyle f^{*}(p)=\int _{0}^{p}F^{-1}(q)\,dq=(p-1)F^{-1}(p)+\operatorname {E} \left[\min(F^{-1}(p),X)\right]=pF^{-1}(p)-\operatorname {E} \left[\max(0,F^{-1}(p)-X)\right].}
क्रमण
एक विशेष व्याख्या में रूपांतरण होता है
f inc ( x ) := arg sup t t ⋅ x − ∫ 0 1 max { t − f ( u ) , 0 } d u , {\displaystyle f^{\text{inc}}(x):=\arg \sup _{t}t\cdot x-\int _{0}^{1}\max\{t-f(u),0\}\,du,}
चूँकि यह प्रारंभिक फलन f की गैर-घटती पुनर्व्यवस्था है; विशेष रूप से,
f inc = f {\displaystyle f^{\text{inc}}=f} एफ गैर-घटने के लिए होता है।
गुण
एक सीमित उत्तल फलन का उत्तल संयुग्म फिर से एक सीमित उत्तल फलन है। एक बहुफलकीय उत्तल कार्य का उत्तल संयुग्म (बहुतल अभिलेख (गणित) के साथ एक उत्तल फलन) फिर से एक बहुफलकीय उत्तल फलन है।
क्रम उत्क्रम
घोषित करें कि f ≤ g {\displaystyle f\leq g} यदि और केवल यदि सभी x {\displaystyle x} के लिए f ( x ) ≤ g ( x ) {\displaystyle f(x)\leq g(x)} है। तब उत्तल-संयुग्मन क्रम-विपरीत होता है, जिसका परिभाषा के अनुसार अर्थ यह है कि यदि f ≤ g {\displaystyle f\leq g} तो f ∗ ≥ g ∗ {\displaystyle f^{*}\geq g^{*}}
फलन के एक परिवार ( f α ) α {\displaystyle \left(f_{\alpha }\right)_{\alpha }} के लिए यह इस तथ्य से निकलता है कि उच्चकों को आपस में बदला जा सकता है
( inf α f α ) ∗ ( x ∗ ) = sup α f α ∗ ( x ∗ ) , {\displaystyle \left(\inf _{\alpha }f_{\alpha }\right)^{*}(x^{*})=\sup _{\alpha }f_{\alpha }^{*}(x^{*}),}
और अधिकतम-न्यूनतम असमानता से
( sup α f α ) ∗ ( x ∗ ) ≤ inf α f α ∗ ( x ∗ ) . {\displaystyle \left(\sup _{\alpha }f_{\alpha }\right)^{*}(x^{*})\leq \inf _{\alpha }f_{\alpha }^{*}(x^{*}).}
द्विसंयुग्मी
किसी फलन का उत्तल संयुग्म हमेशा निचला अर्ध-निरंतर होता है। द्विसंयुग्मी f ∗ ∗ {\displaystyle f^{**}} (उत्तल संयुग्म का उत्तल संयुग्म) सीमित अवमुख समावरक भी है, यानी सबसे बड़ा निचला अर्ध-निरंतर उत्तल कार्य f ∗ ∗ ≤ f {\displaystyle f^{**}\leq f} है। उचित उत्तल कार्य f , {\displaystyle f,} के लिए :f = f ∗ ∗ {\displaystyle f=f^{**}} यदि और केवल यदि f {\displaystyle f} फ़ेंशेल-मोरो प्रमेय द्वारा उत्तल और निचला अर्ध-निरंतर है।
फ़ेंशेल की असमानता
किसी भी फलन f और इसका उत्तल संयुग्म f * के लिए, फ़ेंचेल की असमानता (जिसे फ़ेंचेल-यंग असमानता के रूप में भी जाना जाता है) प्रत्येक x ∈ X {\displaystyle x\in X} और p ∈ X ∗ {\displaystyle p\in X^{*}} के लिए लागू होती है:
⟨ p , x ⟩ ≤ f ( x ) + f ∗ ( p ) . {\displaystyle \left\langle p,x\right\rangle \leq f(x)+f^{*}(p).}
इसके अतिरिक्त, समानता तभी कायम रहती है जब p ∈ ∂ f ( x ) {\displaystyle p\in \partial f(x)} है।
प्रमाण उत्तल संयुग्म की परिभाषा f ∗ ( p ) = sup x ~ { ⟨ p , x ~ ⟩ − f ( x ~ ) } ≥ ⟨ p , x ⟩ − f ( x ) {\displaystyle f^{*}(p)=\sup _{\tilde {x}}\left\{\langle p,{\tilde {x}}\rangle -f({\tilde {x}})\right\}\geq \langle p,x\rangle -f(x)} से मिलता है।
उत्तलता
दो कार्यों f 0 {\displaystyle f_{0}} और f 1 {\displaystyle f_{1}} और एक संख्या 0 ≤ λ ≤ 1 {\displaystyle 0\leq \lambda \leq 1} उत्तलता संबंध के लिए
( ( 1 − λ ) f 0 + λ f 1 ) ∗ ≤ ( 1 − λ ) f 0 ∗ + λ f 1 ∗ {\displaystyle \left((1-\lambda )f_{0}+\lambda f_{1}\right)^{*}\leq (1-\lambda )f_{0}^{*}+\lambda f_{1}^{*}}
धारण करता है। ∗ {\displaystyle {*}} संचालन स्वयं उत्तल मानचित्रण है।
अनंत संवलन
दो कार्यों का अनंत संवलन (या एपि-सम) f {\displaystyle f} और g {\displaystyle g} निम्न रूप में परिभाषित किया जाता है
( f ◻ g ) ( x ) = inf { f ( x − y ) + g ( y ) ∣ y ∈ R n } . {\displaystyle \left(f\operatorname {\Box } g\right)(x)=\inf \left\{f(x-y)+g(y)\mid y\in \mathbb {R} ^{n}\right\}.}
मान लीजिये f 1 , … , f m {\displaystyle f_{1},\ldots ,f_{m}} उचित उत्तल कार्य, उत्तल और अर्ध-निरंतरता R n {\displaystyle \mathbb {R} ^{n}} पर कार्य करता है, फिर अनंत संवलन उत्तल और निचला अर्धविराम है (लेकिन जरूरी नहीं कि उचित हो),[2] और निम्न को संतुष्ट करता है
( f 1 ◻ ⋯ ◻ f m ) ∗ = f 1 ∗ + ⋯ + f m ∗ . {\displaystyle \left(f_{1}\operatorname {\Box } \cdots \operatorname {\Box } f_{m}\right)^{*}=f_{1}^{*}+\cdots +f_{m}^{*}.}
दो कार्यों के अनंत संवलन की एक ज्यामितीय व्याख्या होती है: दो कार्यों के अनंत संवलन का (निश्चित) अभिलेख (गणित) उन कार्यों के (निश्चित) अभिलेख का मिन्कोव्स्की योग है। [3]
तर्क अधिकतमीकरण
यदि फलन f {\displaystyle f} अवकलनीय है, तो इसका व्युत्पन्न उत्तल संयुग्म की गणना में अधिकतम तर्क है:
f ′ ( x ) = x ∗ ( x ) := arg sup x ∗ ⟨ x , x ∗ ⟩ − f ∗ ( x ∗ ) {\displaystyle f^{\prime }(x)=x^{*}(x):=\arg \sup _{x^{*}}{\langle x,x^{*}\rangle }-f^{*}\left(x^{*}\right)} और
f ∗ ′ ( x ∗ ) = x ( x ∗ ) := arg sup x ⟨ x , x ∗ ⟩ − f ( x ) ; {\displaystyle f^{{*}\prime }\left(x^{*}\right)=x\left(x^{*}\right):=\arg \sup _{x}{\langle x,x^{*}\rangle }-f(x);}
इस तरह
x = ∇ f ∗ ( ∇ f ( x ) ) , {\displaystyle x=\nabla f^{*}\left(\nabla f(x)\right),}
x ∗ = ∇ f ( ∇ f ∗ ( x ∗ ) ) , {\displaystyle x^{*}=\nabla f\left(\nabla f^{*}\left(x^{*}\right)\right),}
और इसके अतिरिक्त
f ′ ′ ( x ) ⋅ f ∗ ′ ′ ( x ∗ ( x ) ) = 1 , {\displaystyle f^{\prime \prime }(x)\cdot f^{{*}\prime \prime }\left(x^{*}(x)\right)=1,}
f ∗ ′ ′ ( x ∗ ) ⋅ f ′ ′ ( x ( x ∗ ) ) = 1. {\displaystyle f^{{*}\prime \prime }\left(x^{*}\right)\cdot f^{\prime \prime }\left(x(x^{*})\right)=1.}
प्रवर्धन गुण
यदि कुछ γ > 0 {\displaystyle \gamma >0} के लिए g ( x ) = α + β x + γ ⋅ f ( λ x + δ ) {\displaystyle g(x)=\alpha +\beta x+\gamma \cdot f\left(\lambda x+\delta \right)} है, तब
g ∗ ( x ∗ ) = − α − δ x ∗ − β λ + γ ⋅ f ∗ ( x ∗ − β λ γ ) . {\displaystyle g^{*}\left(x^{*}\right)=-\alpha -\delta {\frac {x^{*}-\beta }{\lambda }}+\gamma \cdot f^{*}\left({\frac {x^{*}-\beta }{\lambda \gamma }}\right).}
रैखिक परिवर्तनों के अंतर्गत व्यवहार
मान लीजिये A : X → Y {\displaystyle A:X\to Y} एक परिबद्ध रैखिक संचालिका है। किसी भी उत्तल फलन f {\displaystyle f} के लिए X {\displaystyle X} पर :( A f ) ∗ = f ∗ A ∗ {\displaystyle \left(Af\right)^{*}=f^{*}A^{*}} है
जहाँ
( A f ) ( y ) = inf { f ( x ) : x ∈ X , A x = y } {\displaystyle (Af)(y)=\inf\{f(x):x\in X,Ax=y\}}
f {\displaystyle f} की पूर्व छवि है इसके संबंध में A {\displaystyle A} और A ∗ {\displaystyle A^{*}} का सहायक संचालक A {\displaystyle A} है। [4] G {\displaystyle G}
एक बंद उत्तल फलन f {\displaystyle f} आयतीय रैखिक परिवर्तनों के दिए गए सम्मुच्चय G के संबंध में सममित है,
f ( A x ) = f ( x ) {\displaystyle f(Ax)=f(x)} सभी x {\displaystyle x} और सभी A ∈ G {\displaystyle A\in G} के लिए
यदि और केवल यदि यह उत्तल संयुग्म f ∗ {\displaystyle f^{*}} G {\displaystyle G} के संबंध में सममित है
चयनित उत्तल संयुग्मों की तालिका
निम्न तालिका कई सामान्य कार्यों के साथ-साथ कुछ उपयोगी गुणों के लिए लीजेंड्रे रूपांतरण प्रदान करती है। [5]
g ( x ) {\displaystyle g(x)}
dom ( g ) {\displaystyle \operatorname {dom} (g)}
g ∗ ( x ∗ ) {\displaystyle g^{*}(x^{*})}
dom ( g ∗ ) {\displaystyle \operatorname {dom} (g^{*})}
f ( a x ) {\displaystyle f(ax)} (जहाँ a ≠ 0 {\displaystyle a\neq 0} )
X {\displaystyle X}
f ∗ ( x ∗ a ) {\displaystyle f^{*}\left({\frac {x^{*}}{a}}\right)}
X ∗ {\displaystyle X^{*}}
f ( x + b ) {\displaystyle f(x+b)}
X {\displaystyle X}
f ∗ ( x ∗ ) − ⟨ b , x ∗ ⟩ {\displaystyle f^{*}(x^{*})-\langle b,x^{*}\rangle }
X ∗ {\displaystyle X^{*}}
a f ( x ) {\displaystyle af(x)} (जहाँ a > 0 {\displaystyle a>0} )
X {\displaystyle X}
a f ∗ ( x ∗ a ) {\displaystyle af^{*}\left({\frac {x^{*}}{a}}\right)}
X ∗ {\displaystyle X^{*}}
α + β x + γ ⋅ f ( λ x + δ ) {\displaystyle \alpha +\beta x+\gamma \cdot f(\lambda x+\delta )}
X {\displaystyle X}
− α − δ x ∗ − β λ + γ ⋅ f ∗ ( x ∗ − β γ λ ) ( γ > 0 ) {\displaystyle -\alpha -\delta {\frac {x^{*}-\beta }{\lambda }}+\gamma \cdot f^{*}\left({\frac {x^{*}-\beta }{\gamma \lambda }}\right)\quad (\gamma >0)}
X ∗ {\displaystyle X^{*}}
| x | p p {\displaystyle {\frac {|x|^{p}}{p}}} (जहाँ p > 1 {\displaystyle p>1} )
R {\displaystyle \mathbb {R} }
| x ∗ | q q {\displaystyle {\frac {|x^{*}|^{q}}{q}}} (जहाँ 1 p + 1 q = 1 {\displaystyle {\frac {1}{p}}+{\frac {1}{q}}=1} )
R {\displaystyle \mathbb {R} }
− x p p {\displaystyle {\frac {-x^{p}}{p}}} (जहाँ 0 < p < 1 {\displaystyle 0<p<1} )
R + {\displaystyle \mathbb {R} _{+}}
− ( − x ∗ ) q q {\displaystyle {\frac {-(-x^{*})^{q}}{q}}} (जहाँ 1 p + 1 q = 1 {\displaystyle {\frac {1}{p}}+{\frac {1}{q}}=1} )
R − − {\displaystyle \mathbb {R} _{--}}
1 + x 2 {\displaystyle {\sqrt {1+x^{2}}}}
R {\displaystyle \mathbb {R} }
− 1 − ( x ∗ ) 2 {\displaystyle -{\sqrt {1-(x^{*})^{2}}}}
[ − 1 , 1 ] {\displaystyle [-1,1]}
− log ( x ) {\displaystyle -\log(x)}
R + + {\displaystyle \mathbb {R} _{++}}
− ( 1 + log ( − x ∗ ) ) {\displaystyle -(1+\log(-x^{*}))}
R − − {\displaystyle \mathbb {R} _{--}}
e x {\displaystyle e^{x}}
R {\displaystyle \mathbb {R} }
{ x ∗ log ( x ∗ ) − x ∗ if x ∗ > 0 0 if x ∗ = 0 {\displaystyle {\begin{cases}x^{*}\log(x^{*})-x^{*}&{\text{if }}x^{*}>0\\0&{\text{if }}x^{*}=0\end{cases}}}
R + {\displaystyle \mathbb {R} _{+}}
log ( 1 + e x ) {\displaystyle \log \left(1+e^{x}\right)}
R {\displaystyle \mathbb {R} }
{ x ∗ log ( x ∗ ) + ( 1 − x ∗ ) log ( 1 − x ∗ ) if 0 < x ∗ < 1 0 if x ∗ = 0 , 1 {\displaystyle {\begin{cases}x^{*}\log(x^{*})+(1-x^{*})\log(1-x^{*})&{\text{if }}0<x^{*}<1\\0&{\text{if }}x^{*}=0,1\end{cases}}}
[ 0 , 1 ] {\displaystyle [0,1]}
− log ( 1 − e x ) {\displaystyle -\log \left(1-e^{x}\right)}
R − − {\displaystyle \mathbb {R} _{--}}
{ x ∗ log ( x ∗ ) − ( 1 + x ∗ ) log ( 1 + x ∗ ) if x ∗ > 0 0 if x ∗ = 0 {\displaystyle {\begin{cases}x^{*}\log(x^{*})-(1+x^{*})\log(1+x^{*})&{\text{if }}x^{*}>0\\0&{\text{if }}x^{*}=0\end{cases}}}
R + {\displaystyle \mathbb {R} _{+}}
यह भी देखें
द्वैध समस्या
फ़ेंशेल का द्वैत प्रमेय
पौराणिक रूपांतरण
उत्पादों के लिए यंग की असमानता
संदर्भ
↑ "लीजेंड्रे ट्रांसफॉर्म" . Retrieved April 14, 2019 .
↑ Phelps, Robert (1993). उत्तल कार्य, मोनोटोन संचालक और भिन्नता (2 ed.). Springer. p. 42 . ISBN 0-387-56715-1 .
↑ Bauschke, Heinz H.; Goebel, Rafal; Lucet, Yves; Wang, Xianfu (2008). "The Proximal Average: Basic Theory". SIAM Journal on Optimization . 19 (2): 766. CiteSeerX 10.1.1.546.4270 . doi :10.1137/070687542 .
↑ Ioffe, A.D. and Tichomirov, V.M. (1979), Theorie der Extremalaufgaben . Deutscher Verlag der Wissenschaften . Satz 3.4.3
↑ Borwein, Jonathan ; Lewis, Adrian (2006). Convex Analysis and Nonlinear Optimization: Theory and Examples (2 ed.). Springer. pp. 50 –51. ISBN 978-0-387-29570-1 .
अग्रिम पठन