संयुग्म प्रवणता विधि: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 17: Line 17:
{{Main|संयुग्मी प्रवणता विधि की व्युत्पत्ति}}
{{Main|संयुग्मी प्रवणता विधि की व्युत्पत्ति}}


संयुग्मी प्रवणता पद्धति को कई भिन्न-भिन्न दृष्टिकोणों से प्राप्त किया जा सकता है, जिसमें अनुकूलन के लिए संयुग्मी दिशा पद्धति की विशेषज्ञता और [[eigenvalue]] स्थितियों के लिए अर्नोल्डी पुनरावृत्ति / एइगेन्लैंवलुएक्ज़ोस पुनरावृत्ति पुनरावृत्ति की भिन्नता सम्मलित है। उनके दृष्टिकोणों में अंतर के बावजूद, ये व्युत्पत्ति सामान्य विषय को साझा करते हैं - अवशेषों की ओर्थोगोनलिटी और खोज दिशाओं की संयुग्मता को सिद्ध करना  करते हैं। विधि के प्रसिद्ध संक्षिप्त सूत्रीकरण को विकसित करने के लिए ये दो गुण महत्वपूर्ण हैं।
संयुग्मी प्रवणता पद्धति को कई भिन्न-भिन्न दृष्टिकोणों से प्राप्त किया जा सकता है, जिसमें अनुकूलन के लिए संयुग्मी दिशा पद्धति की विशेषज्ञता और [[eigenvalue]] स्थितियों के लिए अर्नोल्डी पुनरावृत्ति / एइगेन्लैंवलुएक्ज़ोस पुनरावृत्ति की भिन्नता सम्मलित है। उनके दृष्टिकोणों में अंतर के बावजूद, ये व्युत्पत्ति सामान्य विषय को साझा करते हैं - अवशेषों की ओर्थोगोनलिटी और खोज दिशाओं की संयुग्मता को सिद्ध करते हैं। विधि के प्रसिद्ध संक्षिप्त सूत्रीकरण को विकसित करने के लिए ये दो गुण महत्वपूर्ण हैं।


हम कहते हैं कि दो शून्येतर सदिश u और v संयुग्मी हैं (के संबंध में <math>\mathbf{A}</math>) यदि
हम कह सकते हैं कि दो शून्येतर सदिश u और v संयुग्मी हैं (के संबंध में <math>\mathbf{A}</math>) यदि


:<math> \mathbf{u}^\mathsf{T} \mathbf{A} \mathbf{v} = 0. </math>
:<math> \mathbf{u}^\mathsf{T} \mathbf{A} \mathbf{v} = 0. </math>
Line 31: Line 31:
  \langle \mathbf{u}, \mathbf{A}\mathbf{v}\rangle.
  \langle \mathbf{u}, \mathbf{A}\mathbf{v}\rangle.
</math>
</math>
दो सदिश संयुग्मी हैं यदि और केवल यदि वे इस आंतरिक उत्पाद के संबंध में ओर्थोगोनल हैं। संयुग्मी होना सममित संबंध है: यदि <math>\mathbf{u}</math> से संयुग्मित है <math>\mathbf{v}</math>, तब <math>\mathbf{v}</math> से संयुग्मित है <math>\mathbf{u}</math>. लगता है कि
यदि दो सदिश संयुग्मी हैं और यदि वे इस आंतरिक उत्पाद के संबंध में ओर्थोगोनल हैं। संयुग्मी होना सममित संबंध है, यदि <math>\mathbf{v}</math>, <math>\mathbf{u}</math> से संयुग्मित है  तब <math>\mathbf{v}</math> से संयुग्मित <math>\mathbf{u}</math> है अर्थात् प्रतीत होता है कि


:<math>P = \{ \mathbf{p}_1, \dots, \mathbf{p}_n \}</math>
:<math>P = \{ \mathbf{p}_1, \dots, \mathbf{p}_n \}</math>
का सेट है <math>n</math> के संबंध में पारस्परिक रूप से संयुग्मित वैक्टर <math>\mathbf{A}</math>, अर्थात। <math>\mathbf{p}_i^\mathsf{T} \mathbf{A} \mathbf{p}_j = 0</math> सभी के लिए <math>i \neq j</math>.
<math>n</math> के संबंध में पारस्परिक रूप से संयुग्मित वैक्टर <math>\mathbf{A}</math> है अर्थात। <math>\mathbf{p}_i^\mathsf{T} \mathbf{A} \mathbf{p}_j = 0</math> सभी के लिए <math>i \neq j</math>. का सेट है
 
तब <math>P</math> के लिए [[आधार (रैखिक बीजगणित)]] बनाता है <math>\mathbb{R}^n</math>, और हम समाधान व्यक्त कर सकते हैं <math>\mathbf{x}_*</math> का <math>\mathbf{Ax} = \mathbf{b}</math> इस आधार पर:
तब <math>P</math> के लिए [[आधार (रैखिक बीजगणित)]] बनाता है <math>\mathbb{R}^n</math>, और हम समाधान व्यक्त कर सकते हैं <math>\mathbf{x}_*</math> का <math>\mathbf{Ax} = \mathbf{b}</math> इस आधार पर:


Line 46: Line 47:
= \sum^{n}_{i=1} \alpha_i \left \langle \mathbf{p}_k, \mathbf{p}_i \right \rangle_{\mathbf{A}}  
= \sum^{n}_{i=1} \alpha_i \left \langle \mathbf{p}_k, \mathbf{p}_i \right \rangle_{\mathbf{A}}  
= \alpha_k \left \langle \mathbf{p}_k, \mathbf{p}_k \right \rangle_{\mathbf{A}} </math>
= \alpha_k \left \langle \mathbf{p}_k, \mathbf{p}_k \right \rangle_{\mathbf{A}} </math>
इसलिए
अतः
:<math>\alpha_k = \frac{\langle \mathbf{p}_k, \mathbf{b} \rangle}{\langle \mathbf{p}_k, \mathbf{p}_k \rangle_\mathbf{A}}.</math>
:<math>\alpha_k = \frac{\langle \mathbf{p}_k, \mathbf{b} \rangle}{\langle \mathbf{p}_k, \mathbf{p}_k \rangle_\mathbf{A}}.</math>
यह निम्न विधि देता है<ref name="BP" />समीकरण को हल करने के लिए {{math|'''Ax''' {{=}} '''b'''}}: का क्रम खोजें <math>n</math> संयुग्मित दिशाएँ, और फिर गुणांकों की गणना करें <math>\alpha_k</math>.
यह निम्न विधि देता है।<ref name="BP" /> समीकरण को हल करने के लिए {{math|'''Ax''' {{=}} '''b'''}}: का क्रम खोजें <math>n</math> संयुग्मित दिशाएँ, और फिर <math>\alpha_k</math> गुणांकों की गणना करे.


== पुनरावृत्त विधि के रूप में ==
== पुनरावृत्त विधि के रूप में ==


यदि हम संयुग्म वैक्टर चुनते हैं <math>\mathbf{p}_k</math> सावधानी से, तो समाधान के लिए अच्छा सन्निकटन प्राप्त करने के लिए हमें उन सभी की आवश्यकता नहीं हो सकती है <math>\mathbf{x}_*</math>. इसलिए, हम संयुग्मी ढाल विधि को पुनरावृत्त विधि के रूप में मानना ​​​​चाहते हैं। यह हमें उन प्रणालियों को लगभग हल करने की भी अनुमति देता है जहाँ n इतना बड़ा है कि प्रत्यक्ष विधि में बहुत अधिक समय लगेगा।
यदि हम संयुग्म वैक्टर <math>\mathbf{p}_k</math> सावधानी से चुनते हैं, तब समाधान के लिए उचित सन्निकटन <math>\mathbf{x}_*</math> प्राप्त करने के लिए हमें उन सभी की आवश्यकता नहीं हो सकती है अतः, हम संयुग्मी ढाल विधि को पुनरावृत्त विधि के रूप में मानना ​​​​चाहते हैं। यह हमें उन प्रणालियों को हल करने की भी अनुमति देता है जहाँ n इतना बड़ा है कि प्रत्यक्ष विधि में बहुत अधिक समय लगेगा।
   
   
हम के लिए प्रारंभिक अनुमान निरूपित करते हैं {{math|'''x'''<sub>∗</sub>}} द्वारा {{math|'''x'''<sub>0</sub>}} (हम सामान्यता के नुकसान के बिना मान सकते हैं कि {{math|'''x'''<sub>0</sub> {{=}} '''0'''}}, अन्यथा प्रणाली Az = b - Ax पर विचार करें<sub>0</sub> अतिरिक्त)। एक्स से प्रारंभ<sub>0</sub> हम समाधान की खोज करते हैं और प्रत्येक पुनरावृत्ति में हमें यह बताने के लिए मीट्रिक की आवश्यकता होती है कि क्या हम समाधान के करीब हैं {{math|'''x'''<sub>∗</sub>}} (यह हमारे लिए अज्ञात है)। यह मीट्रिक इस तथ्य से आता है कि समाधान {{math|'''x'''<sub>∗</sub>}} निम्नलिखित द्विघात फलन का अद्वितीय न्यूनतमकारक भी है
हम {{math|'''x'''<sub>∗</sub>}} द्वारा {{math|'''x'''<sub>0</sub>}} (हम सामान्यता के नुकसान के बिना मान सकते हैं कि {{math|'''x'''<sub>0</sub> {{=}} '''0'''}}, अन्यथा प्रणाली Az = b - Ax<sub>0</sub> पर विचार करें अतिरिक्त) के लिए प्रारंभिक अनुमान निरूपित करते हैं।  {{math|'''x'''<sub>0</sub>}} से प्रारंभ होने पर हम समाधान की खोज करते हैं और प्रत्येक पुनरावृत्ति में हमें यह व्यक्त करने के लिए मीट्रिक की आवश्यकता होती है कि क्या हम समाधान {{math|'''x'''<sub>∗</sub>}} के समीप हैं (यह हमारे लिए अज्ञात है)। यह मीट्रिक इस तथ्य से आता है कि समाधान {{math|'''x'''<sub>∗</sub>}} निम्नलिखित द्विघात फलन का अद्वितीय न्यूनतमकारक भी है।


:<math>  
:<math>  
   f(\mathbf{x}) = \tfrac12 \mathbf{x}^\mathsf{T} \mathbf{A}\mathbf{x} - \mathbf{x}^\mathsf{T} \mathbf{b}, \qquad \mathbf{x}\in\mathbf{R}^n \,.  
   f(\mathbf{x}) = \tfrac12 \mathbf{x}^\mathsf{T} \mathbf{A}\mathbf{x} - \mathbf{x}^\mathsf{T} \mathbf{b}, \qquad \mathbf{x}\in\mathbf{R}^n \,.  
</math>
</math>
एक अद्वितीय मिनिमाइज़र का अस्तित्व स्पष्ट है क्योंकि इसके दूसरे डेरिवेटिव का [[हेसियन मैट्रिक्स]] सममित सकारात्मक-निश्चित है
अद्वितीय न्यूनतम का अस्तित्व स्पष्ट है क्योंकि इसके दूसरे व्युत्पन्न का [[हेसियन मैट्रिक्स]] सममित सकारात्मक-निश्चित है
:<math>
:<math>
   \mathbf{H}(f(\mathbf{x})) = \mathbf{A} \,,
   \mathbf{H}(f(\mathbf{x})) = \mathbf{A} \,,
</math>
</math>
और यह कि मिनिमाइज़र (उपयोग Df('x')=0) प्रारंभिक समस्या को इसके पहले व्युत्पन्न से हल करता है
और यह कि न्यूनतम (उपयोग Df('x')=0) प्रारंभिक समस्या को इसके प्रथम व्युत्पन्न से हल करता है
:<math>
:<math>
   \nabla f(\mathbf{x}) = \mathbf{A} \mathbf{x} - \mathbf{b} \,.
   \nabla f(\mathbf{x}) = \mathbf{A} \mathbf{x} - \mathbf{b} \,.
</math>
</math>
यह प्रथम आधार सदिश P<sub>0</sub> लेने का सुझाव देता है और 'x<sub>0</sub>' = 'x<sub>0</sub>' पर f की प्रवणता का ऋणात्मक होता है जिससे f की प्रवणता समान्तर होती है {{math|'''Ax''' − '''b'''}}. प्रारंभिक अनुमान x<sub>0</sub> से प्रारंभ किया जाता है इसका तात्पर्य है कि हम P<sub>0</sub> = B- कुल्हाड़ी लेते हैं जिसके आधार में अन्य वैक्टर ग्रेडिएंट के संयुग्मित होंगे, अतः नाम संयुग्म ग्रेडिएंट विधि है। ध्यान दें कि 'P'<sub>0</sub> एल्गोरिथम के इस प्रारंभिक चरण द्वारा प्रदान किया गया [[अवशिष्ट (संख्यात्मक विश्लेषण)]] भी है।


<!--  so if f('''x''') becomes smaller in an iteration it means that we are closer to {{math|'''x'''<sub>∗</sub>}}.Note that the +c has been added to the equation above. Without the c the trivial solution of x=0 is the minimum and the solution of the original equation. If x0 is the minimum, then the quadratic can be described as (x^T-x0^T)*A*(x-x0)-c0=0 (c0 is f at the minimum while x0 is the solution at the minimum). Expanding this you get x^T*X*x-x^T*b+c where b=2*A*x0 and c=x0^T*A*x0-c0 ... wait a minute... for the purposes of minimization c0 does not matter... if this is the case then c0 could be selected such that c0=x0^T*A*x0 in which case the original form x^T*X*x-x^T*b is still valid... -->
अतः r<sub>''k''</sub> kवें चरण में अवशिष्ट (संख्यात्मक विश्लेषण) होता है।
यह पहला आधार सदिश p लेने का सुझाव देता है<sub>0</sub> 'x' = 'x' पर f की प्रवणता का ऋणात्मक होना<sub>0</sub>. f की प्रवणता बराबर होती है {{math|'''Ax''' − '''b'''}}. प्रारंभिक अनुमान x से प्रारंभ करना<sub>0</sub>, इसका मतलब है कि हम पी लेते हैं<sub>0</sub> = बी - कुल्हाड़ी<sub>0</sub>. आधार में अन्य वैक्टर ग्रेडिएंट के संयुग्मित होंगे, इसलिए नाम संयुग्म ग्रेडिएंट विधि है। ध्यान दें कि 'प'<sub>0</sub> एल्गोरिथम के इस प्रारंभिक चरण द्वारा प्रदान किया गया [[अवशिष्ट (संख्यात्मक विश्लेषण)]] भी है।
 
चलो आर<sub>''k''</sub> kवें चरण में अवशिष्ट (संख्यात्मक विश्लेषण) हो:
:<math> \mathbf{r}_k = \mathbf{b} - \mathbf{Ax}_k.</math>
:<math> \mathbf{r}_k = \mathbf{b} - \mathbf{Ax}_k.</math>
जैसा कि ऊपर देखा गया है, <math>\mathbf{r}_k</math> की ऋणात्मक प्रवणता है <math>f</math> पर <math>\mathbf{x}_k</math>, इसलिए ग्रेडिएंट डिसेंट विधि को दिशा r में स्थानांतरित करने की आवश्यकता होगी<sub>''k''</sub>. चूंकि, हम जोर देकर कहते हैं कि निर्देश <math>\mathbf{p}_k</math> दूसरे से संयुग्मित होना चाहिए। इसे प्रयुक्त  करने का व्यावहारिक विधि यह है कि वर्तमान अवशिष्ट और सभी पिछली खोज दिशाओं से अगली खोज दिशा बनाई जाए। संयुग्मन बाधा ऑर्थोनॉर्मल-प्रकार की बाधा है और इसलिए एल्गोरिथम को ग्राम-श्मिट प्रक्रिया के उदाहरण के रूप में देखा जा सकता है। ग्राम-श्मिट ऑर्थोनॉर्मलाइज़ेशन। यह निम्नलिखित अभिव्यक्ति देता है:
जैसा कि ऊपर देखा गया है, <math>\mathbf{r}_k</math> की ऋणात्मक प्रवणता <math>\mathbf{x}_k</math> है,अतः ग्रेडिएंट डिसेंट विधि को दिशा r<sub>''k''</sub> में स्थानांतरित करने की आवश्यकता होगी चूंकि, हम कह सकते हैं कि निर्देश <math>\mathbf{p}_k</math> दूसरे से संयुग्मित होना चाहिए। इसे प्रयुक्त  करने के लिए व्यावहारिक विधि यह है कि वर्तमान अवशिष्ट और सभी पिछली खोज दिशाओं से अगली खोज दिशा बनाई जाए। जो संयुग्मन बाधा ऑर्थोनॉर्मल-प्रकार की बाधा है अतः एल्गोरिथम को ग्राम-श्मिट प्रक्रिया के उदाहरण के रूप में देखा जा सकता है। ग्राम-श्मिट ऑर्थोनॉर्मलाइज़ेशन के माध्यम से निम्नलिखित अभिव्यक्ति देता है।
:<math>\mathbf{p}_{k} = \mathbf{r}_{k} - \sum_{i < k}\frac{\mathbf{p}_i^\mathsf{T} \mathbf{A} \mathbf{r}_{k}}{\mathbf{p}_i^\mathsf{T}\mathbf{A} \mathbf{p}_i} \mathbf{p}_i</math>
:<math>\mathbf{p}_{k} = \mathbf{r}_{k} - \sum_{i < k}\frac{\mathbf{p}_i^\mathsf{T} \mathbf{A} \mathbf{r}_{k}}{\mathbf{p}_i^\mathsf{T}\mathbf{A} \mathbf{p}_i} \mathbf{p}_i</math>
(अभिसरण पर संयुग्मन बाधा के प्रभाव के लिए लेख के शीर्ष पर चित्र देखें)। इस दिशा का पालन करते हुए, अगला इष्टतम स्थान द्वारा दिया गया है
(अभिसरण पर संयुग्मन बाधा के प्रभाव के लिए लेख के शीर्ष पर चित्र देखें)। इस दिशा का पालन करते हुए अगला इष्टतम स्थान दिया गया है।
:<math> \mathbf{x}_{k+1} = \mathbf{x}_k + \alpha_k \mathbf{p}_k </math>
:<math> \mathbf{x}_{k+1} = \mathbf{x}_k + \alpha_k \mathbf{p}_k </math>
साथ
जिसके साथ
:<math> \alpha_{k} = \frac{\mathbf{p}_k^\mathsf{T} (\mathbf{b} - \mathbf{Ax}_k )}{\mathbf{p}_k^\mathsf{T} \mathbf{A} \mathbf{p}_k} = \frac{\mathbf{p}_{k}^\mathsf{T} \mathbf{r}_{k}}{\mathbf{p}_{k}^\mathsf{T} \mathbf{A} \mathbf{p}_{k}},  </math>
:<math> \alpha_{k} = \frac{\mathbf{p}_k^\mathsf{T} (\mathbf{b} - \mathbf{Ax}_k )}{\mathbf{p}_k^\mathsf{T} \mathbf{A} \mathbf{p}_k} = \frac{\mathbf{p}_{k}^\mathsf{T} \mathbf{r}_{k}}{\mathbf{p}_{k}^\mathsf{T} \mathbf{A} \mathbf{p}_{k}},  </math>
जहां अंतिम समानता की परिभाषा से होती है <math>\mathbf{r}_k</math> .
जहां अंतिम समानता <math>\mathbf{r}_k</math> की परिभाषा  होती है।
के लिए अभिव्यक्ति <math> \alpha_k </math> व्युत्पन्न किया जा सकता है यदि कोई एक्स के लिए अभिव्यक्ति को प्रतिस्थापित करता है<sub>''k''+1</sub> f में और इसके संबंध में इसे कम करना <math> \alpha_k </math>
 
जिसके लिए अभिव्यक्ति <math> \alpha_k </math> व्युत्पन्न किया जा सकता है यदि कोई x<sub>''k''+1</sub> के लिए अभिव्यक्ति को प्रतिस्थापित करता है तब f और  में और <math> \alpha_k </math> इसके संबंध में इसे कम करना होता है
:<math>
:<math>
\begin{align}
\begin{align}
Line 93: Line 93:


=== परिणामी एल्गोरिथ्म ===
=== परिणामी एल्गोरिथ्म ===
उपरोक्त एल्गोरिथम संयुग्मी प्रवणता विधि की सबसे सरल व्याख्या देता है। प्रतीत होता है, जैसा कि कहा गया है कि एल्गोरिदम को सभी पिछली खोज दिशाओं और अवशेष वैक्टरों के साथ-साथ कई मैट्रिक्स-वेक्टर गुणाओं के भंडारण की आवश्यकता होती है, और इस प्रकार कम्प्यूटेशनल रूप से महंगा हो सकता है। चूँकि, एल्गोरिथम के करीबी विश्लेषण से पता चलता है <math>\mathbf{r}_i</math> यह ओर्थोगोनल है <math>\mathbf{r}_j</math>, अर्थात। <math>\mathbf{r}_i^\mathsf{T} \mathbf{r}_j=0 </math> , मैं ≠ जे के लिए। और <math>\mathbf{p}_i</math>है <math>\mathbf{A}</math>-ऑर्थोगोनल यह <math>\mathbf{p}_j</math> , अर्थात। <math>\mathbf{p}_i^\mathsf{T} \mathbf{A} \mathbf{p}_j=0 </math> , के लिए <math>i \neq j</math>. यह माना जा सकता है कि जैसे-जैसे एल्गोरिथम आगे बढ़ता है, <math>\mathbf{p}_i</math> और <math>\mathbf{r}_i</math> ही क्रायलोव उप-क्षेत्र में फैला हुआ है। कहाँ <math>\mathbf{r}_i</math> मानक आंतरिक उत्पाद के संबंध में ऑर्थोगोनल आधार बनाते हैं, और <math>\mathbf{p}_i</math> द्वारा प्रेरित आंतरिक उत्पाद के संबंध में ऑर्थोगोनल आधार बनाते हैं <math>\mathbf{A}</math>. इसलिए, <math>\mathbf{x}_k</math> का प्रक्षेपण माना जा सकता है <math>\mathbf{x}</math> क्रायलोव उपक्षेत्र पर।
उपरोक्त एल्गोरिथम संयुग्मी प्रवणता विधि की सबसे सरल व्याख्या देता है। प्रतीत होता है, जैसा कि कहा गया है कि एल्गोरिदम को सभी पिछली खोज दिशाओं और अवशेष वैक्टरों के साथ-साथ कई मैट्रिक्स-वेक्टर गुणाओं के भंडारण की आवश्यकता होती है, और इस प्रकार कम्प्यूटेशनल रूप से महंगा हो सकता है। चूँकि, एल्गोरिथम के करीबी विश्लेषण से पता चलता है <math>\mathbf{r}_i</math> यह ओर्थोगोनल है <math>\mathbf{r}_j</math>, अर्थात। <math>\mathbf{r}_i^\mathsf{T} \mathbf{r}_j=0 </math> , मैं ≠ जे के लिए। और <math>\mathbf{p}_i</math>है <math>\mathbf{A}</math>-ऑर्थोगोनल यह <math>\mathbf{p}_j</math> , अर्थात। <math>\mathbf{p}_i^\mathsf{T} \mathbf{A} \mathbf{p}_j=0 </math> , के लिए <math>i \neq j</math>. यह माना जा सकता है कि जैसे-जैसे एल्गोरिथम आगे बढ़ता है, <math>\mathbf{p}_i</math> और <math>\mathbf{r}_i</math> ही क्रायलोव उप-क्षेत्र में फैला हुआ है। कहाँ <math>\mathbf{r}_i</math> मानक आंतरिक उत्पाद के संबंध में ऑर्थोगोनल आधार बनाते हैं, और <math>\mathbf{p}_i</math> द्वारा प्रेरित आंतरिक उत्पाद के संबंध में ऑर्थोगोनल आधार बनाते हैं <math>\mathbf{A}</math>. अतः, <math>\mathbf{x}_k</math> का प्रक्षेपण माना जा सकता है <math>\mathbf{x}</math> क्रायलोव उपक्षेत्र पर।


Ax = b को हल करने के लिए एल्गोरिथम का विवरण नीचे दिया गया है <math>\mathbf{A}</math> वास्तविक, सममित, सकारात्मक-निश्चित मैट्रिक्स है। इनपुट वेक्टर <math>\mathbf{x}_0</math> अनुमानित प्रारंभिक समाधान या 0 हो सकता है। यह ऊपर वर्णित त्रुटिहीन प्रक्रिया का अलग सूत्रीकरण है।
Ax = b को हल करने के लिए एल्गोरिथम का विवरण नीचे दिया गया है <math>\mathbf{A}</math> वास्तविक, सममित, सकारात्मक-निश्चित मैट्रिक्स है। इनपुट वेक्टर <math>\mathbf{x}_0</math> अनुमानित प्रारंभिक समाधान या 0 हो सकता है। यह ऊपर वर्णित त्रुटिहीन प्रक्रिया का अलग सूत्रीकरण है।
Line 325: Line 325:
लचीला संस्करण भी दिखाया गया है<ref>{{Cite journal|url=https://doi.org/10.1016/j.procs.2015.05.241|doi=10.1016/j.procs.2015.05.241|title=Nonsymmetric Preconditioning for Conjugate Gradient and Steepest Descent Methods 1|year=2015|last1=Bouwmeester|first1=Henricus|last2=Dougherty|first2=Andrew|last3=Knyazev|first3=Andrew V.|journal=Procedia Computer Science|volume=51|pages=276–285|s2cid=51978658|doi-access=free}}</ref> मजबूत होने के लिए यदि  पूर्व शर्त सममित सकारात्मक निश्चित (एसपीडी) न हो।
लचीला संस्करण भी दिखाया गया है<ref>{{Cite journal|url=https://doi.org/10.1016/j.procs.2015.05.241|doi=10.1016/j.procs.2015.05.241|title=Nonsymmetric Preconditioning for Conjugate Gradient and Steepest Descent Methods 1|year=2015|last1=Bouwmeester|first1=Henricus|last2=Dougherty|first2=Andrew|last3=Knyazev|first3=Andrew V.|journal=Procedia Computer Science|volume=51|pages=276–285|s2cid=51978658|doi-access=free}}</ref> मजबूत होने के लिए यदि  पूर्व शर्त सममित सकारात्मक निश्चित (एसपीडी) न हो।


लचीले संस्करण के कार्यान्वयन के लिए अतिरिक्त वेक्टर के भंडारण की आवश्यकता होती है। निश्चित एसपीडी पूर्व शर्त के लिए, <math>\mathbf{r}_{k+1}^\mathsf{T} \mathbf{z}_{k}=0,</math> इसलिए दोनों सूत्र {{mvar|β<sub>k</sub>}} त्रुटिहीन अंकगणित में समतुल्य हैं, अर्थात राउंड-ऑफ त्रुटि के बिना।
लचीले संस्करण के कार्यान्वयन के लिए अतिरिक्त वेक्टर के भंडारण की आवश्यकता होती है। निश्चित एसपीडी पूर्व शर्त के लिए, <math>\mathbf{r}_{k+1}^\mathsf{T} \mathbf{z}_{k}=0,</math> अतः दोनों सूत्र {{mvar|β<sub>k</sub>}} त्रुटिहीन अंकगणित में समतुल्य हैं, अर्थात राउंड-ऑफ त्रुटि के बिना।


गैर-रैखिक संयुग्म ग्रेडिएंट विधि के साथ विधि के बेहतर अभिसरण व्यवहार की गणितीय व्याख्या। पोलक-रिबिएर सूत्र यह है कि इस स्थितियों में विधि स्थानीय रूप से इष्टतम है, विशेष रूप से, यह स्थानीय रूप से इष्टतम स्टीपेस्ट डिसेंट विधि की तुलना में धीमी अभिसरण नहीं करती है।<ref>{{cite journal|doi=10.1137/060675290|title=Steepest Descent and Conjugate Gradient Methods with Variable Preconditioning| year=2008| last1=Knyazev|first1=Andrew V.|last2=Lashuk|first2=Ilya|journal=SIAM Journal on Matrix Analysis and Applications|volume=29|issue=4|pages=1267|arxiv=math/0605767|s2cid=17614913}}</ref>
गैर-रैखिक संयुग्म ग्रेडिएंट विधि के साथ विधि के बेहतर अभिसरण व्यवहार की गणितीय व्याख्या। पोलक-रिबिएर सूत्र यह है कि इस स्थितियों में विधि स्थानीय रूप से इष्टतम है, विशेष रूप से, यह स्थानीय रूप से इष्टतम स्टीपेस्ट डिसेंट विधि की तुलना में धीमी अभिसरण नहीं करती है।<ref>{{cite journal|doi=10.1137/060675290|title=Steepest Descent and Conjugate Gradient Methods with Variable Preconditioning| year=2008| last1=Knyazev|first1=Andrew V.|last2=Lashuk|first2=Ilya|journal=SIAM Journal on Matrix Analysis and Applications|volume=29|issue=4|pages=1267|arxiv=math/0605767|s2cid=17614913}}</ref>
Line 332: Line 332:
== बनाम। स्थानीय रूप से इष्टतम स्टीपेस्ट डिसेंट विधि ==
== बनाम। स्थानीय रूप से इष्टतम स्टीपेस्ट डिसेंट विधि ==


मूल और पूर्वानुकूल संयुग्म ग्रेडिएंट दोनों विधियों में केवल सेट करने की आवश्यकता होती है  <math>\beta_k := 0</math> [[रेखा खोज]], [[तेज वंश]] विधियों का उपयोग करके उन्हें स्थानीय रूप से इष्टतम बनाने के लिए। इस प्रतिस्थापन के साथ, vectors {{math|'''p'''}} हमेशा वैक्टर के समान होते हैं {{math|'''z'''}}, इसलिए वैक्टर को स्टोर करने की कोई जरूरत नहीं है {{math|'''p'''}}. इस प्रकार, संयुग्मित ढाल विधियों की तुलना में इन सबसे तेज वंश विधियों का प्रत्येक पुनरावृत्ति थोड़ा सस्ता है। चूंकि, बाद वाला तेजी से अभिसरण करता है, जब तक कि (अत्यधिक) चर और/या गैर-एसपीडी पूर्व शर्त का उपयोग नहीं किया जाता है, ऊपर देखें।
मूल और पूर्वानुकूल संयुग्म ग्रेडिएंट दोनों विधियों में केवल सेट करने की आवश्यकता होती है  <math>\beta_k := 0</math> [[रेखा खोज]], [[तेज वंश]] विधियों का उपयोग करके उन्हें स्थानीय रूप से इष्टतम बनाने के लिए। इस प्रतिस्थापन के साथ, vectors {{math|'''p'''}} हमेशा वैक्टर के समान होते हैं {{math|'''z'''}}, अतः वैक्टर को स्टोर करने की कोई जरूरत नहीं है {{math|'''p'''}}. इस प्रकार, संयुग्मित ढाल विधियों की तुलना में इन सबसे तेज वंश विधियों का प्रत्येक पुनरावृत्ति थोड़ा सस्ता है। चूंकि, बाद वाला तेजी से अभिसरण करता है, जब तक कि (अत्यधिक) चर और/या गैर-एसपीडी पूर्व शर्त का उपयोग नहीं किया जाता है, ऊपर देखें।


== डबल इंटीग्रेटर == के लिए इष्टतम प्रतिक्रिया नियंत्रक के रूप में संयुग्मित ढाल विधि
== डबल इंटीग्रेटर == के लिए इष्टतम प्रतिक्रिया नियंत्रक के रूप में संयुग्मित ढाल विधि
Line 345: Line 345:
: ए<sup>टी</sup>कुल्हाड़ी = ए<sup>टी</सुप>बी
: ए<sup>टी</sup>कुल्हाड़ी = ए<sup>टी</सुप>बी


पुनरावृत्त विधि के रूप में, A बनाना आवश्यक नहीं है<sup>T</sup>A स्मृति में स्पष्ट रूप से लेकिन केवल मैट्रिक्स-वेक्टर को निष्पादित करने और मैट्रिक्स-वेक्टर गुणन को स्थानांतरित करने के लिए। इसलिए, सीजीएनआर विशेष रूप से उपयोगी होता है जब 'ए' विरल मैट्रिक्स होता है क्योंकि ये ऑपरेशन सामान्यतः बेहद कुशल होते हैं। चूँकि सामान्य समीकरण बनाने का नकारात्मक पक्ष यह है कि स्थिति संख्या κ(A<sup>T</sup>A) κ के बराबर है<sup>2</sup>(ए) और इसलिए सीजीएनआर के अभिसरण की दर धीमी हो सकती है और अनुमानित समाधान की गुणवत्ता राउंडऑफ त्रुटियों के प्रति संवेदनशील हो सकती है। अच्छा पूर्व-कंडीशनर ढूँढना अधिकांशतःसीजीएनआर पद्धति का उपयोग करने का महत्वपूर्ण हिस्सा होता है।
पुनरावृत्त विधि के रूप में, A बनाना आवश्यक नहीं है<sup>T</sup>A स्मृति में स्पष्ट रूप से लेकिन केवल मैट्रिक्स-वेक्टर को निष्पादित करने और मैट्रिक्स-वेक्टर गुणन को स्थानांतरित करने के लिए। अतः, सीजीएनआर विशेष रूप से उपयोगी होता है जब 'ए' विरल मैट्रिक्स होता है क्योंकि ये ऑपरेशन सामान्यतः बेहद कुशल होते हैं। चूँकि सामान्य समीकरण बनाने का नकारात्मक पक्ष यह है कि स्थिति संख्या κ(A<sup>T</sup>A) κ के बराबर है<sup>2</sup>(ए) और अतः सीजीएनआर के अभिसरण की दर धीमी हो सकती है और अनुमानित समाधान की गुणवत्ता राउंडऑफ त्रुटियों के प्रति संवेदनशील हो सकती है। अच्छा पूर्व-कंडीशनर ढूँढना अधिकांशतःसीजीएनआर पद्धति का उपयोग करने का महत्वपूर्ण हिस्सा होता है।


कई एल्गोरिदम प्रस्तावित किए गए हैं (उदाहरण के लिए, सीजीएलएस, एलएसक्यूआर)। [https://web.stanford.edu/group/SOL/software/lsqr/ LSQR] एल्गोरिथम कथित तौर पर सर्वश्रेष्ठ संख्यात्मक स्थिरता रखता है जब A बीमार होता है, अर्थात, A के पास बड़ी स्थिति संख्या होती है।
कई एल्गोरिदम प्रस्तावित किए गए हैं (उदाहरण के लिए, सीजीएलएस, एलएसक्यूआर)। [https://web.stanford.edu/group/SOL/software/lsqr/ LSQR] एल्गोरिथम कथित तौर पर सर्वश्रेष्ठ संख्यात्मक स्थिरता रखता है जब A बीमार होता है, अर्थात, A के पास बड़ी स्थिति संख्या होती है।

Revision as of 19:38, 15 February 2023

किसी दिए गए रैखिक प्रणाली से जुड़े द्विघात समारोह को कम करने के लिए इष्टतम चरण आकार (हरे रंग में) और संयुग्म वेक्टर (लाल रंग में) के साथ ढाल वंश के अभिसरण की तुलना। संयुग्मी ढाल, त्रुटिहीन अंकगणित मानते हुए, अधिकांश n चरणों में अभिसरण करता है, जहाँ n प्रणाली के मैट्रिक्स का आकार है (यहाँ n = 2)।

गणित में, संयुग्मी ढाल विधि रैखिक समीकरणों की विशेष प्रणाली के संख्यात्मक समाधान के लिए कलन विधि है, जिसका मैट्रिक्स सकारात्मक-निश्चित मैट्रिक्स है। संयुग्मी ढाल पद्धति को अधिकांशतः पुनरावृत्त विधि के रूप में प्रयुक्त किया जाता है, जो विरल मैट्रिक्स प्रणाली पर प्रयुक्त होता है जो प्रत्यक्ष कार्यान्वयन या अन्य प्रत्यक्ष प्रणाली जैसे चोल्स्की अपघटन द्वारा नियंत्रित किया जा सकता है। आंशिक अंतर समीकरणों या अनुकूलन स्थितियों को संख्यात्मक रूप से हल करते समय बड़े विरल प्रणालियां उत्पन्न होती हैं।

संयुग्मी ढाल विधि का उपयोग ऊर्जा न्यूनीकरण जैसी अप्रतिबंधित गणितीय अनुकूलन स्थितियों को हल करने के लिए भी किया जा सकता है। यह सामान्यतः मैग्नस हेस्टेन्स और एडवर्ड बूट्स को जिम्मेदार ठहराया जाता है,[1][2] जिसने इसे Z4 (कंप्यूटर) पर प्रोग्राम किया,[3] और इस पर गहन शोध किया।[4][5]

बीकॉन्जुगेट ग्रेडिएंट विधि गैर-सममित आव्यूहों को सामान्यीकरण प्रदान करती है। विभिन्न अरैखिक संयुग्मी प्रवणता विधियाँ अरैखिक अनुकूलन स्थितियों की न्यूनतम खोज करती हैं।

संयुग्म ग्रेडिएंट्स द्वारा संबोधित समस्या का विवरण

मान लीजिए हम रैखिक समीकरणों की प्रणाली को हल करना चाहते हैं।

वेक्टर के लिए , जहां जाना जाता है आव्यूह सममित मैट्रिक्स है (अर्थात, AT = A), धनात्मक-निश्चित मैट्रिक्स | धनात्मक-निश्चित (अर्थात xTAx > 0 सभी शून्येतर सदिशों के लिए n आर में), और वास्तविक संख्या, और भी जाना जाता है। हम इस प्रणाली में के अद्वितीय समाधान को निरूपित करते हैं।

प्रत्यक्ष विधि के रूप में व्युत्पत्ति

संयुग्मी प्रवणता पद्धति को कई भिन्न-भिन्न दृष्टिकोणों से प्राप्त किया जा सकता है, जिसमें अनुकूलन के लिए संयुग्मी दिशा पद्धति की विशेषज्ञता और eigenvalue स्थितियों के लिए अर्नोल्डी पुनरावृत्ति / एइगेन्लैंवलुएक्ज़ोस पुनरावृत्ति की भिन्नता सम्मलित है। उनके दृष्टिकोणों में अंतर के बावजूद, ये व्युत्पत्ति सामान्य विषय को साझा करते हैं - अवशेषों की ओर्थोगोनलिटी और खोज दिशाओं की संयुग्मता को सिद्ध करते हैं। विधि के प्रसिद्ध संक्षिप्त सूत्रीकरण को विकसित करने के लिए ये दो गुण महत्वपूर्ण हैं।

हम कह सकते हैं कि दो शून्येतर सदिश u और v संयुग्मी हैं (के संबंध में ) यदि

तब से सममित और सकारात्मक-निश्चित है, बाएं हाथ की ओर आंतरिक उत्पाद स्थान को परिभाषित करता है

यदि दो सदिश संयुग्मी हैं और यदि वे इस आंतरिक उत्पाद के संबंध में ओर्थोगोनल हैं। संयुग्मी होना सममित संबंध है, यदि , से संयुग्मित है तब से संयुग्मित है अर्थात् प्रतीत होता है कि

के संबंध में पारस्परिक रूप से संयुग्मित वैक्टर है अर्थात। सभी के लिए . का सेट है

तब के लिए आधार (रैखिक बीजगणित) बनाता है , और हम समाधान व्यक्त कर सकते हैं का इस आधार पर:

समस्या को वाम-गुणा करना वेक्टर के साथ उत्पन्नवार

अतः

यह निम्न विधि देता है।[4] समीकरण को हल करने के लिए Ax = b: का क्रम खोजें संयुग्मित दिशाएँ, और फिर गुणांकों की गणना करे.

पुनरावृत्त विधि के रूप में

यदि हम संयुग्म वैक्टर सावधानी से चुनते हैं, तब समाधान के लिए उचित सन्निकटन प्राप्त करने के लिए हमें उन सभी की आवश्यकता नहीं हो सकती है अतः, हम संयुग्मी ढाल विधि को पुनरावृत्त विधि के रूप में मानना ​​​​चाहते हैं। यह हमें उन प्रणालियों को हल करने की भी अनुमति देता है जहाँ n इतना बड़ा है कि प्रत्यक्ष विधि में बहुत अधिक समय लगेगा।

हम x द्वारा x0 (हम सामान्यता के नुकसान के बिना मान सकते हैं कि x0 = 0, अन्यथा प्रणाली Az = b - Ax0 पर विचार करें अतिरिक्त) के लिए प्रारंभिक अनुमान निरूपित करते हैं। x0 से प्रारंभ होने पर हम समाधान की खोज करते हैं और प्रत्येक पुनरावृत्ति में हमें यह व्यक्त करने के लिए मीट्रिक की आवश्यकता होती है कि क्या हम समाधान x के समीप हैं (यह हमारे लिए अज्ञात है)। यह मीट्रिक इस तथ्य से आता है कि समाधान x निम्नलिखित द्विघात फलन का अद्वितीय न्यूनतमकारक भी है।

अद्वितीय न्यूनतम का अस्तित्व स्पष्ट है क्योंकि इसके दूसरे व्युत्पन्न का हेसियन मैट्रिक्स सममित सकारात्मक-निश्चित है

और यह कि न्यूनतम (उपयोग Df('x')=0) प्रारंभिक समस्या को इसके प्रथम व्युत्पन्न से हल करता है

यह प्रथम आधार सदिश P0 लेने का सुझाव देता है और 'x0' = 'x0' पर f की प्रवणता का ऋणात्मक होता है जिससे f की प्रवणता समान्तर होती है Axb. प्रारंभिक अनुमान x0 से प्रारंभ किया जाता है इसका तात्पर्य है कि हम P0 = B- कुल्हाड़ी लेते हैं जिसके आधार में अन्य वैक्टर ग्रेडिएंट के संयुग्मित होंगे, अतः नाम संयुग्म ग्रेडिएंट विधि है। ध्यान दें कि 'P'0 एल्गोरिथम के इस प्रारंभिक चरण द्वारा प्रदान किया गया अवशिष्ट (संख्यात्मक विश्लेषण) भी है।

अतः rk kवें चरण में अवशिष्ट (संख्यात्मक विश्लेषण) होता है।

जैसा कि ऊपर देखा गया है, की ऋणात्मक प्रवणता है,अतः ग्रेडिएंट डिसेंट विधि को दिशा rk में स्थानांतरित करने की आवश्यकता होगी चूंकि, हम कह सकते हैं कि निर्देश दूसरे से संयुग्मित होना चाहिए। इसे प्रयुक्त करने के लिए व्यावहारिक विधि यह है कि वर्तमान अवशिष्ट और सभी पिछली खोज दिशाओं से अगली खोज दिशा बनाई जाए। जो संयुग्मन बाधा ऑर्थोनॉर्मल-प्रकार की बाधा है अतः एल्गोरिथम को ग्राम-श्मिट प्रक्रिया के उदाहरण के रूप में देखा जा सकता है। ग्राम-श्मिट ऑर्थोनॉर्मलाइज़ेशन के माध्यम से निम्नलिखित अभिव्यक्ति देता है।

(अभिसरण पर संयुग्मन बाधा के प्रभाव के लिए लेख के शीर्ष पर चित्र देखें)। इस दिशा का पालन करते हुए अगला इष्टतम स्थान दिया गया है।

जिसके साथ

जहां अंतिम समानता की परिभाषा होती है।

जिसके लिए अभिव्यक्ति व्युत्पन्न किया जा सकता है यदि कोई xk+1 के लिए अभिव्यक्ति को प्रतिस्थापित करता है तब f और में और इसके संबंध में इसे कम करना होता है


परिणामी एल्गोरिथ्म

उपरोक्त एल्गोरिथम संयुग्मी प्रवणता विधि की सबसे सरल व्याख्या देता है। प्रतीत होता है, जैसा कि कहा गया है कि एल्गोरिदम को सभी पिछली खोज दिशाओं और अवशेष वैक्टरों के साथ-साथ कई मैट्रिक्स-वेक्टर गुणाओं के भंडारण की आवश्यकता होती है, और इस प्रकार कम्प्यूटेशनल रूप से महंगा हो सकता है। चूँकि, एल्गोरिथम के करीबी विश्लेषण से पता चलता है यह ओर्थोगोनल है , अर्थात। , मैं ≠ जे के लिए। और है -ऑर्थोगोनल यह , अर्थात। , के लिए . यह माना जा सकता है कि जैसे-जैसे एल्गोरिथम आगे बढ़ता है, और ही क्रायलोव उप-क्षेत्र में फैला हुआ है। कहाँ मानक आंतरिक उत्पाद के संबंध में ऑर्थोगोनल आधार बनाते हैं, और द्वारा प्रेरित आंतरिक उत्पाद के संबंध में ऑर्थोगोनल आधार बनाते हैं . अतः, का प्रक्षेपण माना जा सकता है क्रायलोव उपक्षेत्र पर।

Ax = b को हल करने के लिए एल्गोरिथम का विवरण नीचे दिया गया है वास्तविक, सममित, सकारात्मक-निश्चित मैट्रिक्स है। इनपुट वेक्टर अनुमानित प्रारंभिक समाधान या 0 हो सकता है। यह ऊपर वर्णित त्रुटिहीन प्रक्रिया का अलग सूत्रीकरण है।

यह सबसे अधिक उपयोग किया जाने वाला एल्गोरिदम है। के लिए ही सूत्र है βk फ्लेचर-रीव्स नॉनलाइनियर कंजुगेट ग्रेडिएंट विधि में भी प्रयोग किया जाता है।

पुनरारंभ

हमने ध्यान दिया कि ग्रेडिएंट डिसेंट#सॉल्यूशन ऑफ़ ए लीनियर प्रणाली मेथड द्वारा गणना की जाती है . सेटिंग इसी तरह बना देगा ग्रेडिएंट डिसेंट#सॉल्यूशन ऑफ़ ए लीनियर प्रणाली मेथड द्वारा गणना की गई , अर्थात, संयुग्म ढाल पुनरावृत्तियों के पुनरारंभ के सरल कार्यान्वयन के रूप में उपयोग किया जा सकता है।[4]पुनर्प्रारंभ अभिसरण को धीमा कर सकता है, लेकिन स्थिरता में सुधार कर सकता है यदि संयुग्मी ग्रेडिएंट विधि गलत व्यवहार करती है, उदाहरण के लिए, राउंड-ऑफ़ त्रुटि के कारण।

स्पष्ट अवशिष्ट गणना

सूत्र और , जो दोनों त्रुटिहीन अंकगणित में धारण करते हैं, सूत्र बनाते हैं और गणितीय समकक्ष। पूर्व का उपयोग एल्गोरिथम में अतिरिक्त गुणन से बचने के लिए किया जाता है वेक्टर के बाद से मूल्यांकन के लिए पहले से ही गणना की गई है . उत्तरार्द्ध अधिक त्रुटिहीन हो सकता है, स्पष्ट गणना को प्रतिस्थापित कर सकता है निहित के लिए पुनरावर्ती त्रुटि संचय के अधीन है, और इस प्रकार सामयिक मूल्यांकन के लिए अनुशंसित है।[6] अवशिष्ट का मानदंड सामान्यतः मानदंडों को रोकने के लिए उपयोग किया जाता है। स्पष्ट अवशिष्ट का मानदंड त्रुटिहीन अंकगणित और राउंडिंग त्रुटियों की उपस्थिति में त्रुटिहीनता का गारंटीकृत स्तर प्रदान करता है, जहां अभिसरण स्वाभाविक रूप से स्थिर हो जाता है। इसके विपरीत, निहित अवशिष्ट गोलाई त्रुटियों के स्तर से अधिक नीचे आयाम में छोटा होता रहता है और इस प्रकार अभिसरण के ठहराव को निर्धारित करने के लिए उपयोग नहीं किया जा सकता है।

अल्फा और बीटा की गणना

एल्गोरिथ्म में, αk ऐसा चुना जाता है यह ओर्थोगोनल है . भाजक से सरलीकृत किया गया है

तब से . βk }} ऐसा चुना जाता है कि से संयुग्मित है . प्रारंभ में, βk है

का उपयोग करते हुए

और समान रूप से

का अंश βk के रूप में पुनः लिखा जाता है

क्योंकि और डिजाइन द्वारा ओर्थोगोनल हैं। भाजक को फिर से लिखा जाता है

इसका उपयोग करते हुए खोज दिशाएँ pk संयुग्मित हैं और फिर से अवशिष्ट ऑर्थोगोनल हैं। यह देता है β एल्गोरिथ्म में रद्द करने के बाद αk.

== MATLAB / GNU ऑक्टेव में उदाहरण कोड

<वाक्यविन्यास प्रकाश लैंग = matlab> फ़ंक्शन एक्स = कंजग्रेड (ए, बी, एक्स)

   आर = बी - ए * एक्स;
   पी = आर;
   आरसोल्ड = आर' * आर;
   मैं = 1 के लिए: लंबाई (बी)
       एपी = ए * पी;
       अल्फा = रसोल्ड / (पी '* एपी);
       एक्स = एक्स + अल्फा * पी;
       आर = आर - अल्फा * एपी;
       आरएसन्यू = आर' * आर;
       यदि sqrt(rsnew) <1e-10
           तोड़ना
       अंत
       पी = आर + (rsnew / rsold) * पी;
       rsold = rsnew;
   अंत

अंत </वाक्यविन्यास हाइलाइट>

संख्यात्मक उदाहरण

द्वारा दी गई रैखिक प्रणाली Ax = b पर विचार करें

हम प्रारंभिक अनुमान से शुरुआत करते हुए संयुग्मी ढाल विधि के दो चरण करेंगे

प्रणाली के लिए अनुमानित समाधान खोजने के लिए।

उपाय

संदर्भ के लिए, त्रुटिहीन समाधान है

हमारा पहला कदम अवशिष्ट सदिश r की गणना करना है0 x से जुड़ा हुआ है0. इस अवशिष्ट की गणना सूत्र r से की जाती है0 = बी - कुल्हाड़ी0, और हमारे स्थितियों में के बराबर है

चूंकि यह पहला पुनरावृत्ति है, हम अवशिष्ट सदिश r का उपयोग करेंगे0 हमारी प्रारंभिक खोज दिशा पी के रूप में0; पी चुनने की विधिk आगे के पुनरावृत्तियों में बदल जाएगा।

अब हम स्केलर की गणना करते हैं α0 संबंध का उपयोग करना

अब हम x की गणना कर सकते हैं1 सूत्र का उपयोग करना

यह परिणाम पहले पुनरावृत्ति को पूरा करता है, परिणाम प्रणाली के लिए बेहतर अनुमानित समाधान है, x1. अब हम आगे बढ़ सकते हैं और अगले अवशिष्ट सदिश r की गणना कर सकते हैं1 सूत्र का उपयोग करना

इस प्रक्रिया में हमारा अगला कदम स्केलर की गणना करना है β0 जिसका उपयोग अंततः अगली खोज दिशा p निर्धारित करने के लिए किया जाएगा1.

अब इस अदिश का उपयोग करते हुए β0, हम अगली खोज दिशा p की गणना कर सकते हैं1 संबंध का उपयोग करना

अब हम स्केलर की गणना करते हैं α1 हमारे नए अधिग्रहीत पी का उपयोग करना1 के लिए जिस विधि का उपयोग किया जाता है उसी विधि का उपयोग करना α0.

अंत में, हम x पाते हैं2 x को खोजने के लिए उपयोग की जाने वाली विधि का उपयोग करना1.

नतीजा, एक्स2, x की तुलना में प्रणाली के समाधान का बेहतर सन्निकटन है1 और एक्स0. यदि इस उदाहरण में सीमित-परिशुद्धता के अतिरिक्त त्रुटिहीन अंकगणित का उपयोग किया जाना था, तो सैद्धांतिक रूप से त्रुटिहीन समाधान n = 2 पुनरावृत्तियों (n प्रणाली का क्रम होने के नाते) के बाद पहुंचा होगा।

अभिसरण गुण

संयुग्मी ढाल विधि को सैद्धांतिक रूप से प्रत्यक्ष विधि के रूप में देखा जा सकता है, क्योंकि गोल-बंद त्रुटि के अभाव में यह पुनरावृत्तियों की सीमित संख्या के बाद त्रुटिहीन समाधान उत्पन्न करता है, जो मैट्रिक्स के आकार से बड़ा नहीं है। व्यावहारिक रूप से, त्रुटिहीन समाधान कभी प्राप्त नहीं होता है क्योंकि संयुग्मी ढाल विधि छोटी गड़बड़ी के संबंध में भी अस्थिर है, उदाहरण के लिए, क्रायलोव उप-स्थानों को उत्पन्न करने की अपक्षयी प्रकृति के कारण, अधिकांश दिशाएं संयुग्मित व्यवहार में नहीं हैं।

पुनरावृत्त विधि के रूप में, संयुग्मी ढाल विधि नीरस रूप से (ऊर्जा मानक में) सन्निकटन में सुधार करती है त्रुटिहीन समाधान के लिए और पुनरावृत्तियों की अपेक्षाकृत छोटी (समस्या के आकार की तुलना में) संख्या के बाद आवश्यक सहिष्णुता तक पहुंच सकता है। सुधार सामान्यतः रैखिक होता है और इसकी गति स्थिति संख्या द्वारा निर्धारित की जाती है प्रणाली मैट्रिक्स का : बड़ा है, सुधार जितना धीमा होगा।[7] यदि बड़ा है, मूल प्रणाली को बदलने के लिए सामान्यतः पूर्व शर्त का उपयोग किया जाता है साथ ऐसा है कि की तुलना में छोटा है , नीचे देखें।

अभिसरण प्रमेय

बहुपदों के उपसमुच्चय को इस रूप में परिभाषित कीजिए

कहाँ अधिकतम डिग्री के बहुपद वलय का समुच्चय है .

होने देना त्रुटिहीन समाधान के पुनरावृत्त सन्निकटन हो , और त्रुटियों को परिभाषित करें . अब, अभिसरण की दर का अनुमान लगाया जा सकता है [4][8]

कहाँ मैट्रिक्स के स्पेक्ट्रम को दर्शाता है, और स्थिति संख्या को दर्शाता है।

ध्यान दें, महत्वपूर्ण सीमा कब आदत है

यह सीमा जैकोबी पद्धति या गॉस-सीडेल विधि की पुनरावृत्ति विधियों की तुलना में तेज अभिसरण दर दिखाती है। .

अभिसरण प्रमेय में कोई गोल-बंद त्रुटि नहीं मानी जाती है, लेकिन अभिसरण सीमा सामान्यतः व्यवहार में मान्य होती है जैसा कि सैद्धांतिक रूप से समझाया गया है[5]ऐनी ग्रीनबाउम द्वारा।

व्यावहारिक अभिसरण

यदि बेतरतीब ढंग से आरंभ किया जाता है, तो पुनरावृत्तियों का पहला चरण अधिकांशतःसबसे तेज़ होता है, क्योंकि क्रायलोव उप-स्थान के भीतर त्रुटि समाप्त हो जाती है जो प्रारंभ में छोटी प्रभावी स्थिति संख्या को दर्शाती है। अभिसरण का दूसरा चरण सामान्यतः सैद्धांतिक अभिसरण द्वारा अच्छी तरह से परिभाषित होता है , लेकिन मैट्रिक्स के स्पेक्ट्रम के वितरण के आधार पर सुपर-रैखिक हो सकता है और त्रुटि का वर्णक्रमीय वितरण।[5]अंतिम चरण में, सबसे छोटी प्राप्य त्रुटिहीनता तक पहुँच जाती है और अभिसरण रुक जाता है या विधि विचलन भी प्रारंभ कर सकती है। बड़े आकार के मैट्रिसेस के लिए डबल-परिशुद्धता फ़्लोटिंग-पॉइंट प्रारूप में विशिष्ट वैज्ञानिक कंप्यूटिंग अनुप्रयोगों में, संयुग्म ढाल विधि सहिष्णुता के साथ रोक मानदंड का उपयोग करती है जो पहले या दूसरे चरण के दौरान पुनरावृत्तियों को समाप्त करती है।

पूर्वानुकूल संयुग्म ग्रेडिएंट विधि

ज्यादातर स्थितियों में, संयुग्म ढाल विधि के तेजी से अभिसरण सुनिश्चित करने के लिए पूर्व शर्त आवश्यक है। यदि सममित सकारात्मक-निश्चित है और से बेहतर स्थिति संख्या है , पूर्वानुकूलित संयुग्मी प्रवणता विधि का उपयोग किया जा सकता है। यह निम्न रूप लेता है:[9]

दोहराना
यदि आरk+1 पर्याप्त रूप से छोटा है तो बाहर निकलें लूप अंत यदि
अंत दोहराएँ
परिणाम x हैk+1

उपरोक्त सूत्रीकरण नियमित संयुग्मी ढाल विधि को पूर्वानुकूलित प्रणाली में प्रयुक्त करने के बराबर है[10]

कहाँ

प्रणाली की समरूपता (और सकारात्मक निश्चितता) को बनाए रखने के लिए प्रीकंडिशनर के चोल्स्की अपघटन का उपयोग किया जाना चाहिए। चूँकि, इस अपघटन की गणना करने की आवश्यकता नहीं है, और यह जानने के लिए पर्याप्त है . यह दिखाया जा सकता है के समान स्पेक्ट्रम है .

पूर्व शर्त मैट्रिक्स एम को सममित सकारात्मक-निश्चित और निश्चित होना चाहिए, अर्थात पुनरावृत्ति से पुनरावृत्ति में नहीं बदल सकता है। यदि पूर्वानुकूलन पर इनमें से किसी भी धारणा का उल्लंघन किया जाता है, तो पूर्वानुकूलित संयुग्मी प्रवणता पद्धति का व्यवहार अप्रत्याशित हो सकता है।

सामान्यतः उपयोग किए जाने वाले प्रीकंडीशनर का उदाहरण अपूर्ण चोल्स्की गुणनखंडन है।[11]


लचीला पूर्व शर्त संयुग्म ढाल विधि

संख्यात्मक रूप से चुनौतीपूर्ण अनुप्रयोगों में, परिष्कृत प्रीकंडीशनर का उपयोग किया जाता है, जिससे पुनरावृत्तियों के बीच परिवर्तनशील पूर्वानुकूलन हो सकता है। यहां तक ​​​​कि यदि पूर्व शर्त प्रत्येक पुनरावृत्ति पर सममित सकारात्मक-निश्चित है, तो तथ्य यह है कि यह बदल सकता है तर्कों को अमान्य बना देता है, और व्यावहारिक परीक्षणों में ऊपर प्रस्तुत एल्गोरिदम के अभिसरण की महत्वपूर्ण धीमी गति की ओर जाता है। अरैखिक संयुग्मी ग्रेडिएंट पद्धति का उपयोग करना|पोलक-रिबिएर सूत्र

अरैखिक संयुग्मी ग्रेडिएंट पद्धति के अतिरिक्त | फ्लेचर-रीव्स सूत्र

इस स्थितियों में नाटकीय रूप से अभिसरण में सुधार कर सकते हैं।[12] पूर्वानुकूल संयुग्म ग्रेडिएंट विधि के इस संस्करण को कहा जा सकता है[13] लचीला, क्योंकि यह परिवर्तनीय पूर्व शर्त के लिए अनुमति देता है। लचीला संस्करण भी दिखाया गया है[14] मजबूत होने के लिए यदि पूर्व शर्त सममित सकारात्मक निश्चित (एसपीडी) न हो।

लचीले संस्करण के कार्यान्वयन के लिए अतिरिक्त वेक्टर के भंडारण की आवश्यकता होती है। निश्चित एसपीडी पूर्व शर्त के लिए, अतः दोनों सूत्र βk त्रुटिहीन अंकगणित में समतुल्य हैं, अर्थात राउंड-ऑफ त्रुटि के बिना।

गैर-रैखिक संयुग्म ग्रेडिएंट विधि के साथ विधि के बेहतर अभिसरण व्यवहार की गणितीय व्याख्या। पोलक-रिबिएर सूत्र यह है कि इस स्थितियों में विधि स्थानीय रूप से इष्टतम है, विशेष रूप से, यह स्थानीय रूप से इष्टतम स्टीपेस्ट डिसेंट विधि की तुलना में धीमी अभिसरण नहीं करती है।[15]


बनाम। स्थानीय रूप से इष्टतम स्टीपेस्ट डिसेंट विधि

मूल और पूर्वानुकूल संयुग्म ग्रेडिएंट दोनों विधियों में केवल सेट करने की आवश्यकता होती है रेखा खोज, तेज वंश विधियों का उपयोग करके उन्हें स्थानीय रूप से इष्टतम बनाने के लिए। इस प्रतिस्थापन के साथ, vectors p हमेशा वैक्टर के समान होते हैं z, अतः वैक्टर को स्टोर करने की कोई जरूरत नहीं है p. इस प्रकार, संयुग्मित ढाल विधियों की तुलना में इन सबसे तेज वंश विधियों का प्रत्येक पुनरावृत्ति थोड़ा सस्ता है। चूंकि, बाद वाला तेजी से अभिसरण करता है, जब तक कि (अत्यधिक) चर और/या गैर-एसपीडी पूर्व शर्त का उपयोग नहीं किया जाता है, ऊपर देखें।

== डबल इंटीग्रेटर == के लिए इष्टतम प्रतिक्रिया नियंत्रक के रूप में संयुग्मित ढाल विधि

इष्टतम नियंत्रण का उपयोग करके संयुग्म ढाल विधि भी प्राप्त की जा सकती है।[16] इस दृष्टिकोण में, संयुग्मी ढाल विधि प्रतिक्रिया नियंत्रण के रूप में बाहर हो जाती है,

डबल इंटीग्रेटर के लिए,
मात्राएँ और परिवर्तनीय प्रतिक्रिया लाभ हैं।[16]


सामान्य समीकरणों पर संयुग्म ढाल

संयुग्मी ढाल विधि को सामान्य समीकरणों 'ए' पर प्रयुक्त करके मनमाने ढंग से एन-बाय-एम मैट्रिक्स पर प्रयुक्त किया जा सकता है।TA और दाईं ओर सदिश Aटीबी, चूंकि एTA किसी भी A के लिए सममित सकारात्मक-निश्चित मैट्रिक्स#Negative-definite.2C अर्ध-निश्चित और अनिश्चित मैट्रिक्स|सकारात्मक-अर्ध-अर्ध-परिमित मैट्रिक्स है। परिणाम सामान्य समीकरणों (CGNR) पर संयुग्मित ढाल है।

टीकुल्हाड़ी = एटी</सुप>बी

पुनरावृत्त विधि के रूप में, A बनाना आवश्यक नहीं हैTA स्मृति में स्पष्ट रूप से लेकिन केवल मैट्रिक्स-वेक्टर को निष्पादित करने और मैट्रिक्स-वेक्टर गुणन को स्थानांतरित करने के लिए। अतः, सीजीएनआर विशेष रूप से उपयोगी होता है जब 'ए' विरल मैट्रिक्स होता है क्योंकि ये ऑपरेशन सामान्यतः बेहद कुशल होते हैं। चूँकि सामान्य समीकरण बनाने का नकारात्मक पक्ष यह है कि स्थिति संख्या κ(ATA) κ के बराबर है2(ए) और अतः सीजीएनआर के अभिसरण की दर धीमी हो सकती है और अनुमानित समाधान की गुणवत्ता राउंडऑफ त्रुटियों के प्रति संवेदनशील हो सकती है। अच्छा पूर्व-कंडीशनर ढूँढना अधिकांशतःसीजीएनआर पद्धति का उपयोग करने का महत्वपूर्ण हिस्सा होता है।

कई एल्गोरिदम प्रस्तावित किए गए हैं (उदाहरण के लिए, सीजीएलएस, एलएसक्यूआर)। LSQR एल्गोरिथम कथित तौर पर सर्वश्रेष्ठ संख्यात्मक स्थिरता रखता है जब A बीमार होता है, अर्थात, A के पास बड़ी स्थिति संख्या होती है।

जटिल हर्मिटियन मेट्रिसेस के लिए संयुग्मी ग्रेडिएंट विधि

जटिल-मूल्यवान मैट्रिक्स ए और वेक्टर बी, रैखिक समीकरणों की प्रणाली को देखते हुए, तुच्छ संशोधन के साथ संयुग्म ढाल विधि को हल करने के लिए विस्तार योग्य है कॉम्प्लेक्स-वैल्यू वेक्टर x के लिए, जहां ए हर्मिटियन है (अर्थात, ए' = ए) और सकारात्मक-निश्चित मैट्रिक्स, और प्रतीक ' MATLAB/GNU ऑक्टेव शैली का उपयोग करके संयुग्मित संक्रमण को दर्शाता है। तुच्छ संशोधन हर जगह वास्तविक स्थानान्तरण के लिए बस संयुग्म स्थानान्तरण को प्रतिस्थापित कर रहा है। यह प्रतिस्थापन पिछड़ा संगत है, क्योंकि संयुग्मित स्थानान्तरण वास्तविक-मूल्यवान सदिशों और आव्यूहों पर वास्तविक स्थानान्तरण में बदल जाता है। ऊपर दिए गए कॉन्जुगेट ग्रेडिएंट मेथड # उदाहरण कोड MATLAB / GNU ऑक्टेव में | MATLAB / GNU ऑक्टेव में उदाहरण कोड इस प्रकार पहले से ही जटिल हर्मिटियन मैट्रिसेस के लिए काम करता है, जिसमें किसी संशोधन की आवश्यकता नहीं है।

यह भी देखें

  • बीकॉन्जुगेट ग्रेडिएंट विधि (बीआईसीजी)
  • अवशिष्ट अवशिष्ट विधि
  • विश्वास प्रचार # गाऊसी विश्वास प्रचार .28GaBP.29
  • इटरेटिव मेथड # लीनियर सिस्टम | इटरेटिव मेथड: लीनियर सिस्टम
  • क्रायलोव उपक्षेत्र
  • गैर रेखीय संयुग्म ढाल विधि
  • पूर्व शर्त
  • विरल मैट्रिक्स-वेक्टर गुणन


संदर्भ

  1. Hestenes, Magnus R.; Stiefel, Eduard (December 1952). "Methods of Conjugate Gradients for Solving Linear Systems" (PDF). Journal of Research of the National Bureau of Standards. 49 (6): 409. doi:10.6028/jres.049.044.
  2. Straeter, T. A. (1971). "On the Extension of the Davidon–Broyden Class of Rank One, Quasi-Newton Minimization Methods to an Infinite Dimensional Hilbert Space with Applications to Optimal Control Problems". NASA Technical Reports Server. NASA. hdl:2060/19710026200.
  3. Speiser, Ambros (2004). "Konrad Zuse und die ERMETH: Ein weltweiter Architektur-Vergleich" [Konrad Zuse and the ERMETH: A worldwide comparison of architectures]. In Hellige, Hans Dieter (ed.). Geschichten der Informatik. Visionen, Paradigmen, Leitmotive (in Deutsch). Berlin: Springer. p. 185. ISBN 3-540-00217-0.
  4. 4.0 4.1 4.2 4.3 Polyak, Boris (1987). Introduction to Optimization (in English).
  5. 5.0 5.1 5.2 Greenbaum, Anne (1997). Iterative Methods for Solving Linear Systems (in English). doi:10.1137/1.9781611970937. ISBN 978-0898713961.
  6. Shewchuk, Jonathan R (1994). An Introduction to the Conjugate Gradient Method Without the Agonizing Pain (PDF).
  7. Saad, Yousef (2003). Iterative methods for sparse linear systems (2nd ed.). Philadelphia, Pa.: Society for Industrial and Applied Mathematics. pp. 195. ISBN 978-0-89871-534-7.
  8. Hackbusch, W. (2016-06-21). Iterative solution of large sparse systems of equations (2nd ed.). Switzerland: Springer. ISBN 9783319284835. OCLC 952572240.
  9. Barrett, Richard; Berry, Michael; Chan, Tony F.; Demmel, James; Donato, June; Dongarra, Jack; Eijkhout, Victor; Pozo, Roldan; Romine, Charles; van der Vorst, Henk. Templates for the Solution of Linear Systems: Building Blocks for Iterative Methods (PDF) (in English) (2nd ed.). Philadelphia, PA: SIAM. p. 13. Retrieved 2020-03-31.
  10. Golub, Gene H.; Van Loan, Charles F. (2013). Matrix Computations (4th ed.). Johns Hopkins University Press. sec. 11.5.2. ISBN 978-1-4214-0794-4.
  11. Concus, P.; Golub, G. H.; Meurant, G. (1985). "Block Preconditioning for the Conjugate Gradient Method". SIAM Journal on Scientific and Statistical Computing. 6 (1): 220–252. doi:10.1137/0906018.
  12. Golub, Gene H.; Ye, Qiang (1999). "Inexact Preconditioned Conjugate Gradient Method with Inner-Outer Iteration". SIAM Journal on Scientific Computing. 21 (4): 1305. CiteSeerX 10.1.1.56.1755. doi:10.1137/S1064827597323415.
  13. Notay, Yvan (2000). "Flexible Conjugate Gradients". SIAM Journal on Scientific Computing. 22 (4): 1444–1460. CiteSeerX 10.1.1.35.7473. doi:10.1137/S1064827599362314.
  14. Bouwmeester, Henricus; Dougherty, Andrew; Knyazev, Andrew V. (2015). "Nonsymmetric Preconditioning for Conjugate Gradient and Steepest Descent Methods 1". Procedia Computer Science. 51: 276–285. doi:10.1016/j.procs.2015.05.241. S2CID 51978658.
  15. Knyazev, Andrew V.; Lashuk, Ilya (2008). "Steepest Descent and Conjugate Gradient Methods with Variable Preconditioning". SIAM Journal on Matrix Analysis and Applications. 29 (4): 1267. arXiv:math/0605767. doi:10.1137/060675290. S2CID 17614913.
  16. 16.0 16.1 Ross, I. M., "An Optimal Control Theory for Accelerated Optimization," arXiv:1902.09004, 2019.


अग्रिम पठन


बाहरी संबंध