हैमिल्टनियन (नियंत्रण सिद्धांत): Difference between revisions

From Vigyanwiki
(Created page with "हैमिल्टनियन एक फ़ंक्शन (गणित) है जिसका उपयोग गतिशील प्रणाली के इ...")
 
No edit summary
Line 1: Line 1:
हैमिल्टनियन एक फ़ंक्शन (गणित) है जिसका उपयोग [[गतिशील प्रणाली]] के [[इष्टतम नियंत्रण]] की समस्या को हल करने के लिए किया जाता है। इसे उस समस्या के [[लैग्रेंज गुणक]] के तात्कालिक वृद्धि के रूप में समझा जा सकता है जिसे एक निश्चित समय अवधि में अनुकूलित किया जाना है।<ref>{{cite book |first1=Brian S. |last1=Ferguson |first2=G. C. |last2=Lim |title=गतिशील आर्थिक समस्याओं का परिचय|location=Manchester |publisher=Manchester University Press |year=1998 |isbn=0-7190-4996-2 |pages=166–167 }}</ref> हेमिल्टनियन यांत्रिकी से प्रेरित, लेकिन उससे अलग, इष्टतम नियंत्रण सिद्धांत के हैमिल्टनियन को [[लेव पोंट्रीगिन]] ने अपने पोंट्रीगिन के न्यूनतम सिद्धांत के हिस्से के रूप में विकसित किया था।<ref>{{cite book |first=Avinash K. |last=Dixit |title=आर्थिक सिद्धांत में अनुकूलन|location=New York |publisher=Oxford University Press |year=1990 |isbn=978-0-19-877210-1 |pages=145–161 |url=https://books.google.com/books?id=dHrsHz0VocUC&pg=PA145 }}</ref> पोंट्रीगिन ने साबित किया कि इष्टतम नियंत्रण समस्या को हल करने के लिए एक आवश्यक शर्त यह है कि हैमिल्टन को अनुकूलित करने के लिए नियंत्रण को चुना जाना चाहिए।<ref>{{cite book |first=Donald E. |last=Kirk |title=Optimal Control Theory : An Introduction |location=Englewood Cliffs |publisher=Prentice Hall |year=1970 |isbn=0-13-638098-0 |page=232 }}</ref>
 
 
हैमिल्टनियन एक फलन (गणित) है जिसका उपयोग [[गतिशील प्रणाली]] के [[इष्टतम नियंत्रण]] की समस्या को हल करने के लिए किया जाता है। इसे उस समस्या के [[लैग्रेंज गुणक]] के तात्कालिक वृद्धि के रूप में समझा जा सकता है जिसे एक निश्चित समय अवधि में अनुकूलित किया जाना है।<ref>{{cite book |first1=Brian S. |last1=Ferguson |first2=G. C. |last2=Lim |title=गतिशील आर्थिक समस्याओं का परिचय|location=Manchester |publisher=Manchester University Press |year=1998 |isbn=0-7190-4996-2 |pages=166–167 }}</ref> हेमिल्टनियन यांत्रिकी से प्रेरित, लेकिन उससे अलग, इष्टतम नियंत्रण सिद्धांत के हैमिल्टनियन को [[लेव पोंट्रीगिन]] ने अपने पोंट्रीगिन के न्यूनतम सिद्धांत के भागों के रूप में विकसित किया था।<ref>{{cite book |first=Avinash K. |last=Dixit |title=आर्थिक सिद्धांत में अनुकूलन|location=New York |publisher=Oxford University Press |year=1990 |isbn=978-0-19-877210-1 |pages=145–161 |url=https://books.google.com/books?id=dHrsHz0VocUC&pg=PA145 }}</ref> पोंट्रीगिन ने सिद्ध किया कि इष्टतम नियंत्रण समस्या को हल करने के लिए एक आवश्यक शर्त यह है कि हैमिल्टन को अनुकूलित करने के लिए नियंत्रण को चुना जाना चाहिए।<ref>{{cite book |first=Donald E. |last=Kirk |title=Optimal Control Theory : An Introduction |location=Englewood Cliffs |publisher=Prentice Hall |year=1970 |isbn=0-13-638098-0 |page=232 }}</ref>
 




Line 5: Line 8:
की एक गतिशील प्रणाली पर विचार करें <math>n</math> प्रथम-क्रम [[अंतर समीकरण]]
की एक गतिशील प्रणाली पर विचार करें <math>n</math> प्रथम-क्रम [[अंतर समीकरण]]
:<math>\dot{\mathbf{x}}(t) = \mathbf{f}(\mathbf{x}(t),\mathbf{u}(t),t)</math>
:<math>\dot{\mathbf{x}}(t) = \mathbf{f}(\mathbf{x}(t),\mathbf{u}(t),t)</math>
कहाँ <math>\mathbf{x}(t) = \left[ x_{1}(t), x_{2}(t), \ldots, x_{n}(t) \right]^{\mathsf{T}}</math> राज्य चर के एक वेक्टर को दर्शाता है, और <math>\mathbf{u}(t) = \left[ u_{1}(t), u_{2}(t), \ldots, u_{r}(t) \right]^{\mathsf{T}}</math> नियंत्रण चर का एक वेक्टर। एक बार प्रारंभिक शर्तें <math>\mathbf{x}(t_{0}) = \mathbf{x}_{0}</math> और नियंत्रित करता है <math>\mathbf{u}(t)</math> निर्दिष्ट हैं, अंतर समीकरणों का एक समाधान, जिसे प्रक्षेपवक्र कहा जाता है <math>\mathbf{x}(t; \mathbf{x}_{0}, t_{0})</math>, पाया जा सकता है। इष्टतम नियंत्रण की समस्या चुनना है <math>\mathbf{u}(t)</math> (कुछ सेट से  <math>\mathcal{U} \subseteq \mathbb{R}^{r}</math>) ताकि <math>\mathbf{x}(t)</math> प्रारंभिक समय के बीच एक निश्चित हानि समारोह को अधिकतम या कम करता है <math>t = t_{0}</math> और एक टर्मिनल समय <math>t = t_{1}</math> (कहाँ <math>t_{1}</math> अनंत हो सकता है)। विशेष रूप से, लक्ष्य एक प्रदर्शन सूचकांक का अनुकूलन करना है <math>I(\mathbf{x}(t),\mathbf{u}(t),t)</math> समय के प्रत्येक बिंदु पर,
जहाँ <math>\mathbf{x}(t) = \left[ x_{1}(t), x_{2}(t), \ldots, x_{n}(t) \right]^{\mathsf{T}}</math> स्थिति चर के एक वेक्टर को दर्शाता है, और <math>\mathbf{u}(t) = \left[ u_{1}(t), u_{2}(t), \ldots, u_{r}(t) \right]^{\mathsf{T}}</math> नियंत्रण चर का एक वेक्टर। एक बार प्रारंभिक शर्तें <math>\mathbf{x}(t_{0}) = \mathbf{x}_{0}</math> और नियंत्रित करता है <math>\mathbf{u}(t)</math> निर्दिष्ट हैं, अंतर समीकरणों का एक समाधान, जिसे प्रक्षेपवक्र कहा जाता है <math>\mathbf{x}(t; \mathbf{x}_{0}, t_{0})</math>, पाया जा सकता है। इष्टतम नियंत्रण की समस्या चुनना है <math>\mathbf{u}(t)</math> (कुछ सेट से  <math>\mathcal{U} \subseteq \mathbb{R}^{r}</math>) जिससे <math>\mathbf{x}(t)</math> प्रारंभिक समय के बीच एक निश्चित हानि फलन को अधिकतम या कम करता है <math>t = t_{0}</math> और एक टर्मिनल समय <math>t = t_{1}</math> (जहाँ <math>t_{1}</math> अनंत हो सकता है)। विशेष रूप से, लक्ष्य एक प्रदर्शन सूचकांक का अनुकूलन करना है <math>I(\mathbf{x}(t),\mathbf{u}(t),t)</math> समय के प्रत्येक बिंदु पर,
:<math>\max_{\mathbf{u}(t)} J = \int_{t_{0}}^{t_{1}} I[\mathbf{x}(t),\mathbf{u}(t),t] \, \mathrm{d}t</math>
:<math>\max_{\mathbf{u}(t)} J = \int_{t_{0}}^{t_{1}} I[\mathbf{x}(t),\mathbf{u}(t),t] \, \mathrm{d}t</math>
राज्य चर की गति के उपरोक्त समीकरणों के अधीन। समाधान विधि में एक सहायक कार्य को परिभाषित करना शामिल है जिसे नियंत्रण हैमिल्टन के रूप में जाना जाता है
स्थिति चर की गति के उपरोक्त समीकरणों के अधीन। समाधान विधि में एक सहायक कार्य को परिभाषित करना सम्मिलित है जिसे नियंत्रण हैमिल्टन के रूप में जाना जाता है
{{Equation box 1
{{Equation box 1
|indent =:
|indent =:
Line 15: Line 18:
|border colour = #50C878
|border colour = #50C878
|background colour = #ECFCF4}}
|background colour = #ECFCF4}}
जो ऑब्जेक्टिव फंक्शन और स्टेट इक्वेशन को स्टैटिक ऑप्टिमाइज़ेशन प्रॉब्लम में लैग्रेंज मल्टीप्लायर की तरह जोड़ता है, केवल यह कि मल्टीप्लायर <math>\mathbf{\lambda}(t)</math>, कॉस्टेट वेरिएबल्स के रूप में संदर्भित, स्थिरांक के बजाय समय के कार्य हैं।
जो ऑब्जेक्टिव फलन और स्टेट समीकरण को स्टैटिक ऑप्टिमाइज़ेशन प्रॉब्लम में लैग्रेंज मल्टीप्लायर की तरह जोड़ता है, केवल यह कि मल्टीप्लायर <math>\mathbf{\lambda}(t)</math>, कॉस्टेट वेरिएबल्स के रूप में संदर्भित, स्थिरांक के अतिरिक्त समय के कार्य हैं।


लक्ष्य एक इष्टतम नियंत्रण नीति कार्य खोजना है <math>\mathbf{u}^\ast(t)</math> और, इसके साथ, राज्य चर का एक इष्टतम प्रक्षेपवक्र <math>\mathbf{x}^\ast(t)</math>, जो पोंट्रीगिन के अधिकतम सिद्धांत के अनुसार वे तर्क हैं जो हैमिल्टनियन को अधिकतम करते हैं,
लक्ष्य एक इष्टतम नियंत्रण नीति कार्य खोजना है <math>\mathbf{u}^\ast(t)</math> और, इसके साथ, स्थिति चर का एक इष्टतम प्रक्षेपवक्र <math>\mathbf{x}^\ast(t)</math>, जो पोंट्रीगिन के अधिकतम सिद्धांत के अनुसार वे तर्क हैं जो हैमिल्टनियन को अधिकतम करते हैं,
:<math>H(\mathbf{x}^\ast(t),\mathbf{u}^\ast(t),\mathbf{\lambda}(t),t) \geq H(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t),t)</math> सभी के लिए <math>\mathbf{u}(t) \in \mathcal{U}</math>
:<math>H(\mathbf{x}^\ast(t),\mathbf{u}^\ast(t),\mathbf{\lambda}(t),t) \geq H(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t),t)</math> सभी के लिए <math>\mathbf{u}(t) \in \mathcal{U}</math>
अधिकतम के लिए प्रथम-क्रम आवश्यक शर्तें किसके द्वारा दी गई हैं
अधिकतम के लिए प्रथम-क्रम आवश्यक शर्तें किसके द्वारा दी गई हैं


:<math>\frac{\partial H(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t),t)}{\partial \mathbf{u}} = 0 </math> जो अधिकतम सिद्धांत है,
:<math>\frac{\partial H(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t),t)}{\partial \mathbf{u}} = 0 </math> जो अधिकतम सिद्धांत है,
:<math>\frac{\partial H(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t),t)}{\partial \mathbf{\lambda}} = \dot{\mathbf{x}}</math> जो राज्य संक्रमण समारोह उत्पन्न करता है <math> \mathbf{f}(\mathbf{x}(t),\mathbf{u}(t),t) = \dot{\mathbf{x}}</math>,
:<math>\frac{\partial H(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t),t)}{\partial \mathbf{\lambda}} = \dot{\mathbf{x}}</math> जो स्थिति संक्रमण फलन उत्पन्न करता है <math> \mathbf{f}(\mathbf{x}(t),\mathbf{u}(t),t) = \dot{\mathbf{x}}</math>,
:<math>\frac{\partial H(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t),t)}{\partial \mathbf{x}} = - \dot{\mathbf{\lambda}}(t)</math> जो उत्पन्न करता है <math>\dot{\mathbf{\lambda}}(t) = - \left[ I_{\mathbf{x}}(\mathbf{x}(t),\mathbf{u}(t),t) + \mathbf{\lambda}^{\mathsf{T}}(t) \mathbf{f}_{\mathbf{x}}(\mathbf{x}(t),\mathbf{u}(t),t) \right]</math>
:<math>\frac{\partial H(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t),t)}{\partial \mathbf{x}} = - \dot{\mathbf{\lambda}}(t)</math> जो उत्पन्न करता है <math>\dot{\mathbf{\lambda}}(t) = - \left[ I_{\mathbf{x}}(\mathbf{x}(t),\mathbf{u}(t),t) + \mathbf{\lambda}^{\mathsf{T}}(t) \mathbf{f}_{\mathbf{x}}(\mathbf{x}(t),\mathbf{u}(t),t) \right]</math>
जिनमें से बाद वाले को कॉस्टेट समीकरण कहा जाता है। साथ में, राज्य और कॉस्टेट समीकरण हैमिल्टनियन गतिशील प्रणाली का वर्णन करते हैं (भौतिक विज्ञान में [[हैमिल्टनियन प्रणाली]] से फिर से समान लेकिन अलग), जिसके समाधान में दो-बिंदु [[सीमा मूल्य समस्या]] शामिल है, यह देखते हुए कि <math>2n</math> समय में दो अलग-अलग बिंदुओं को शामिल करने वाली सीमा की स्थिति, प्रारंभिक समय ( <math>n</math> राज्य चर के लिए अंतर समीकरण), और टर्मिनल समय ( <math>n</math> कॉस्टेट वेरिएबल्स के लिए डिफरेंशियल इक्वेशन; जब तक कोई अंतिम कार्य निर्दिष्ट नहीं किया जाता है, सीमा की स्थिति होती है <math>\mathbf{\lambda}(t_{1}) = 0</math>, या <math>\lim_{t_{1} \to \infty} \mathbf{\lambda}(t_{1}) = 0</math> अनंत समय क्षितिज के लिए)।<ref>{{cite book |first=Giancarlo |last=Gandolfo |title=आर्थिक गतिशीलता|location=Berlin |publisher=Springer |edition=Third |year=1996 |isbn=3-540-60988-1 |pages=375–376 }}</ref>
जिनमें से बाद वाले को कॉस्टेट समीकरण कहा जाता है। साथ में, स्थिति और कॉस्टेट समीकरण हैमिल्टनियन गतिशील प्रणाली का वर्णन करते हैं (भौतिक विज्ञान में [[हैमिल्टनियन प्रणाली]] से फिर से समान लेकिन अलग), जिसके समाधान में दो-बिंदु [[सीमा मूल्य समस्या]] सम्मिलित है, यह देखते हुए कि <math>2n</math> समय में दो अलग-अलग बिंदुओं को सम्मिलित करने वाली सीमा की स्थिति, प्रारंभिक समय ( <math>n</math> स्थिति चर के लिए अंतर समीकरण), और टर्मिनल समय ( <math>n</math> कॉस्टेट वेरिएबल्स के लिए डिफरेंशियल समीकरण; जब तक कोई अंतिम कार्य निर्दिष्ट नहीं किया जाता है, सीमा की स्थिति होती है <math>\mathbf{\lambda}(t_{1}) = 0</math>, या <math>\lim_{t_{1} \to \infty} \mathbf{\lambda}(t_{1}) = 0</math> अनंत समय क्षितिज के लिए)।<ref>{{cite book |first=Giancarlo |last=Gandolfo |title=आर्थिक गतिशीलता|location=Berlin |publisher=Springer |edition=Third |year=1996 |isbn=3-540-60988-1 |pages=375–376 }}</ref>
 
अधिकतम के लिए एक पर्याप्त शर्त हैमिल्टनियन की अवतलता है जिसका मूल्यांकन समाधान में किया गया है, अर्थात
अधिकतम के लिए एक पर्याप्त शर्त हैमिल्टनियन की अवतलता है जिसका मूल्यांकन समाधान में किया गया है, अर्थात
:<math>H_{\mathbf{uu}}(\mathbf{x}^\ast(t),\mathbf{u}^\ast(t),\mathbf{\lambda}(t),t) \leq 0</math>
:<math>H_{\mathbf{uu}}(\mathbf{x}^\ast(t),\mathbf{u}^\ast(t),\mathbf{\lambda}(t),t) \leq 0</math>
कहाँ <math>\mathbf{u}^\ast(t)</math> इष्टतम नियंत्रण है, और <math>\mathbf{x}^\ast(t)</math> राज्य चर के लिए इष्टतम प्रक्षेपवक्र का परिणाम है।<ref>{{cite book |first1=Atle |last1=Seierstad |first2=Knut |last2=Sydsæter |author-link2=Knut Sydsæter |title=आर्थिक अनुप्रयोगों के साथ इष्टतम नियंत्रण सिद्धांत|location=Amsterdam |publisher=North-Holland |year=1987 |pages=107–110 |isbn=0-444-87923-4 }}</ref> वैकल्पिक रूप से, Olvi L. Mangasarian के परिणामस्वरूप, कार्य करने पर आवश्यक शर्तें पर्याप्त हैं <math>I(\mathbf{x}(t),\mathbf{u}(t),t)</math> और <math>\mathbf{f}(\mathbf{x}(t),\mathbf{u}(t),t)</math> दोनों अवतल हैं <math>\mathbf{x}(t)</math> और <math>\mathbf{u}(t)</math>.<ref>{{cite journal |journal=SIAM Journal on Control |volume=4 |year=1966 |issue=1 |pages=139–152 |title=नॉनलाइनियर सिस्टम्स के इष्टतम नियंत्रण के लिए पर्याप्त शर्तें|first=O. L. |last=Mangasarian |doi=10.1137/0304013 }}</ref>
जहाँ <math>\mathbf{u}^\ast(t)</math> इष्टतम नियंत्रण है, और <math>\mathbf{x}^\ast(t)</math> स्थिति चर के लिए इष्टतम प्रक्षेपवक्र का परिणाम है।<ref>{{cite book |first1=Atle |last1=Seierstad |first2=Knut |last2=Sydsæter |author-link2=Knut Sydsæter |title=आर्थिक अनुप्रयोगों के साथ इष्टतम नियंत्रण सिद्धांत|location=Amsterdam |publisher=North-Holland |year=1987 |pages=107–110 |isbn=0-444-87923-4 }}</ref> वैकल्पिक रूप से,ओल्वी एल मंगसेरियन के परिणामस्वरूप, कार्य करने पर आवश्यक शर्तें पर्याप्त हैं <math>I(\mathbf{x}(t),\mathbf{u}(t),t)</math> और <math>\mathbf{f}(\mathbf{x}(t),\mathbf{u}(t),t)</math> दोनों अवतल हैं <math>\mathbf{x}(t)</math> और <math>\mathbf{u}(t)</math>.<ref>{{cite journal |journal=SIAM Journal on Control |volume=4 |year=1966 |issue=1 |pages=139–152 |title=नॉनलाइनियर सिस्टम्स के इष्टतम नियंत्रण के लिए पर्याप्त शर्तें|first=O. L. |last=Mangasarian |doi=10.1137/0304013 }}</ref>




=== Lagrangian === से व्युत्पत्ति
=== === लाग्रंगियन === से व्युत्पत्ति ===
एक [[विवश अनुकूलन]] समस्या जैसा कि ऊपर कहा गया है, विशेष रूप से एक Lagrangian अभिव्यक्ति का सुझाव देती है
एक [[विवश अनुकूलन]] समस्या जैसा कि ऊपर कहा गया है, विशेष रूप से एक लाग्रंगियन अभिव्यक्ति का सुझाव देती है
:<math>L = \int_{t_{0}}^{t_{1}} I(\mathbf{x}(t),\mathbf{u}(t),t) + \mathbf{\lambda}^{\mathsf{T}}(t) \left[ \mathbf{f}(\mathbf{x}(t),\mathbf{u}(t),t) - \dot{\mathbf{x}}(t) \right] \, \mathrm{d}t</math>
:<math>L = \int_{t_{0}}^{t_{1}} I(\mathbf{x}(t),\mathbf{u}(t),t) + \mathbf{\lambda}^{\mathsf{T}}(t) \left[ \mathbf{f}(\mathbf{x}(t),\mathbf{u}(t),t) - \dot{\mathbf{x}}(t) \right] \, \mathrm{d}t</math>
कहाँ <math>\mathbf{\lambda}(t)</math> एक स्थिर अनुकूलन समस्या में लैग्रेंज गुणक की तुलना करता है लेकिन अब, जैसा कि ऊपर उल्लेख किया गया है, समय का एक कार्य है। मिटाने के लिए <math>\dot{\mathbf{x}}(t)</math>, दाईं ओर के अंतिम शब्द को [[भागों द्वारा एकीकरण]] का उपयोग करके फिर से लिखा जा सकता है, जैसे कि
जहाँ <math>\mathbf{\lambda}(t)</math> एक स्थिर अनुकूलन समस्या में लैग्रेंज गुणक की तुलना करता है लेकिन अब, जैसा कि ऊपर उल्लेख किया गया है, समय का एक कार्य है। मिटाने के लिए <math>\dot{\mathbf{x}}(t)</math>, दाईं ओर के अंतिम शब्द को [[भागों द्वारा एकीकरण]] का उपयोग करके फिर से लिखा जा सकता है, जैसे कि
:<math>- \int_{t_{0}}^{t_{1}} \mathbf{\lambda}^{\mathsf{T}}(t) \dot{\mathbf{x}}(t) \, \mathrm{d}t = -\mathbf{\lambda}^{\mathsf{T}}(t_{1}) \mathbf{x}(t_{1}) + \mathbf{\lambda}^{\mathsf{T}}(t_{0}) \mathbf{x}(t_{0}) + \int_{t_{0}}^{t_{1}} \dot{\mathbf{\lambda}}^{\mathsf{T}}(t) \mathbf{x}(t) \, \mathrm{d}t </math>
:<math>- \int_{t_{0}}^{t_{1}} \mathbf{\lambda}^{\mathsf{T}}(t) \dot{\mathbf{x}}(t) \, \mathrm{d}t = -\mathbf{\lambda}^{\mathsf{T}}(t_{1}) \mathbf{x}(t_{1}) + \mathbf{\lambda}^{\mathsf{T}}(t_{0}) \mathbf{x}(t_{0}) + \int_{t_{0}}^{t_{1}} \dot{\mathbf{\lambda}}^{\mathsf{T}}(t) \mathbf{x}(t) \, \mathrm{d}t </math>
जिसे देने के लिए Lagrangian अभिव्यक्ति में वापस प्रतिस्थापित किया जा सकता है
जिसे देने के लिए लाग्रंगियन अभिव्यक्ति में वापस प्रतिस्थापित किया जा सकता है
:<math>L = \int_{t_{0}}^{t_{1}} \left[ I(\mathbf{x}(t),\mathbf{u}(t),t) + \mathbf{\lambda}^{\mathsf{T}}(t) \mathbf{f}(\mathbf{x}(t),\mathbf{u}(t),t) + \dot{\mathbf{\lambda}}^{\mathsf{T}}(t) \mathbf{x}(t) \right] \, \mathrm{d}t - \mathbf{\lambda}^{\mathsf{T}}(t_{1}) \mathbf{x}(t_{1}) + \mathbf{\lambda}^{\mathsf{T}}(t_{0}) \mathbf{x}(t_{0}) </math>
:<math>L = \int_{t_{0}}^{t_{1}} \left[ I(\mathbf{x}(t),\mathbf{u}(t),t) + \mathbf{\lambda}^{\mathsf{T}}(t) \mathbf{f}(\mathbf{x}(t),\mathbf{u}(t),t) + \dot{\mathbf{\lambda}}^{\mathsf{T}}(t) \mathbf{x}(t) \right] \, \mathrm{d}t - \mathbf{\lambda}^{\mathsf{T}}(t_{1}) \mathbf{x}(t_{1}) + \mathbf{\lambda}^{\mathsf{T}}(t_{0}) \mathbf{x}(t_{0}) </math>
एक इष्टतम के लिए प्रथम-क्रम की स्थिति प्राप्त करने के लिए, मान लें कि समाधान मिल गया है और Lagrangian अधिकतम हो गया है। फिर किसी तरह की गड़बड़ी <math>\mathbf{x}(t)</math> या <math>\mathbf{u}(t)</math> Lagrangian के मूल्य में गिरावट का कारण होना चाहिए। विशेष रूप से, का [[कुल व्युत्पन्न]] <math>L</math> का अनुसरण करता है
एक इष्टतम के लिए प्रथम-क्रम की स्थिति प्राप्त करने के लिए, मान लें कि समाधान मिल गया है और लाग्रंगियन अधिकतम हो गया है। फिर किसी तरह की गड़बड़ी <math>\mathbf{x}(t)</math> या <math>\mathbf{u}(t)</math> लाग्रंगियन के मूल्य में गिरावट का कारण होना चाहिए। विशेष रूप से, का [[कुल व्युत्पन्न]] <math>L</math> का अनुसरण करता है
:<math>\mathrm{d}L = \int_{t_{0}}^{t_{1}} \left[ \left( I_{\mathbf{u}}(\mathbf{x}(t),\mathbf{u}(t),t) + \mathbf{\lambda}^{\mathsf{T}}(t) \mathbf{f}_{\mathbf{u}}(\mathbf{x}(t),\mathbf{u}(t),t) \right) \mathrm{d}\mathbf{u}(t) + \left( I_{\mathbf{x}}(\mathbf{x}(t),\mathbf{u}(t),t) + \mathbf{\lambda}^{\mathsf{T}}(t) \mathbf{f}_{\mathbf{x}}(\mathbf{x}(t),\mathbf{u}(t),t) + \dot{\mathbf{\lambda}}(t) \right) \mathrm{d}\mathbf{x}(t) \right] \mathrm{d}t - \mathbf{\lambda}^{\mathsf{T}}(t_{1}) \mathrm{d}\mathbf{x}(t_{1}) + \mathbf{\lambda}^{\mathsf{T}}(t_{0}) \mathrm{d}\mathbf{x}(t_{0}) \leq 0</math>
:<math>\mathrm{d}L = \int_{t_{0}}^{t_{1}} \left[ \left( I_{\mathbf{u}}(\mathbf{x}(t),\mathbf{u}(t),t) + \mathbf{\lambda}^{\mathsf{T}}(t) \mathbf{f}_{\mathbf{u}}(\mathbf{x}(t),\mathbf{u}(t),t) \right) \mathrm{d}\mathbf{u}(t) + \left( I_{\mathbf{x}}(\mathbf{x}(t),\mathbf{u}(t),t) + \mathbf{\lambda}^{\mathsf{T}}(t) \mathbf{f}_{\mathbf{x}}(\mathbf{x}(t),\mathbf{u}(t),t) + \dot{\mathbf{\lambda}}(t) \right) \mathrm{d}\mathbf{x}(t) \right] \mathrm{d}t - \mathbf{\lambda}^{\mathsf{T}}(t_{1}) \mathrm{d}\mathbf{x}(t_{1}) + \mathbf{\lambda}^{\mathsf{T}}(t_{0}) \mathrm{d}\mathbf{x}(t_{0}) \leq 0</math>
इस अभिव्यक्ति के लिए शून्य के बराबर होने के लिए निम्नलिखित इष्टतमता शर्तों की आवश्यकता होती है:
इस अभिव्यक्ति के लिए शून्य के बराबर होने के लिए निम्नलिखित इष्टतमता शर्तों की आवश्यकता होती है:
Line 44: Line 48:
I_{\mathbf{x}}(\mathbf{x}(t),\mathbf{u}(t),t) + \mathbf{\lambda}^{\mathsf{T}}(t) \mathbf{f}_{\mathbf{x}}(\mathbf{x}(t),\mathbf{u}(t),t) + \dot{\mathbf{\lambda}}(t) &= 0
I_{\mathbf{x}}(\mathbf{x}(t),\mathbf{u}(t),t) + \mathbf{\lambda}^{\mathsf{T}}(t) \mathbf{f}_{\mathbf{x}}(\mathbf{x}(t),\mathbf{u}(t),t) + \dot{\mathbf{\lambda}}(t) &= 0
\end{align}</math>
\end{align}</math>
यदि दोनों प्रारंभिक मान <math>\mathbf{x}(t_{0})</math> और टर्मिनल मान <math>\mathbf{x}(t_{1})</math> निश्चित हैं, अर्थात् <math>\mathrm{d}\mathbf{x}(t_{0}) = \mathrm{d}\mathbf{x}(t_{1}) = 0</math>, कोई शर्त नहीं है <math>\mathbf{\lambda}(t_{0})</math> और <math>\mathbf{\lambda}(t_{1})</math> जरूरत है। यदि टर्मिनल मूल्य मुक्त है, जैसा कि अक्सर होता है, अतिरिक्त शर्त <math>\mathbf{\lambda}(t_{1}) = 0</math> श्रेष्ठता के लिए आवश्यक है। उत्तरार्द्ध को निश्चित क्षितिज समस्या के लिए एक ट्रांसवर्सलिटी स्थिति कहा जाता है।<ref>{{cite book |first1=Daniel |last1=Léonard |first2=Ngo Van |last2=Long |title=इष्टतम नियंत्रण सिद्धांत और अर्थशास्त्र में स्थैतिक अनुकूलन|location=New York |publisher=Cambridge University Press |year=1992 |chapter=Endpoint Constraints and Transversality Conditions |isbn=0-521-33158-7 |page=222 [Theorem 7.1.1] |chapter-url=https://books.google.com/books?id=gSHxK5Cq4BgC&pg=PA222 }}</ref>
यदि दोनों प्रारंभिक मान <math>\mathbf{x}(t_{0})</math> और टर्मिनल मान <math>\mathbf{x}(t_{1})</math> निश्चित हैं, अर्थात् <math>\mathrm{d}\mathbf{x}(t_{0}) = \mathrm{d}\mathbf{x}(t_{1}) = 0</math>, कोई शर्त नहीं है <math>\mathbf{\lambda}(t_{0})</math> और <math>\mathbf{\lambda}(t_{1})</math> आवश्यक है। यदि टर्मिनल मूल्य मुक्त है, जैसा कि अधिकांशतः होता है, अतिरिक्त शर्त <math>\mathbf{\lambda}(t_{1}) = 0</math> श्रेष्ठता के लिए आवश्यक है। उत्तरार्द्ध को निश्चित क्षितिज समस्या के लिए एक ट्रांसवर्सलिटी स्थिति कहा जाता है।<ref>{{cite book |first1=Daniel |last1=Léonard |first2=Ngo Van |last2=Long |title=इष्टतम नियंत्रण सिद्धांत और अर्थशास्त्र में स्थैतिक अनुकूलन|location=New York |publisher=Cambridge University Press |year=1992 |chapter=Endpoint Constraints and Transversality Conditions |isbn=0-521-33158-7 |page=222 [Theorem 7.1.1] |chapter-url=https://books.google.com/books?id=gSHxK5Cq4BgC&pg=PA222 }}</ref>
 
यह देखा जा सकता है कि आवश्यक शर्तें हैमिल्टनियन के लिए ऊपर बताई गई शर्तों के समान हैं। इस प्रकार हैमिल्टनियन को पहले क्रम की आवश्यक शर्तों को उत्पन्न करने के लिए एक उपकरण के रूप में समझा जा सकता है।<ref>{{cite book |first1=Morton I. |last1=Kamien |first2=Nancy L. |last2=Schwartz |title=Dynamic Optimization : The Calculus of Variances and Optimal Control in Economics and Management |location=Amsterdam |publisher=North-Holland |edition=Second |year=1991 |isbn=0-444-01609-0 |pages=126–127 }}</ref>
यह देखा जा सकता है कि आवश्यक शर्तें हैमिल्टनियन के लिए ऊपर बताई गई शर्तों के समान हैं। इस प्रकार हैमिल्टनियन को पहले क्रम की आवश्यक शर्तों को उत्पन्न करने के लिए एक उपकरण के रूप में समझा जा सकता है।<ref>{{cite book |first1=Morton I. |last1=Kamien |first2=Nancy L. |last2=Schwartz |title=Dynamic Optimization : The Calculus of Variances and Optimal Control in Economics and Management |location=Amsterdam |publisher=North-Holland |edition=Second |year=1991 |isbn=0-444-01609-0 |pages=126–127 }}</ref>




Line 60: Line 66:
\lambda_{t} =\frac{\partial H}{\partial x_{t}}
\lambda_{t} =\frac{\partial H}{\partial x_{t}}
</math>
</math>
(ध्यान दें कि समय पर असतत समय हैमिल्टनियन <math>t</math> समय पर कॉस्टेट वैरिएबल शामिल है <math>t+1.</math><ref>{{cite web |first=U. |last=Jönsson |title=पीएमपी का असतत संस्करण|year=2005 |pages=25 |url=https://www.math.kth.se/optsyst/grundutbildning/5B1872/Discrete.pdf |archive-date=January 22, 2023 |archive-url=https://web.archive.org/web/20230122192015/https://www.math.kth.se/optsyst/grundutbildning/5B1872/Discrete.pdf }}</ref> यह छोटा विवरण आवश्यक है ताकि जब हम इसके संबंध में अंतर करें <math>x</math> हमें एक शब्द शामिल है <math>\lambda(t+1)</math> कॉस्टेट समीकरणों के दाहिने हाथ की ओर। यहां गलत सम्मेलन का उपयोग करने से गलत परिणाम हो सकते हैं, यानी एक कॉस्टेट समीकरण जो पीछे की ओर अंतर समीकरण नहीं है)।
(ध्यान दें कि समय पर असतत समय हैमिल्टनियन <math>t</math> समय पर कॉस्टेट वैरिएबल सम्मिलित है <math>t+1.</math><ref>{{cite web |first=U. |last=Jönsson |title=पीएमपी का असतत संस्करण|year=2005 |pages=25 |url=https://www.math.kth.se/optsyst/grundutbildning/5B1872/Discrete.pdf |archive-date=January 22, 2023 |archive-url=https://web.archive.org/web/20230122192015/https://www.math.kth.se/optsyst/grundutbildning/5B1872/Discrete.pdf }}</ref> यह छोटा विवरण आवश्यक है जिससे जब हम इसके संबंध में अंतर करें <math>x</math> हमें एक शब्द सम्मिलित है <math>\lambda(t+1)</math> कॉस्टेट समीकरणों के दाहिने हाथ की ओर। यहां गलत सम्मेलन का उपयोग करने से गलत परिणाम हो सकते हैं, यानी एक कॉस्टेट समीकरण जो पीछे की ओर अंतर समीकरण नहीं है)।


== हैमिल्टनियन का समय के साथ व्यवहार ==
== हैमिल्टनियन का समय के साथ व्यवहार ==
Line 67: Line 73:
या यदि टर्मिनल समय निःशुल्क है, तो:
या यदि टर्मिनल समय निःशुल्क है, तो:
:<math>H(x^*(t),u^*(t),\lambda^*(t)) = 0.\,</math>
:<math>H(x^*(t),u^*(t),\lambda^*(t)) = 0.\,</math>
इसके अलावा, यदि टर्मिनल समय अनंत तक जाता है, तो हैमिल्टनियन पर एक [[पारलौकिक स्थिति]] स्थिति लागू होती है।<ref>{{cite journal |first=Philippe |last=Michel |author-link=Philippe Michel (economist) |title=अनंत क्षितिज इष्टतम समस्याओं में ट्रांसवर्सलिटी स्थिति पर|journal=[[Econometrica]] |volume=50 |issue=4 |year=1982 |pages=975–985 |doi=10.2307/1912772 |jstor=1912772 |s2cid=16503488 |url=https://semanticscholar.org/paper/be4043d68140508a2b94ca6c1a3250cacf6a0c2c }}</ref>
इसके अतिरिक्त, यदि टर्मिनल समय अनंत तक जाता है, तो हैमिल्टनियन पर एक [[पारलौकिक स्थिति]] स्थिति प्रयुक्त होती है।<ref>{{cite journal |first=Philippe |last=Michel |author-link=Philippe Michel (economist) |title=अनंत क्षितिज इष्टतम समस्याओं में ट्रांसवर्सलिटी स्थिति पर|journal=[[Econometrica]] |volume=50 |issue=4 |year=1982 |pages=975–985 |doi=10.2307/1912772 |jstor=1912772 |s2cid=16503488 |url=https://semanticscholar.org/paper/be4043d68140508a2b94ca6c1a3250cacf6a0c2c }}</ref>
:<math>\lim_{t \to \infty} H(t) = 0</math>
:<math>\lim_{t \to \infty} H(t) = 0</math>


Line 76: Line 82:


:<math>\mathcal{H} = \mathcal{H}(p,q,t) = \langle p,\dot{q} \rangle -L(q,\dot{q},t)</math>
:<math>\mathcal{H} = \mathcal{H}(p,q,t) = \langle p,\dot{q} \rangle -L(q,\dot{q},t)</math>
कहाँ <math>L</math> [[Lagrangian यांत्रिकी]] है, जिसका चरमोत्कर्ष गतिकी को निर्धारित करता है (ऊपर परिभाषित Lagrangian नहीं), <math>q</math> राज्य चर है और <math>\dot{q}</math> इसका काल व्युत्पन्न है।
जहाँ <math>L</math> [[Lagrangian यांत्रिकी|लाग्रंगियन यांत्रिकी]] है, जिसका चरमोत्कर्ष गतिकी को निर्धारित करता है (ऊपर परिभाषित लाग्रंगियन नहीं), <math>q</math> स्थिति चर है और <math>\dot{q}</math> इसका काल व्युत्पन्न है।


<math>p</math> तथाकथित संयुग्म गति है, द्वारा परिभाषित
<math>p</math> तथाकथित संयुग्म गति है, द्वारा परिभाषित
Line 85: Line 91:
:<math>\frac{ d}{ dt}p(t) = -\frac{\partial}{\partial q}\mathcal{H}</math>
:<math>\frac{ d}{ dt}p(t) = -\frac{\partial}{\partial q}\mathcal{H}</math>
:<math>\frac{ d}{ dt}q(t) =~~\frac{\partial}{\partial p}\mathcal{H}</math>
:<math>\frac{ d}{ dt}q(t) =~~\frac{\partial}{\partial p}\mathcal{H}</math>
नियंत्रण सिद्धांत का हैमिल्टन एक प्रणाली की गतिशीलता का वर्णन नहीं करता है, लेकिन एक नियंत्रण चर के संबंध में कुछ स्केलर फ़ंक्शन (लैग्रैंगियन) को चरम पर पहुंचाने की स्थिति <math>u</math>. जैसा कि सामान्य रूप से परिभाषित किया गया है, यह 4 चरों का एक कार्य है
नियंत्रण सिद्धांत का हैमिल्टन एक प्रणाली की गतिशीलता का वर्णन नहीं करता है, लेकिन एक नियंत्रण चर के संबंध में कुछ स्केलर फलन (लैग्रैंगियन) को चरम पर पहुंचाने की स्थिति <math>u</math>. जैसा कि सामान्य रूप से परिभाषित किया गया है, यह 4 चरों का एक कार्य है


:<math>H(q,u,p,t)= \langle p,\dot{q} \rangle -L(q,u,t)</math>
:<math>H(q,u,p,t)= \langle p,\dot{q} \rangle -L(q,u,t)</math>
कहाँ <math>q</math> राज्य चर है और <math>u</math> नियंत्रण चर है जिसके संबंध में हम चरम सीमा पर हैं।
जहाँ <math>q</math> स्थिति चर है और <math>u</math> नियंत्रण चर है जिसके संबंध में हम चरम सीमा पर हैं।


अधिकतम के लिए संबद्ध शर्तें हैं
अधिकतम के लिए संबद्ध शर्तें हैं
Line 95: Line 101:
:<math>\frac{dq}{dt} = ~~\frac{\partial H}{\partial p}</math>
:<math>\frac{dq}{dt} = ~~\frac{\partial H}{\partial p}</math>
:<math>\frac{\partial H}{\partial u} = 0</math>
:<math>\frac{\partial H}{\partial u} = 0</math>
यह परिभाषा सस्मान और विलेम्स के लेख द्वारा दी गई परिभाषा से सहमत है।<ref>{{cite journal |url=http://yima.csl.illinois.edu/psfile/ECE553/sussmann-willems.pdf |last1=Sussmann |last2= Willems |title=300 Years of Optimal Control |journal=IEEE Control Systems Magazine |date=June 1997 |doi=10.1109/37.588098 |archive-date=July 30, 2010 |archive-url=https://web.archive.org/web/20100730033612/http://yima.csl.illinois.edu/psfile/ECE553/sussmann-willems.pdf }}</ref> (पृष्ठ 39 देखें, समीकरण 14)। सुस्मान और विलेम्स दिखाते हैं कि हैमिल्टनियन नियंत्रण को गतिशीलता में कैसे इस्तेमाल किया जा सकता है उदा। [[ब्राचिस्टोक्रोन समस्या]] के लिए, लेकिन इस दृष्टिकोण पर कैराथोडोरी के पूर्व कार्य का उल्लेख न करें।<ref>See {{cite journal |first1=H. J. |last1=Pesch |first2=R. |last2=Bulirsch |title=The maximum principle, Bellman's equation, and Carathéodory's work |journal=[[Journal of Optimization Theory and Applications]] |volume=80 |year=1994 |issue=2 |pages=199–225 |doi=10.1007/BF02192933 |s2cid=121749702 }}</ref>
यह परिभाषा सस्मान और विलेम्स के लेख द्वारा दी गई परिभाषा से सहमत है।<ref>{{cite journal |url=http://yima.csl.illinois.edu/psfile/ECE553/sussmann-willems.pdf |last1=Sussmann |last2= Willems |title=300 Years of Optimal Control |journal=IEEE Control Systems Magazine |date=June 1997 |doi=10.1109/37.588098 |archive-date=July 30, 2010 |archive-url=https://web.archive.org/web/20100730033612/http://yima.csl.illinois.edu/psfile/ECE553/sussmann-willems.pdf }}</ref> (पृष्ठ 39 देखें, समीकरण 14)। सुस्मान और विलेम्स दिखाते हैं कि हैमिल्टनियन नियंत्रण को गतिशीलता में कैसे प्रयोग किया जा सकता है उदा। [[ब्राचिस्टोक्रोन समस्या]] के लिए, लेकिन इस दृष्टिकोण पर कैराथोडोरी के पूर्व कार्य का उल्लेख न करें।<ref>See {{cite journal |first1=H. J. |last1=Pesch |first2=R. |last2=Bulirsch |title=The maximum principle, Bellman's equation, and Carathéodory's work |journal=[[Journal of Optimization Theory and Applications]] |volume=80 |year=1994 |issue=2 |pages=199–225 |doi=10.1007/BF02192933 |s2cid=121749702 }}</ref>




== वर्तमान मूल्य और वर्तमान मूल्य हैमिल्टनियन ==
== वर्तमान मूल्य और वर्तमान मूल्य हैमिल्टनियन ==
[[अर्थशास्त्र]] में, गतिशील अनुकूलन समस्याओं में उद्देश्य कार्य अक्सर केवल [[घातीय छूट]] के माध्यम से सीधे समय पर निर्भर करता है, जैसे कि यह रूप लेता है
[[अर्थशास्त्र]] में, गतिशील अनुकूलन समस्याओं में उद्देश्य कार्य अधिकांशतः केवल [[घातीय छूट]] के माध्यम से सीधे समय पर निर्भर करता है, जैसे कि यह रूप लेता है
:<math>I(\mathbf{x}(t),\mathbf{u}(t),t) = e^{-\rho t} \nu(\mathbf{x}(t),\mathbf{u}(t))</math>
:<math>I(\mathbf{x}(t),\mathbf{u}(t),t) = e^{-\rho t} \nu(\mathbf{x}(t),\mathbf{u}(t))</math>
कहाँ <math>\nu(\mathbf{x}(t),\mathbf{u}(t))</math> तात्क्षणिक उपयोगिता फलन या परमानंद फलन के रूप में जाना जाता है।<ref>{{cite web |title=Econ 4350: Growth and Investment: Lecture Note 7 |publisher=Department of Economics, University of Oslo |first=Kåre |last=Bævre |date=Spring 2005 |url=https://www.uio.no/studier/emner/sv/oekonomi/ECON4350/v05/undervisningsmateriale/lecture_notes/4350_ln7.pdf#page=2 }}</ref> यह हैमिल्टनियन को फिर से परिभाषित करने की अनुमति देता है <math>H(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t),t) = e^{-\rho t} \bar{H}(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t))</math> कहाँ
जहाँ <math>\nu(\mathbf{x}(t),\mathbf{u}(t))</math> तात्क्षणिक उपयोगिता फलन या परमानंद फलन के रूप में जाना जाता है।<ref>{{cite web |title=Econ 4350: Growth and Investment: Lecture Note 7 |publisher=Department of Economics, University of Oslo |first=Kåre |last=Bævre |date=Spring 2005 |url=https://www.uio.no/studier/emner/sv/oekonomi/ECON4350/v05/undervisningsmateriale/lecture_notes/4350_ln7.pdf#page=2 }}</ref> यह हैमिल्टनियन को फिर से परिभाषित करने की अनुमति देता है <math>H(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t),t) = e^{-\rho t} \bar{H}(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t))</math> जहाँ
:<math>\begin{align}
:<math>\begin{align}
\bar{H}(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t)) \equiv& \, e^{\rho t} \left[ I(\mathbf{x}(t),\mathbf{u}(t),t) + \mathbf{\lambda}^{\mathsf{T}}(t) \mathbf{f}(\mathbf{x}(t),\mathbf{u}(t),t) \right] \\
\bar{H}(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t)) \equiv& \, e^{\rho t} \left[ I(\mathbf{x}(t),\mathbf{u}(t),t) + \mathbf{\lambda}^{\mathsf{T}}(t) \mathbf{f}(\mathbf{x}(t),\mathbf{u}(t),t) \right] \\
Line 109: Line 115:
:<math>\frac{\partial \bar{H}(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t))}{\partial \mathbf{u}} = 0</math>,
:<math>\frac{\partial \bar{H}(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t))}{\partial \mathbf{u}} = 0</math>,
:<math>\frac{\partial \bar{H}(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t))}{\partial \mathbf{x}} = - \dot{\mathbf{\mu}}(t) + \rho \mathbf{\mu}(t)</math>
:<math>\frac{\partial \bar{H}(\mathbf{x}(t),\mathbf{u}(t),\mathbf{\lambda}(t))}{\partial \mathbf{x}} = - \dot{\mathbf{\mu}}(t) + \rho \mathbf{\mu}(t)</math>
जो उत्पाद नियम से तुरंत अनुसरण करता है। आर्थिक रूप से, <math>\mathbf{\mu}(t)</math> पूंजीगत वस्तुओं के लिए वर्तमान-मूल्यवान छाया कीमतों का प्रतिनिधित्व करते हैं <math>\mathbf{x}(t)</math>.
जो उत्पाद नियम से तुरंत अनुसरण करता है। आर्थिक रूप से, <math>\mathbf{\mu}(t)</math> पूंजीगत वस्तुओं के लिए वर्तमान-मूल्यवान छाया कीमतों <math>\mathbf{x}(t)</math> का प्रतिनिधित्व करते हैं .


== उदाहरण: रैमसे-कैस-कूपमन्स मॉडल ==
== उदाहरण: रैमसे-कैस-कूपमन्स मॉडल ==
अर्थशास्त्र में, रैमसे-कैस-कूपमन्स मॉडल का उपयोग अर्थव्यवस्था के लिए इष्टतम बचत व्यवहार निर्धारित करने के लिए किया जाता है। उद्देश्य समारोह <math>J(c)</math> सामाजिक कल्याण कार्य है,
अर्थशास्त्र में, रैमसे-कैस-कूपमन्स मॉडल का उपयोग अर्थव्यवस्था के लिए इष्टतम बचत व्यवहार निर्धारित करने के लिए किया जाता है। उद्देश्य फलन <math>J(c)</math> सामाजिक कल्याण कार्य है,
:<math>J(c) = \int^T_0 e^{-\rho t}u(c(t)) dt</math>
:<math>J(c) = \int^T_0 e^{-\rho t}u(c(t)) dt</math>
इष्टतम उपभोग पथ के चुनाव द्वारा अधिकतम किया जाना <math>c(t)</math>. कार्यक्रम <math>u(c(t))</math> उपभोग के [[प्रतिनिधि एजेंट]] [[उपयोगिता]] को इंगित करता है <math>c</math> किसी भी समय पर। कारण <math>e^{-\rho t}</math> [[छूट]] का प्रतिनिधित्व करता है। अधिकतमकरण समस्या पूंजी तीव्रता के लिए निम्नलिखित अंतर समीकरण के अधीन है, जो प्रति प्रभावी कार्यकर्ता पूंजी के समय के विकास का वर्णन करती है:
इष्टतम उपभोग पथ के चुनाव द्वारा अधिकतम किया जाना <math>c(t)</math>. कार्यक्रम <math>u(c(t))</math> उपभोग के [[प्रतिनिधि एजेंट]] [[उपयोगिता]] को इंगित करता है <math>c</math> किसी भी समय पर। कारण <math>e^{-\rho t}</math> [[छूट]] का प्रतिनिधित्व करता है। अधिकतमकरण समस्या पूंजी तीव्रता के लिए निम्नलिखित अंतर समीकरण के अधीन है, जो प्रति प्रभावी कार्यकर्ता पूंजी के समय के विकास का वर्णन करती है:
:<math>\dot{k}=\frac{\partial k}{\partial t} =f(k(t)) - (n + \delta)k(t) - c(t)</math>
:<math>\dot{k}=\frac{\partial k}{\partial t} =f(k(t)) - (n + \delta)k(t) - c(t)</math>
कहाँ <math>c(t)</math> अवधि टी खपत है, <math>k(t)</math> प्रति कर्मचारी अवधि टी पूंजी है (के साथ <math>k(0) = k_{0} > 0</math>), <math>f(k(t))</math> अवधि टी उत्पादन है, <math>n</math> जनसंख्या वृद्धि दर है, <math>\delta</math> पूंजी मूल्यह्रास दर है, एजेंट भविष्य की उपयोगिता दर पर छूट देता है <math>\rho</math>, साथ <math>u'>0</math> और <math>u''<0</math>.
जहाँ <math>c(t)</math> अवधि टी खपत है, <math>k(t)</math> प्रति कर्मचारी अवधि टी पूंजी है (के साथ <math>k(0) = k_{0} > 0</math>), <math>f(k(t))</math> अवधि टी उत्पादन है, <math>n</math> जनसंख्या वृद्धि दर है, <math>\delta</math> पूंजी मूल्यह्रास दर है, एजेंट भविष्य की उपयोगिता दर पर छूट देता है <math>\rho</math>, साथ <math>u'>0</math> और <math>u''<0</math>.


यहाँ, <math>k(t)</math> राज्य चर है जो उपरोक्त समीकरण के अनुसार विकसित होता है, और <math>c(t)</math> नियंत्रण चर है। हैमिल्टनियन बन जाता है
यहाँ, <math>k(t)</math> स्थिति चर है जो उपरोक्त समीकरण के अनुसार विकसित होता है, और <math>c(t)</math> नियंत्रण चर है। हैमिल्टनियन बन जाता है


:<math>H(k,c,\mu,t)=e^{-\rho t}u(c(t))+\mu(t)\dot{k}=e^{-\rho t}u(c(t))+\mu(t)[f(k(t)) - (n + \delta)k(t) - c(t)]</math>
:<math>H(k,c,\mu,t)=e^{-\rho t}u(c(t))+\mu(t)\dot{k}=e^{-\rho t}u(c(t))+\mu(t)[f(k(t)) - (n + \delta)k(t) - c(t)]</math>
Line 126: Line 132:
e^{-\rho t}u'(c)=\mu(t)</math>
e^{-\rho t}u'(c)=\mu(t)</math>
:<math>\frac{\partial H}{\partial k}=-\frac{\partial \mu}{\partial t}=-\dot{\mu} \Rightarrow \mu(t)[f'(k)-(n+\delta)]=-\dot{\mu}</math>
:<math>\frac{\partial H}{\partial k}=-\frac{\partial \mu}{\partial t}=-\dot{\mu} \Rightarrow \mu(t)[f'(k)-(n+\delta)]=-\dot{\mu}</math>
ट्रांसवर्सलिटी कंडीशन के अलावा <math>\mu(T)k(T)=0</math>. अगर हम जाने दें <math>u(c)=\log(c)</math>, फिर लॉगरिदमिक विभेदीकरण | लॉग-डिफरेंशियेटिंग पहली इष्टतम स्थिति के संबंध में <math>t</math> पैदावार
ट्रांसवर्सलिटी कंडीशन के अतिरिक्त <math>\mu(T)k(T)=0</math>. अगर हम जाने दें <math>u(c)=\log(c)</math>, फिर लॉगरिदमिक विभेदीकरण | लॉग-डिफरेंशियेटिंग पहली इष्टतम स्थिति के संबंध में <math>t</math> पैदावार


:<math>-\rho-\frac{\dot{c}}{c(t)}=\frac{\dot{\mu}}{\mu(t)}</math>
:<math>-\rho-\frac{\dot{c}}{c(t)}=\frac{\dot{\mu}}{\mu(t)}</math>

Revision as of 11:44, 31 May 2023


हैमिल्टनियन एक फलन (गणित) है जिसका उपयोग गतिशील प्रणाली के इष्टतम नियंत्रण की समस्या को हल करने के लिए किया जाता है। इसे उस समस्या के लैग्रेंज गुणक के तात्कालिक वृद्धि के रूप में समझा जा सकता है जिसे एक निश्चित समय अवधि में अनुकूलित किया जाना है।[1] हेमिल्टनियन यांत्रिकी से प्रेरित, लेकिन उससे अलग, इष्टतम नियंत्रण सिद्धांत के हैमिल्टनियन को लेव पोंट्रीगिन ने अपने पोंट्रीगिन के न्यूनतम सिद्धांत के भागों के रूप में विकसित किया था।[2] पोंट्रीगिन ने सिद्ध किया कि इष्टतम नियंत्रण समस्या को हल करने के लिए एक आवश्यक शर्त यह है कि हैमिल्टन को अनुकूलित करने के लिए नियंत्रण को चुना जाना चाहिए।[3]


समस्या कथन और हैमिल्टनियन की परिभाषा

की एक गतिशील प्रणाली पर विचार करें प्रथम-क्रम अंतर समीकरण

जहाँ स्थिति चर के एक वेक्टर को दर्शाता है, और नियंत्रण चर का एक वेक्टर। एक बार प्रारंभिक शर्तें और नियंत्रित करता है निर्दिष्ट हैं, अंतर समीकरणों का एक समाधान, जिसे प्रक्षेपवक्र कहा जाता है , पाया जा सकता है। इष्टतम नियंत्रण की समस्या चुनना है (कुछ सेट से ) जिससे प्रारंभिक समय के बीच एक निश्चित हानि फलन को अधिकतम या कम करता है और एक टर्मिनल समय (जहाँ अनंत हो सकता है)। विशेष रूप से, लक्ष्य एक प्रदर्शन सूचकांक का अनुकूलन करना है समय के प्रत्येक बिंदु पर,

स्थिति चर की गति के उपरोक्त समीकरणों के अधीन। समाधान विधि में एक सहायक कार्य को परिभाषित करना सम्मिलित है जिसे नियंत्रण हैमिल्टन के रूप में जाना जाता है

जो ऑब्जेक्टिव फलन और स्टेट समीकरण को स्टैटिक ऑप्टिमाइज़ेशन प्रॉब्लम में लैग्रेंज मल्टीप्लायर की तरह जोड़ता है, केवल यह कि मल्टीप्लायर , कॉस्टेट वेरिएबल्स के रूप में संदर्भित, स्थिरांक के अतिरिक्त समय के कार्य हैं।

लक्ष्य एक इष्टतम नियंत्रण नीति कार्य खोजना है और, इसके साथ, स्थिति चर का एक इष्टतम प्रक्षेपवक्र , जो पोंट्रीगिन के अधिकतम सिद्धांत के अनुसार वे तर्क हैं जो हैमिल्टनियन को अधिकतम करते हैं,

सभी के लिए

अधिकतम के लिए प्रथम-क्रम आवश्यक शर्तें किसके द्वारा दी गई हैं

जो अधिकतम सिद्धांत है,
जो स्थिति संक्रमण फलन उत्पन्न करता है ,
जो उत्पन्न करता है

जिनमें से बाद वाले को कॉस्टेट समीकरण कहा जाता है। साथ में, स्थिति और कॉस्टेट समीकरण हैमिल्टनियन गतिशील प्रणाली का वर्णन करते हैं (भौतिक विज्ञान में हैमिल्टनियन प्रणाली से फिर से समान लेकिन अलग), जिसके समाधान में दो-बिंदु सीमा मूल्य समस्या सम्मिलित है, यह देखते हुए कि समय में दो अलग-अलग बिंदुओं को सम्मिलित करने वाली सीमा की स्थिति, प्रारंभिक समय ( स्थिति चर के लिए अंतर समीकरण), और टर्मिनल समय ( कॉस्टेट वेरिएबल्स के लिए डिफरेंशियल समीकरण; जब तक कोई अंतिम कार्य निर्दिष्ट नहीं किया जाता है, सीमा की स्थिति होती है , या अनंत समय क्षितिज के लिए)।[4]

अधिकतम के लिए एक पर्याप्त शर्त हैमिल्टनियन की अवतलता है जिसका मूल्यांकन समाधान में किया गया है, अर्थात

जहाँ इष्टतम नियंत्रण है, और स्थिति चर के लिए इष्टतम प्रक्षेपवक्र का परिणाम है।[5] वैकल्पिक रूप से,ओल्वी एल मंगसेरियन के परिणामस्वरूप, कार्य करने पर आवश्यक शर्तें पर्याप्त हैं और दोनों अवतल हैं और .[6]


=== लाग्रंगियन === से व्युत्पत्ति

एक विवश अनुकूलन समस्या जैसा कि ऊपर कहा गया है, विशेष रूप से एक लाग्रंगियन अभिव्यक्ति का सुझाव देती है

जहाँ एक स्थिर अनुकूलन समस्या में लैग्रेंज गुणक की तुलना करता है लेकिन अब, जैसा कि ऊपर उल्लेख किया गया है, समय का एक कार्य है। मिटाने के लिए , दाईं ओर के अंतिम शब्द को भागों द्वारा एकीकरण का उपयोग करके फिर से लिखा जा सकता है, जैसे कि

जिसे देने के लिए लाग्रंगियन अभिव्यक्ति में वापस प्रतिस्थापित किया जा सकता है

एक इष्टतम के लिए प्रथम-क्रम की स्थिति प्राप्त करने के लिए, मान लें कि समाधान मिल गया है और लाग्रंगियन अधिकतम हो गया है। फिर किसी तरह की गड़बड़ी या लाग्रंगियन के मूल्य में गिरावट का कारण होना चाहिए। विशेष रूप से, का कुल व्युत्पन्न का अनुसरण करता है

इस अभिव्यक्ति के लिए शून्य के बराबर होने के लिए निम्नलिखित इष्टतमता शर्तों की आवश्यकता होती है:

यदि दोनों प्रारंभिक मान और टर्मिनल मान निश्चित हैं, अर्थात् , कोई शर्त नहीं है और आवश्यक है। यदि टर्मिनल मूल्य मुक्त है, जैसा कि अधिकांशतः होता है, अतिरिक्त शर्त श्रेष्ठता के लिए आवश्यक है। उत्तरार्द्ध को निश्चित क्षितिज समस्या के लिए एक ट्रांसवर्सलिटी स्थिति कहा जाता है।[7]

यह देखा जा सकता है कि आवश्यक शर्तें हैमिल्टनियन के लिए ऊपर बताई गई शर्तों के समान हैं। इस प्रकार हैमिल्टनियन को पहले क्रम की आवश्यक शर्तों को उत्पन्न करने के लिए एक उपकरण के रूप में समझा जा सकता है।[8]


असतत समय में हैमिल्टनियन

जब समस्या असतत समय में तैयार की जाती है, तो हैमिल्टनियन को इस प्रकार परिभाषित किया जाता है:

और कॉस्टेट समीकरण हैं

(ध्यान दें कि समय पर असतत समय हैमिल्टनियन समय पर कॉस्टेट वैरिएबल सम्मिलित है [9] यह छोटा विवरण आवश्यक है जिससे जब हम इसके संबंध में अंतर करें हमें एक शब्द सम्मिलित है कॉस्टेट समीकरणों के दाहिने हाथ की ओर। यहां गलत सम्मेलन का उपयोग करने से गलत परिणाम हो सकते हैं, यानी एक कॉस्टेट समीकरण जो पीछे की ओर अंतर समीकरण नहीं है)।

हैमिल्टनियन का समय के साथ व्यवहार

पोंट्रीगिन के अधिकतम सिद्धांत से, हैमिल्टनियन के लिए विशेष शर्तें प्राप्त की जा सकती हैं।[10] जब आखिरी बार निश्चित है और हैमिल्टन समय पर स्पष्ट रूप से निर्भर नहीं करता है , तब:[11]

या यदि टर्मिनल समय निःशुल्क है, तो:

इसके अतिरिक्त, यदि टर्मिनल समय अनंत तक जाता है, तो हैमिल्टनियन पर एक पारलौकिक स्थिति स्थिति प्रयुक्त होती है।[12]


यांत्रिकी के हैमिल्टनियन की तुलना में नियंत्रण का हैमिल्टनियन

विलियम रोवन हैमिल्टन ने एक प्रणाली के यांत्रिकी का वर्णन करने के लिए हैमिल्टनियन यांत्रिकी को परिभाषित किया। यह तीन चरों का एक कार्य है:

जहाँ लाग्रंगियन यांत्रिकी है, जिसका चरमोत्कर्ष गतिकी को निर्धारित करता है (ऊपर परिभाषित लाग्रंगियन नहीं), स्थिति चर है और इसका काल व्युत्पन्न है।

तथाकथित संयुग्म गति है, द्वारा परिभाषित

हैमिल्टन ने तब सिस्टम की गतिशीलता का वर्णन करने के लिए अपने समीकरण तैयार किए

नियंत्रण सिद्धांत का हैमिल्टन एक प्रणाली की गतिशीलता का वर्णन नहीं करता है, लेकिन एक नियंत्रण चर के संबंध में कुछ स्केलर फलन (लैग्रैंगियन) को चरम पर पहुंचाने की स्थिति . जैसा कि सामान्य रूप से परिभाषित किया गया है, यह 4 चरों का एक कार्य है

जहाँ स्थिति चर है और नियंत्रण चर है जिसके संबंध में हम चरम सीमा पर हैं।

अधिकतम के लिए संबद्ध शर्तें हैं

यह परिभाषा सस्मान और विलेम्स के लेख द्वारा दी गई परिभाषा से सहमत है।[13] (पृष्ठ 39 देखें, समीकरण 14)। सुस्मान और विलेम्स दिखाते हैं कि हैमिल्टनियन नियंत्रण को गतिशीलता में कैसे प्रयोग किया जा सकता है उदा। ब्राचिस्टोक्रोन समस्या के लिए, लेकिन इस दृष्टिकोण पर कैराथोडोरी के पूर्व कार्य का उल्लेख न करें।[14]


वर्तमान मूल्य और वर्तमान मूल्य हैमिल्टनियन

अर्थशास्त्र में, गतिशील अनुकूलन समस्याओं में उद्देश्य कार्य अधिकांशतः केवल घातीय छूट के माध्यम से सीधे समय पर निर्भर करता है, जैसे कि यह रूप लेता है

जहाँ तात्क्षणिक उपयोगिता फलन या परमानंद फलन के रूप में जाना जाता है।[15] यह हैमिल्टनियन को फिर से परिभाषित करने की अनुमति देता है जहाँ

जिसे हैमिल्टनियन के वर्तमान मूल्य के विपरीत, वर्तमान मूल्य हैमिल्टनियन कहा जाता है पहले खंड में परिभाषित। विशेष रूप से कॉस्टेट वेरिएबल्स को फिर से परिभाषित किया गया है , जो संशोधित प्रथम-क्रम स्थितियों की ओर जाता है।

,

जो उत्पाद नियम से तुरंत अनुसरण करता है। आर्थिक रूप से, पूंजीगत वस्तुओं के लिए वर्तमान-मूल्यवान छाया कीमतों का प्रतिनिधित्व करते हैं .

उदाहरण: रैमसे-कैस-कूपमन्स मॉडल

अर्थशास्त्र में, रैमसे-कैस-कूपमन्स मॉडल का उपयोग अर्थव्यवस्था के लिए इष्टतम बचत व्यवहार निर्धारित करने के लिए किया जाता है। उद्देश्य फलन सामाजिक कल्याण कार्य है,

इष्टतम उपभोग पथ के चुनाव द्वारा अधिकतम किया जाना . कार्यक्रम उपभोग के प्रतिनिधि एजेंट उपयोगिता को इंगित करता है किसी भी समय पर। कारण छूट का प्रतिनिधित्व करता है। अधिकतमकरण समस्या पूंजी तीव्रता के लिए निम्नलिखित अंतर समीकरण के अधीन है, जो प्रति प्रभावी कार्यकर्ता पूंजी के समय के विकास का वर्णन करती है:

जहाँ अवधि टी खपत है, प्रति कर्मचारी अवधि टी पूंजी है (के साथ ), अवधि टी उत्पादन है, जनसंख्या वृद्धि दर है, पूंजी मूल्यह्रास दर है, एजेंट भविष्य की उपयोगिता दर पर छूट देता है , साथ और .

यहाँ, स्थिति चर है जो उपरोक्त समीकरण के अनुसार विकसित होता है, और नियंत्रण चर है। हैमिल्टनियन बन जाता है

इष्टतम स्थिति हैं

ट्रांसवर्सलिटी कंडीशन के अतिरिक्त . अगर हम जाने दें , फिर लॉगरिदमिक विभेदीकरण | लॉग-डिफरेंशियेटिंग पहली इष्टतम स्थिति के संबंध में पैदावार

इस समीकरण को दूसरी अनुकूलतम स्थिति में सम्मिलित करने से प्राप्त होता है

जिसे कीन्स-रैमसे नियम के रूप में जाना जाता है, जो हर अवधि में खपत के लिए एक शर्त देता है, जिसका पालन करने पर अधिकतम जीवनकाल उपयोगिता सुनिश्चित होती है।

संदर्भ

  1. Ferguson, Brian S.; Lim, G. C. (1998). गतिशील आर्थिक समस्याओं का परिचय. Manchester: Manchester University Press. pp. 166–167. ISBN 0-7190-4996-2.
  2. Dixit, Avinash K. (1990). आर्थिक सिद्धांत में अनुकूलन. New York: Oxford University Press. pp. 145–161. ISBN 978-0-19-877210-1.
  3. Kirk, Donald E. (1970). Optimal Control Theory : An Introduction. Englewood Cliffs: Prentice Hall. p. 232. ISBN 0-13-638098-0.
  4. Gandolfo, Giancarlo (1996). आर्थिक गतिशीलता (Third ed.). Berlin: Springer. pp. 375–376. ISBN 3-540-60988-1.
  5. Seierstad, Atle; Sydsæter, Knut (1987). आर्थिक अनुप्रयोगों के साथ इष्टतम नियंत्रण सिद्धांत. Amsterdam: North-Holland. pp. 107–110. ISBN 0-444-87923-4.
  6. Mangasarian, O. L. (1966). "नॉनलाइनियर सिस्टम्स के इष्टतम नियंत्रण के लिए पर्याप्त शर्तें". SIAM Journal on Control. 4 (1): 139–152. doi:10.1137/0304013.
  7. Léonard, Daniel; Long, Ngo Van (1992). "Endpoint Constraints and Transversality Conditions". इष्टतम नियंत्रण सिद्धांत और अर्थशास्त्र में स्थैतिक अनुकूलन. New York: Cambridge University Press. p. 222 [Theorem 7.1.1]. ISBN 0-521-33158-7.
  8. Kamien, Morton I.; Schwartz, Nancy L. (1991). Dynamic Optimization : The Calculus of Variances and Optimal Control in Economics and Management (Second ed.). Amsterdam: North-Holland. pp. 126–127. ISBN 0-444-01609-0.
  9. Jönsson, U. (2005). "पीएमपी का असतत संस्करण" (PDF). p. 25. Archived from the original (PDF) on January 22, 2023.
  10. Naidu, Desineni S. (2003). इष्टतम नियंत्रण प्रणाली. Boca Raton: CRC Press. pp. 259–260. ISBN 0-8493-0892-5.
  11. Torres, Delfim F. M. (2002). "डायनेमिक ऑप्टिमाइज़ेशन एक्सट्रीमल्स की एक उल्लेखनीय संपत्ति". Investigacao Operacional. 22 (2): 253–263. arXiv:math/0212102.
  12. Michel, Philippe (1982). "अनंत क्षितिज इष्टतम समस्याओं में ट्रांसवर्सलिटी स्थिति पर". Econometrica. 50 (4): 975–985. doi:10.2307/1912772. JSTOR 1912772. S2CID 16503488.
  13. Sussmann; Willems (June 1997). "300 Years of Optimal Control" (PDF). IEEE Control Systems Magazine. doi:10.1109/37.588098. Archived from the original (PDF) on July 30, 2010.
  14. See Pesch, H. J.; Bulirsch, R. (1994). "The maximum principle, Bellman's equation, and Carathéodory's work". Journal of Optimization Theory and Applications. 80 (2): 199–225. doi:10.1007/BF02192933. S2CID 121749702.
  15. Bævre, Kåre (Spring 2005). "Econ 4350: Growth and Investment: Lecture Note 7" (PDF). Department of Economics, University of Oslo.


अग्रिम पठन