एन्सेम्बल कलमैन फ़िल्टर: Difference between revisions
m (Arti Shah moved page कलमैन फ़िल्टर को इकट्ठा करें to एन्सेम्बल कलमैन फ़िल्टर without leaving a redirect) |
No edit summary |
||
Line 1: | Line 1: | ||
एन्सेम्बल कल्मन फ़िल्टर (EnKF) | एन्सेम्बल कल्मन फ़िल्टर (EnKF) [[पुनरावर्ती फ़िल्टर]] है जो बड़ी संख्या में चर वाली समस्याओं के लिए उपयुक्त है, जैसे कि भूभौतिकीय मॉडल में आंशिक अंतर समीकरणों का विवेकीकरण। EnKF की उत्पत्ति बड़ी समस्याओं के लिए [[कलमन फ़िल्टर]] के संस्करण के रूप में हुई (अनिवार्य रूप से, सहप्रसरण मैट्रिक्स को [[नमूना सहप्रसरण मैट्रिक्स]] द्वारा प्रतिस्थापित किया जाता है), और यह अब संयोजन पूर्वानुमान का महत्वपूर्ण [[डेटा आत्मसात]] घटक है। EnKF [[कण फिल्टर]] से संबंधित है (इस संदर्भ में, कण समूह सदस्य के समान है) लेकिन EnKF यह धारणा बनाता है कि इसमें शामिल सभी संभाव्यता वितरण [[सामान्य वितरण]] हैं; जब यह लागू होता है, तो यह कण फिल्टर की तुलना में बहुत अधिक कुशल होता है। | ||
==परिचय== | ==परिचय== | ||
एन्सेम्बल कल्मन फ़िल्टर (EnKF) [[बायेसियन अनुमान]] समस्या का | एन्सेम्बल कल्मन फ़िल्टर (EnKF) [[बायेसियन अनुमान]] समस्या का [[मोंटे कार्लो विधि]] कार्यान्वयन है: मॉडल किए गए सिस्टम की स्थिति ([[पूर्व संभावना]], जिसे अक्सर भूविज्ञान में पूर्वानुमान कहा जाता है) और डेटा संभावना की संभाव्यता घनत्व फ़ंक्शन (पीडीएफ) दी गई है। , बेयस प्रमेय का उपयोग डेटा संभावना को ध्यान में रखने के बाद पीडीएफ प्राप्त करने के लिए किया जाता है (पोस्टीरियर संभावना, जिसे अक्सर विश्लेषण कहा जाता है)। इसे बायेसियन अपडेट कहा जाता है। बायेसियन अपडेट को समय-समय पर नए डेटा को शामिल करते हुए मॉडल को आगे बढ़ाने के साथ जोड़ा जाता है। मूल कलमैन फ़िल्टर, 1960 में प्रस्तुत किया गया,<ref name="Kalman-1960-NAL">{{cite journal |first=R. E. |last=Kalman |s2cid=1242324 |title=रेखीय छानने और भविष्यवाणी की समस्याओं के लिए एक नया दृष्टिकोण|journal= Journal of Basic Engineering|volume=82 |year=1960 |issue=1 |pages=35–45 |doi=10.1115/1.3662552 }}</ref> मानता है कि सभी पीडीएफ सामान्य वितरण (गॉसियन धारणा) हैं और बायेसियन अपडेट द्वारा माध्य और सहप्रसरण मैट्रिक्स के परिवर्तन के लिए बीजगणितीय सूत्र प्रदान करता है, साथ ही समय में माध्य और सहप्रसरण को आगे बढ़ाने के लिए सूत्र प्रदान करता है, बशर्ते सिस्टम रैखिक हो। हालाँकि, उच्च-आयामी प्रणालियों के लिए सहप्रसरण मैट्रिक्स को बनाए रखना कम्प्यूटेशनल रूप से संभव नहीं है। इस कारण से, EnKFs विकसित किए गए थे।<ref name="Evensen-1994-SDA">{{cite journal |first=G. |last=Evensen |title=त्रुटि आँकड़ों का पूर्वानुमान लगाने के लिए मोंटे कार्लो विधियों का उपयोग करके गैर-रेखीय अर्ध-जियोस्ट्रोफिक मॉडल के साथ अनुक्रमिक डेटा आत्मसात|journal=Journal of Geophysical Research |volume=99 |issue=C5 |year=1994 |pages=143–162 |doi=10.1029/94JC00572 |hdl=1956/3035 |bibcode=1994JGR....9910143E |hdl-access=free }}</ref><ref name="Houtekamer-1998-DAE">{{cite journal |first1=P. |last1=Houtekamer |first2=H. L. |last2=Mitchell |title=एन्सेम्बल कलमैन फ़िल्टर तकनीक का उपयोग करके डेटा आत्मसात करना|journal=[[Monthly Weather Review]] |volume=126 |year=1998 |issue= 3|pages=796–811 |doi=10.1175/1520-0493(1998)126<0796:DAUAEK>2.0.CO;2 |citeseerx=10.1.1.3.1706 |bibcode=1998MWRv..126..796H }}</ref> EnKFs राज्य वैक्टरों के संग्रह का उपयोग करके सिस्टम स्थिति के वितरण का प्रतिनिधित्व करते हैं, जिसे संख्यात्मक मौसम पूर्वानुमान#एनसेम्बल कहा जाता है, और सहप्रसरण मैट्रिक्स को समुच्चय से गणना किए गए [[नमूना सहप्रसरण]] द्वारा प्रतिस्थापित करते हैं। समूह को ऐसे संचालित किया जाता है जैसे कि यह [[यादृच्छिक नमूना]] हो, लेकिन समूह के सदस्य वास्तव में [[सांख्यिकीय स्वतंत्रता]] नहीं रखते हैं, क्योंकि वे सभी EnKF साझा करते हैं। EnKFs का फायदा यह है कि पीडीएफ को समय पर आगे बढ़ाने का काम केवल समूह के प्रत्येक सदस्य को आगे बढ़ाना है।<ref name="Evensen-2007-DAE">For a survey of EnKF and related data assimilation techniques, see {{cite book |first=G. |last=Evensen |title=Data Assimilation : The Ensemble Kalman Filter |publisher=Springer |location=Berlin |year=2007 |isbn=978-3-540-38300-0 }}</ref> | ||
Line 15: | Line 12: | ||
===कलमैन फ़िल्टर=== | ===कलमैन फ़िल्टर=== | ||
{{main|Kalman filter}} | {{main|Kalman filter}} | ||
होने देना <math>\mathbf{x}</math> निरूपित करें <math>n</math> | होने देना <math>\mathbf{x}</math> निरूपित करें <math>n</math> मॉडल का -आयामी राज्य स्थान प्रतिनिधित्व, और मान लें कि इसका माध्य के साथ सामान्य वितरण है <math>\mathbf{\mu}</math> और सहप्रसरण <math>Q</math>यानी कि इसका पीडीएफ है | ||
:<math> p(\mathbf{x})\propto\exp\left( -\frac{1}{2}(\mathbf{x}-\mathbf{\mu })^{\mathrm{T}}Q^{-1}(\mathbf{x}-\mathbf{\mu})\right) . </math> | :<math> p(\mathbf{x})\propto\exp\left( -\frac{1}{2}(\mathbf{x}-\mathbf{\mu })^{\mathrm{T}}Q^{-1}(\mathbf{x}-\mathbf{\mu})\right) . </math> | ||
यहाँ और नीचे, <math>\propto</math> मतलब आनुपातिक; | यहाँ और नीचे, <math>\propto</math> मतलब आनुपातिक; पीडीएफ को हमेशा स्केल किया जाता है ताकि पूरे स्थान पर इसका अभिन्न अंग हो। यह <math>p(\mathbf{x})</math>, जिसे पूर्व संभाव्यता कहा जाता है, मॉडल को चलाकर समय पर विकसित किया गया था और अब इसे नए डेटा के लिए अद्यतन किया जाना है। यह मान लेना स्वाभाविक है कि डेटा का त्रुटि वितरण ज्ञात है; डेटा को त्रुटि अनुमान के साथ आना होगा, अन्यथा वे अर्थहीन हैं। यहाँ, डेटा <math>\mathbf{d}</math> ऐसा माना जाता है कि इसमें सहप्रसरण के साथ गॉसियन पीडीएफ है <math>R</math> और मतलब <math>H\mathbf{x}</math>, कहाँ <math>H</math> तथाकथित [[टोपी मैट्रिक्स]] है। सहप्रसरण मैट्रिक्स <math>R</math> डेटा की त्रुटि के अनुमान का वर्णन करता है; यदि डेटा वेक्टर की प्रविष्टियों में यादृच्छिक त्रुटियाँ हैं <math>\mathbf{d}</math> स्वतंत्र हैं, <math>R</math> विकर्ण है और इसकी विकर्ण प्रविष्टियाँ डेटा वेक्टर की संबंधित प्रविष्टियों की त्रुटि के [[मानक विचलन]] ("त्रुटि आकार") के वर्ग हैं <math>\mathbf{d}</math>. मूल्य <math>H\mathbf{x}</math> राज्य के लिए डेटा का मूल्य क्या होगा <math>\mathbf{x}</math> डेटा त्रुटियों के अभाव में. फिर संभाव्यता घनत्व <math>p(\mathbf{d}|\mathbf{x})</math> डेटा का <math>\mathbf{d}</math> सिस्टम स्थिति की सशर्तता <math>\mathbf{x}</math>, जिसे संभावना फ़ंक्शन कहा जाता है, है | ||
:<math> p\left( \mathbf{d}|\mathbf{x}\right) \propto\exp\left( -\frac{1}{2}(\mathbf{d}-H\mathbf{x})^{\mathrm{T}}R^{-1}(\mathbf{d}-H\mathbf{x})\right) . </math> | :<math> p\left( \mathbf{d}|\mathbf{x}\right) \propto\exp\left( -\frac{1}{2}(\mathbf{d}-H\mathbf{x})^{\mathrm{T}}R^{-1}(\mathbf{d}-H\mathbf{x})\right) . </math> | ||
Line 24: | Line 21: | ||
:<math> p\left( \mathbf{x}|\mathbf{d}\right) \propto p\left( \mathbf{d}|\mathbf{x}\right) p(\mathbf{x}). </math> | :<math> p\left( \mathbf{x}|\mathbf{d}\right) \propto p\left( \mathbf{d}|\mathbf{x}\right) p(\mathbf{x}). </math> | ||
आंकड़ा <math>\mathbf{d}</math> | आंकड़ा <math>\mathbf{d}</math> बार प्राप्त होने के बाद यह तय हो जाता है, इसलिए पिछली स्थिति को इससे निरूपित करें <math>\mathbf{\hat{x}}</math> के बजाय <math>\mathbf{x}|\mathbf{d}</math> और पिछला पीडीएफ़ द्वारा <math>p\left( \mathbf{\hat{x}}\right) </math>. इसे बीजगणितीय जोड़-तोड़ द्वारा दिखाया जा सकता है<ref name="Anderson-1979-OF">{{cite book |first1=B. D. O. |last1=Anderson |first2=J. B. |last2=Moore |title=इष्टतम फ़िल्टरिंग|publisher=Prentice-Hall |location=Englewood Cliffs, NJ |year=1979 |isbn=978-0-13-638122-8 }}</ref> पिछला पीडीएफ भी गॉसियन है, | ||
:<math> p\left( \mathbf{\hat{x}}\right) \propto\exp\left( -\frac{1}{2}(\mathbf{\hat{x}}-\mathbf{\hat{\mu}})^{\mathrm{T}}\hat{Q}^{-1}(\mathbf{\hat{x}}-\mathbf{\hat{\mu}})\right) , </math> | :<math> p\left( \mathbf{\hat{x}}\right) \propto\exp\left( -\frac{1}{2}(\mathbf{\hat{x}}-\mathbf{\hat{\mu}})^{\mathrm{T}}\hat{Q}^{-1}(\mathbf{\hat{x}}-\mathbf{\hat{\mu}})\right) , </math> | ||
Line 37: | Line 34: | ||
===कलामन फ़िल्टर इकट्ठा करें=== | ===कलामन फ़िल्टर इकट्ठा करें=== | ||
EnKF कलमैन फ़िल्टर का | EnKF कलमैन फ़िल्टर का मोंटे कार्लो सन्निकटन है, जो राज्य वेक्टर के पीडीएफ के सहप्रसरण मैट्रिक्स को विकसित करने से बचाता है <math>\mathbf{x}</math>. इसके बजाय, पीडीएफ को समूह द्वारा दर्शाया जाता है | ||
:<math> X=\left[ \mathbf{x}_{1},\ldots,\mathbf{x}_{N}\right] =\left[ \mathbf{x}_{i}\right]. </math> | :<math> X=\left[ \mathbf{x}_{1},\ldots,\mathbf{x}_{N}\right] =\left[ \mathbf{x}_{i}\right]. </math> | ||
<math>X</math> | <math>X</math> <math>n\times N</math> मैट्रिक्स जिसके कॉलम समूह सदस्य हैं, और इसे पूर्व समूह कहा जाता है। आदर्श रूप से, समूह के सदस्य पूर्व वितरण से यादृच्छिक नमूना बनाएंगे। हालाँकि, प्रारंभिक समूह को छोड़कर समूह के सदस्य सामान्य रूप से सांख्यिकीय स्वतंत्रता में नहीं हैं, क्योंकि प्रत्येक EnKF कदम उन्हें साथ जोड़ता है। उन्हें लगभग स्वतंत्र माना जाता है, और सभी गणनाएँ ऐसे आगे बढ़ती हैं मानो वे वास्तव में स्वतंत्र हों। | ||
डेटा को दोहराएँ <math>\mathbf{d}</math> | डेटा को दोहराएँ <math>\mathbf{d}</math> में <math>m\times N</math> आव्यूह | ||
:<math> D=\left[ \mathbf{d}_{1},\ldots,\mathbf{d}_{N}\right] =\left[ \mathbf{d}_{i}\right], \quad \mathbf{d}_{i}=\mathbf{d}+\mathbf{\epsilon_{i}}, \quad \mathbf{\epsilon_{i}} \sim N(0,R), </math> | :<math> D=\left[ \mathbf{d}_{1},\ldots,\mathbf{d}_{N}\right] =\left[ \mathbf{d}_{i}\right], \quad \mathbf{d}_{i}=\mathbf{d}+\mathbf{\epsilon_{i}}, \quad \mathbf{\epsilon_{i}} \sim N(0,R), </math> | ||
ताकि प्रत्येक कॉलम <math>\mathbf{d}_{i}</math> डेटा वेक्टर से मिलकर बनता है <math>\mathbf{d}</math> प्लस से | ताकि प्रत्येक कॉलम <math>\mathbf{d}_{i}</math> डेटा वेक्टर से मिलकर बनता है <math>\mathbf{d}</math> प्लस से यादृच्छिक वेक्टर <math>m</math>-आयामी सामान्य वितरण <math>N(0,R)</math>. यदि, इसके अतिरिक्त, के कॉलम <math>X</math> पूर्व संभाव्यता वितरण से नमूना है, फिर के कॉलम | ||
:<math> \hat{X}=X+K(D-HX) </math> | :<math> \hat{X}=X+K(D-HX) </math> | ||
पश्च संभाव्यता वितरण से | पश्च संभाव्यता वितरण से नमूना बनाएं। इसे अदिश मामले में देखने के लिए <math>H=1</math>: होने देना <math>x_i = \mu + \xi_i, \; \xi_i \sim N(0, \sigma_x^2)</math>, और <math>d_i = d + \epsilon_i, \; \epsilon_i \sim N(0, \sigma_d^2).</math> तब | ||
:<math>\hat{x}_i = \left(\frac{1/\sigma_x^2}{1/\sigma_x^2 + 1/\sigma_d^2} \mu + \frac{1/\sigma_d^2}{1/\sigma_x^2 + 1/\sigma_d^2} d \right)+ \left(\frac{1/\sigma_x^2}{1/\sigma_x^2 + 1/\sigma_d^2} \xi_i + \frac{1/\sigma_d^2}{1/\sigma_x^2 + 1/\sigma_d^2} \epsilon_i \right) </math>. | :<math>\hat{x}_i = \left(\frac{1/\sigma_x^2}{1/\sigma_x^2 + 1/\sigma_d^2} \mu + \frac{1/\sigma_d^2}{1/\sigma_x^2 + 1/\sigma_d^2} d \right)+ \left(\frac{1/\sigma_x^2}{1/\sigma_x^2 + 1/\sigma_d^2} \xi_i + \frac{1/\sigma_d^2}{1/\sigma_x^2 + 1/\sigma_d^2} \epsilon_i \right) </math>. | ||
पहला योग पश्च माध्य है, और दूसरे योग में, स्वतंत्रता को ध्यान में रखते हुए, | पहला योग पश्च माध्य है, और दूसरे योग में, स्वतंत्रता को ध्यान में रखते हुए, भिन्नता है | ||
:<math>\left(\frac{1/\sigma_x^2}{1/\sigma_x^2 + 1/\sigma_d^2}\right)^2 \sigma_x^2 + \left(\frac{1/\sigma_d^2}{1/\sigma_x^2 + 1/\sigma_d^2}\right)^2 \sigma_d^2 = \frac{1}{1/\sigma_x^2 + 1/\sigma_d^2}</math>, | :<math>\left(\frac{1/\sigma_x^2}{1/\sigma_x^2 + 1/\sigma_d^2}\right)^2 \sigma_x^2 + \left(\frac{1/\sigma_d^2}{1/\sigma_x^2 + 1/\sigma_d^2}\right)^2 \sigma_d^2 = \frac{1}{1/\sigma_x^2 + 1/\sigma_d^2}</math>, | ||
Line 79: | Line 76: | ||
जहां परेशान डेटा मैट्रिक्स <math>D</math> ऊपर जैसा है. | जहां परेशान डेटा मैट्रिक्स <math>D</math> ऊपर जैसा है. | ||
ध्यान दें कि तब से <math>R</math> | ध्यान दें कि तब से <math>R</math> सहप्रसरण मैट्रिक्स है, यह हमेशा [[सकारात्मक अर्धनिश्चित मैट्रिक्स]] होता है और आमतौर पर सकारात्मक अर्धनिश्चित मैट्रिक्स होता है, इसलिए उपरोक्त व्युत्क्रम मौजूद है और सूत्र कोलेस्की अपघटन द्वारा कार्यान्वित किया जा सकता है।<ref name="Mandel-2006-EIE">{{cite journal |first=J. |last=Mandel |title=एन्सेम्बल कलमन फ़िल्टर का कुशल कार्यान्वयन|journal=Center for Computational Mathematics Reports |volume=231 |publisher=University of Colorado at Denver and Health Sciences Center |url=http://www.math.ucdenver.edu/ccm/reports/rep231.pdf |date=June 2006 }}</ref> में,<ref name="Burgers-1998-ASE"/><ref name="Evensen-2003-EKF"/> <math>R</math> नमूना सहप्रसरण द्वारा प्रतिस्थापित किया जाता है <math>\tilde{D} \tilde{D}^{T}/\left( N-1\right) </math> कहाँ <math>\tilde{D} = D - \frac{1}{N} d \, \mathbf{e}_{1\times N}</math>और व्युत्क्रम को छद्म व्युत्क्रम से बदल दिया जाता है, जिसकी गणना एकवचन-मूल्य अपघटन (एसवीडी) का उपयोग करके की जाती है। | ||
चूँकि ये सूत्र प्रमुख BLAS#स्तर 3 ऑपरेशन वाले मैट्रिक्स ऑपरेशन हैं,<ref name="Golub-1989-MAC">{{cite book |first1=G. H. |last1=Golub |author-link=Gene H. Golub |first2=C. F. V. |last2=Loan |title=मैट्रिक्स संगणना|publisher=Johns Hopkins Univ. Press |location=Baltimore |year=1989 |edition=Second |isbn=978-0-8018-3772-2 }}</ref> वे [[LAPACK]] (सीरियल और [[साझा स्मृति वास्तुकला]] कंप्यूटर पर) और [[ScaLAPACK]] (वितरित मेमोरी कंप्यूटर पर) जैसे सॉफ़्टवेयर पैकेजों का उपयोग करके कुशल कार्यान्वयन के लिए उपयुक्त हैं।<ref name="Mandel-2006-EIE"/>किसी मैट्रिक्स के व्युत्क्रम मैट्रिक्स की गणना करने और उससे गुणा करने के बजाय[[उलटा मैट्रिक्स]] के चॉलेस्की अपघटन की गणना करना और व्युत्क्रम द्वारा गुणन को कई के साथ | चूँकि ये सूत्र प्रमुख BLAS#स्तर 3 ऑपरेशन वाले मैट्रिक्स ऑपरेशन हैं,<ref name="Golub-1989-MAC">{{cite book |first1=G. H. |last1=Golub |author-link=Gene H. Golub |first2=C. F. V. |last2=Loan |title=मैट्रिक्स संगणना|publisher=Johns Hopkins Univ. Press |location=Baltimore |year=1989 |edition=Second |isbn=978-0-8018-3772-2 }}</ref> वे [[LAPACK]] (सीरियल और [[साझा स्मृति वास्तुकला]] कंप्यूटर पर) और [[ScaLAPACK]] (वितरित मेमोरी कंप्यूटर पर) जैसे सॉफ़्टवेयर पैकेजों का उपयोग करके कुशल कार्यान्वयन के लिए उपयुक्त हैं।<ref name="Mandel-2006-EIE"/>किसी मैट्रिक्स के व्युत्क्रम मैट्रिक्स की गणना करने और उससे गुणा करने के बजाय[[उलटा मैट्रिक्स]] के चॉलेस्की अपघटन की गणना करना और व्युत्क्रम द्वारा गुणन को कई के साथ रैखिक प्रणाली के समाधान के रूप में मानना बहुत बेहतर (कई गुना सस्ता और अधिक सटीक) है साथ दाहिनी ओर।<ref name="Golub-1989-MAC"/> | ||
===अवलोकन मैट्रिक्स-मुक्त कार्यान्वयन=== | ===अवलोकन मैट्रिक्स-मुक्त कार्यान्वयन=== | ||
चूँकि हमने सहप्रसरण मैट्रिक्स को असेंबल सहप्रसरण के साथ बदल दिया है, इससे | चूँकि हमने सहप्रसरण मैट्रिक्स को असेंबल सहप्रसरण के साथ बदल दिया है, इससे सरल सूत्र तैयार होता है जहाँ मैट्रिक्स को स्पष्ट रूप से निर्दिष्ट किए बिना समुच्चय अवलोकनों का सीधे उपयोग किया जाता है। <math>H</math>. अधिक विशेष रूप से, किसी फ़ंक्शन को परिभाषित करें <math>h(\mathbf{x})</math> रूप का | ||
:<math> h(\mathbf{x})=H\mathbf{x}. </math> | :<math> h(\mathbf{x})=H\mathbf{x}. </math> | ||
Line 101: | Line 98: | ||
:<math>\left[ HA\right] _{i} =H\mathbf{x}_{i}-H\frac{1}{N}\sum_{j=1}^{N}\mathbf{x}_{j}\ =h\left( \mathbf{x}_{i}\right) -\frac{1}{N}\sum_{j=1}^{N}h\left( \mathbf{x}_{j}\right) . </math> | :<math>\left[ HA\right] _{i} =H\mathbf{x}_{i}-H\frac{1}{N}\sum_{j=1}^{N}\mathbf{x}_{j}\ =h\left( \mathbf{x}_{i}\right) -\frac{1}{N}\sum_{j=1}^{N}h\left( \mathbf{x}_{j}\right) . </math> | ||
नतीजतन, अवलोकन फ़ंक्शन का मूल्यांकन करके संयोजन अद्यतन की गणना की जा सकती है <math>h</math> प्रत्येक समूह सदस्य पर | नतीजतन, अवलोकन फ़ंक्शन का मूल्यांकन करके संयोजन अद्यतन की गणना की जा सकती है <math>h</math> प्रत्येक समूह सदस्य पर बार और मैट्रिक्स <math>H</math> स्पष्ट रूप से जानने की आवश्यकता नहीं है। यह फार्मूला भी लागू है<ref name="Mandel-2006-EIE"/> अवलोकन समारोह के लिए <math>h(\mathbf{x})=H\mathbf{x+f}</math> निश्चित ऑफसेट के साथ <math>\mathbf{f}</math>, जिसे स्पष्ट रूप से जानने की भी आवश्यकता नहीं है। उपरोक्त सूत्र का उपयोग आमतौर पर अरेखीय अवलोकन फ़ंक्शन के लिए किया गया है <math>h</math>, जैसे कि तूफान [[भंवर]] की स्थिति।<ref name="Chen-2006-AVP">{{cite journal |first1=Y. |last1=Chen |first2=C. |last2=Snyder |title=एन्सेम्बल कलमन फ़िल्टर के साथ भंवर स्थिति को आत्मसात करना|journal=Monthly Weather Review |volume=135 |year=2007 |issue=5 |pages=1828–1845 |doi=10.1175/MWR3351.1 |bibcode=2007MWRv..135.1828C }}</ref> उस स्थिति में, अवलोकन फ़ंक्शन को अनिवार्य रूप से समूह सदस्यों पर इसके मूल्यों से रैखिक फ़ंक्शन द्वारा अनुमानित किया जाता है। | ||
===बड़ी संख्या में डेटा बिंदुओं के लिए कार्यान्वयन=== | ===बड़ी संख्या में डेटा बिंदुओं के लिए कार्यान्वयन=== | ||
बड़ी संख्या के लिए <math>m</math> डेटा बिंदुओं का, से गुणा <math>P^{-1}</math> | बड़ी संख्या के लिए <math>m</math> डेटा बिंदुओं का, से गुणा <math>P^{-1}</math> अड़चन बन जाता है. डेटा बिंदुओं की संख्या होने पर निम्नलिखित वैकल्पिक सूत्र लाभप्रद है <math>m</math> बड़ा है (जैसे कि ग्रिड या पिक्सेल डेटा को आत्मसात करते समय) और डेटा त्रुटि सहप्रसरण मैट्रिक्स <math>R</math> विकर्ण है (यह स्थिति तब होती है जब डेटा त्रुटियां असंबद्ध होती हैं), या विघटित करने के लिए सस्ता होता है (जैसे कि सीमित सहप्रसरण दूरी के कारण बैंडेड)। शर्मन-मॉरिसन-वुडबरी फॉर्मूला का उपयोग करना<ref name="Hager-1989-UIM">{{cite journal |first=W. W. |last=Hager |title=मैट्रिक्स के व्युत्क्रम को अद्यतन करना|journal=[[SIAM Review]] |volume=31 |issue=2 |year=1989 |pages=221–239 |doi=10.1137/1031049 }}</ref> | ||
:<math> (R+UV^{T})^{-1}=R^{-1}-R^{-1}U(I+V^{T}R^{-1}U)^{-1}V^{T}R^{-1}, </math> | :<math> (R+UV^{T})^{-1}=R^{-1}-R^{-1}U(I+V^{T}R^{-1}U)^{-1}V^{T}R^{-1}, </math> | ||
साथ | साथ | ||
Line 114: | Line 111: | ||
:<math>\begin{align} P^{-1} & =\left( R+\frac{1}{N-1}HA\left( HA\right) ^{T}\right) ^{-1}\ = \\ | :<math>\begin{align} P^{-1} & =\left( R+\frac{1}{N-1}HA\left( HA\right) ^{T}\right) ^{-1}\ = \\ | ||
& =R^{-1}\left[ I-\frac{1}{N-1}\left( HA\right) \left( I+\left( HA\right) ^{T}R^{-1}\frac{1}{N-1}\left( HA\right) \right) ^{-1}\left( HA\right) ^{T}R^{-1}\right] , \end{align}</math> | & =R^{-1}\left[ I-\frac{1}{N-1}\left( HA\right) \left( I+\left( HA\right) ^{T}R^{-1}\frac{1}{N-1}\left( HA\right) \right) ^{-1}\left( HA\right) ^{T}R^{-1}\right] , \end{align}</math> | ||
जिसके लिए केवल मैट्रिक्स वाले सिस्टम के समाधान की आवश्यकता होती है <math>R</math> (सस्ता माना जाता है) और आकार की | जिसके लिए केवल मैट्रिक्स वाले सिस्टम के समाधान की आवश्यकता होती है <math>R</math> (सस्ता माना जाता है) और आकार की प्रणाली <math>N</math> साथ <math>m</math> दाहिनी ओर. देखना<ref name="Mandel-2006-EIE"/>ऑपरेशन गणना के लिए. | ||
==आगे का विस्तार== | ==आगे का विस्तार== | ||
Line 121: | Line 118: | ||
चूंकि समूह सहप्रसरण में [[रैंक की कमी]] है (समूह सदस्यों की तुलना में कई अधिक राज्य चर हैं, आम तौर पर लाखों, आमतौर पर सौ से कम), इसमें उन बिंदुओं के जोड़े के लिए बड़े शब्द हैं जो स्थानिक रूप से दूर हैं। चूँकि वास्तव में दूर के स्थानों पर भौतिक क्षेत्रों के मान इतने [[सहसंबद्ध]] नहीं हैं, दूरी के आधार पर सहप्रसरण मैट्रिक्स को कृत्रिम रूप से कम कर दिया जाता है, जो स्थानीयकृत कलमैन फ़िल्टर एल्गोरिदम को जन्म देता है।<ref name="Anderson-2003-LLS">{{cite journal |first=J. L. |last=Anderson |title=संयोजन फ़िल्टरिंग के लिए एक स्थानीय न्यूनतम वर्ग ढाँचा|journal=Monthly Weather Review |volume=131 |year=2003 |issue=4 |pages=634–642 |doi=10.1175/1520-0493(2003)131<0634:ALLSFF>2.0.CO;2 |citeseerx=10.1.1.10.6543 |bibcode=2003MWRv..131..634A }}</ref><ref name="Ott-2003-LEK">{{cite journal |author-link1=Edward Ott |first1=E. |last1=Ott |first2=B. R. |last2=Hunt |first3=I. |last3=Szunyogh |first4=A. V. |last4=Zimin |first5=E. J. |last5=Kostelich |first6=M. |last6=Corazza |author-link7=Eugenia Kalnay |first7=E. |last7=Kalnay |first8=D. |last8=Patil |author-link9=James A. Yorke |first9=J. A. |last9=Yorke |s2cid=218577557 |title=वायुमंडलीय डेटा सम्मिलन के लिए एक स्थानीय पहनावा कलमन फ़िल्टर|journal=[[Tellus A]] |volume=56 |year=2004 |issue=5 |pages=415–428 |doi=10.3402/tellusa.v56i5.14462 |arxiv=physics/0203058 |bibcode=2004TellA..56..415O }}</ref> ये विधियां गणनाओं में उपयोग किए जाने वाले सहप्रसरण मैट्रिक्स को संशोधित करती हैं और परिणामस्वरूप, पीछे का पहनावा अब केवल पिछले संयोजन के रैखिक संयोजनों से नहीं बना है। | चूंकि समूह सहप्रसरण में [[रैंक की कमी]] है (समूह सदस्यों की तुलना में कई अधिक राज्य चर हैं, आम तौर पर लाखों, आमतौर पर सौ से कम), इसमें उन बिंदुओं के जोड़े के लिए बड़े शब्द हैं जो स्थानिक रूप से दूर हैं। चूँकि वास्तव में दूर के स्थानों पर भौतिक क्षेत्रों के मान इतने [[सहसंबद्ध]] नहीं हैं, दूरी के आधार पर सहप्रसरण मैट्रिक्स को कृत्रिम रूप से कम कर दिया जाता है, जो स्थानीयकृत कलमैन फ़िल्टर एल्गोरिदम को जन्म देता है।<ref name="Anderson-2003-LLS">{{cite journal |first=J. L. |last=Anderson |title=संयोजन फ़िल्टरिंग के लिए एक स्थानीय न्यूनतम वर्ग ढाँचा|journal=Monthly Weather Review |volume=131 |year=2003 |issue=4 |pages=634–642 |doi=10.1175/1520-0493(2003)131<0634:ALLSFF>2.0.CO;2 |citeseerx=10.1.1.10.6543 |bibcode=2003MWRv..131..634A }}</ref><ref name="Ott-2003-LEK">{{cite journal |author-link1=Edward Ott |first1=E. |last1=Ott |first2=B. R. |last2=Hunt |first3=I. |last3=Szunyogh |first4=A. V. |last4=Zimin |first5=E. J. |last5=Kostelich |first6=M. |last6=Corazza |author-link7=Eugenia Kalnay |first7=E. |last7=Kalnay |first8=D. |last8=Patil |author-link9=James A. Yorke |first9=J. A. |last9=Yorke |s2cid=218577557 |title=वायुमंडलीय डेटा सम्मिलन के लिए एक स्थानीय पहनावा कलमन फ़िल्टर|journal=[[Tellus A]] |volume=56 |year=2004 |issue=5 |pages=415–428 |doi=10.3402/tellusa.v56i5.14462 |arxiv=physics/0203058 |bibcode=2004TellA..56..415O }}</ref> ये विधियां गणनाओं में उपयोग किए जाने वाले सहप्रसरण मैट्रिक्स को संशोधित करती हैं और परिणामस्वरूप, पीछे का पहनावा अब केवल पिछले संयोजन के रैखिक संयोजनों से नहीं बना है। | ||
गैर-रेखीय समस्याओं के लिए, EnKF गैर-भौतिक अवस्थाओं के साथ पश्च संयोजन बना सकता है। इसे [[तिखोनोव नियमितीकरण]] द्वारा कम किया जा सकता है, जैसे कि बड़े स्थानिक [[ ग्रेडियेंट ]] वाले राज्यों की दंड विधि।<ref name="Johns-2005-CEK"/> | गैर-रेखीय समस्याओं के लिए, EnKF गैर-भौतिक अवस्थाओं के साथ पश्च संयोजन बना सकता है। इसे [[तिखोनोव नियमितीकरण]] द्वारा कम किया जा सकता है, जैसे कि बड़े स्थानिक [[ ग्रेडियेंट |ग्रेडियेंट]] वाले राज्यों की दंड विधि।<ref name="Johns-2005-CEK"/> | ||
[[सुसंगत विशेषता]]ओं वाली समस्याओं, जैसे कि तूफान, तूफान, [[ आग रेखा ]], [[ तूफान रेखा ]] और बारिश के मोर्चों के लिए, अंतरिक्ष (इसके ग्रिड) में राज्य को विकृत करके और साथ ही राज्य के आयामों को सही करके संख्यात्मक मॉडल स्थिति को समायोजित करने की आवश्यकता है। . 2007 में, रवेला एट अल। एनसेंबल का उपयोग करके संयुक्त स्थिति-आयाम समायोजन मॉडल पेश करें, और व्यवस्थित रूप से | [[सुसंगत विशेषता]]ओं वाली समस्याओं, जैसे कि तूफान, तूफान, [[ आग रेखा |आग रेखा]] , [[ तूफान रेखा |तूफान रेखा]] और बारिश के मोर्चों के लिए, अंतरिक्ष (इसके ग्रिड) में राज्य को विकृत करके और साथ ही राज्य के आयामों को सही करके संख्यात्मक मॉडल स्थिति को समायोजित करने की आवश्यकता है। . 2007 में, रवेला एट अल। एनसेंबल का उपयोग करके संयुक्त स्थिति-आयाम समायोजन मॉडल पेश करें, और व्यवस्थित रूप से अनुक्रमिक सन्निकटन प्राप्त करें जिसे एनकेएफ और अन्य फॉर्मूलेशन दोनों पर लागू किया जा सकता है।<ref name ="Ravela-2007">{{cite journal |first1=S. |last1=Ravela |first2=K. |last2=Emanuel |author-link2=Kerry Emanuel |first3=D. |last3=McLaughlin |title=फ़ील्ड संरेखण द्वारा डेटा सम्मिलन|journal=[[Physica (journal)|Physica]] |series=D: Nonlinear Phenomena |volume=230 |issue=1–2 |year=2007 |pages=127–145 |doi=10.1016/j.physd.2006.09.035 |bibcode=2007PhyD..230..127R }}</ref> उनकी पद्धति यह धारणा नहीं बनाती है कि आयाम और स्थिति त्रुटियां स्वतंत्र या संयुक्त रूप से गॉसियन हैं, जैसा कि अन्य करते हैं। [[ रूप बदलना |रूप बदलना]] एनकेएफ राज्यों के रैखिक संयोजनों के बजाय, [[छवि पंजीकरण]] और मॉर्फिंग से उधार ली गई तकनीकों द्वारा प्राप्त मध्यवर्ती राज्यों को नियोजित करता है।<ref name="Beezley-2007-MEK">{{cite journal |first1=J. D. |last1=Beezley |first2=J. |last2=Mandel |s2cid=1009227 |title=मॉर्फ़िंग पहनावा कलमन फ़िल्टर|journal=Tellus A |year=2008 |volume=60 |issue=1 |pages=131–140 |doi=10.1111/j.1600-0870.2007.00275.x |arxiv=0705.3693 |bibcode=2008TellA..60..131B }}</ref><ref name="Mandel-2006-PME">{{cite conference |first1=J. |last1=Mandel |first2=J. D. |last2=Beezley |title=उच्च आयामी नॉनलाइनर सिस्टम में विरल डेटा को आत्मसात करने के लिए प्रीडिक्टर-करेक्टर और मॉर्फिंग एसेंबल फिल्टर|work=CCM Report 239 |publisher=University of Colorado at Denver and Health Sciences Center |url=http://www.math.ucdenver.edu/ccm/reports/rep239.pdf |date=November 2006 |conference=11th Symposium on Integrated Observing and Assimilation Systems for the Atmosphere, Oceans, and Land Surface (IOAS-AOLS), CD-ROM, Paper 4.12, 87th American Meteorological Society Annual Meeting, San Antonio, TX, January 2007 }}</ref> | ||
औपचारिक रूप से, EnKF गॉसियन धारणा पर भरोसा करते हैं। व्यवहार में इनका उपयोग अरैखिक समस्याओं के लिए भी किया जा सकता है, जहां गॉसियन धारणा संतुष्ट नहीं हो सकती है। एनकेएफ में गॉसियन धारणा को शिथिल करने का प्रयास करने वाले संबंधित फिल्टर, इसके फायदों को संरक्षित करते हुए, इसमें ऐसे फिल्टर शामिल हैं जो कई गॉसियन कर्नेल के साथ राज्य पीडीएफ को फिट करते हैं,<ref name="Anderson-1999-MCI">{{cite journal |first1=J. L. |last1=Anderson |first2=S. L. |last2=Anderson |title=सामूहिक सम्मिलन और पूर्वानुमान उत्पन्न करने के लिए नॉनलाइनियर फ़िल्टरिंग समस्या का मोंटे कार्लो कार्यान्वयन|journal=Monthly Weather Review |volume=127 |issue=12 |year=1999 |pages=2741–2758 |doi=10.1175/1520-0493(1999)127<2741:AMCIOT>2.0.CO;2 |bibcode=1999MWRv..127.2741A }}</ref> फ़िल्टर जो [[गाऊसी मिश्रण]] द्वारा राज्य पीडीएफ का अनुमान लगाते हैं,<ref name="Bengtsson-2003-NFE">{{cite journal |first1=T. |last1=Bengtsson |first2=C. |last2=Snyder |first3=D. |last3=Nychka |title=उच्च आयामी प्रणालियों के लिए एक अरेखीय संयोजन फ़िल्टर की ओर|journal=Journal of Geophysical Research: Atmospheres |volume=108 |issue=D24 |year=2003 |pages=STS 2–1–10 |doi=10.1029/2002JD002900 |bibcode=2003JGRD..108.8775B |doi-access=free }}</ref> [[घनत्व अनुमान]] द्वारा कण भार की गणना के साथ कण फिल्टर का | औपचारिक रूप से, EnKF गॉसियन धारणा पर भरोसा करते हैं। व्यवहार में इनका उपयोग अरैखिक समस्याओं के लिए भी किया जा सकता है, जहां गॉसियन धारणा संतुष्ट नहीं हो सकती है। एनकेएफ में गॉसियन धारणा को शिथिल करने का प्रयास करने वाले संबंधित फिल्टर, इसके फायदों को संरक्षित करते हुए, इसमें ऐसे फिल्टर शामिल हैं जो कई गॉसियन कर्नेल के साथ राज्य पीडीएफ को फिट करते हैं,<ref name="Anderson-1999-MCI">{{cite journal |first1=J. L. |last1=Anderson |first2=S. L. |last2=Anderson |title=सामूहिक सम्मिलन और पूर्वानुमान उत्पन्न करने के लिए नॉनलाइनियर फ़िल्टरिंग समस्या का मोंटे कार्लो कार्यान्वयन|journal=Monthly Weather Review |volume=127 |issue=12 |year=1999 |pages=2741–2758 |doi=10.1175/1520-0493(1999)127<2741:AMCIOT>2.0.CO;2 |bibcode=1999MWRv..127.2741A }}</ref> फ़िल्टर जो [[गाऊसी मिश्रण]] द्वारा राज्य पीडीएफ का अनुमान लगाते हैं,<ref name="Bengtsson-2003-NFE">{{cite journal |first1=T. |last1=Bengtsson |first2=C. |last2=Snyder |first3=D. |last3=Nychka |title=उच्च आयामी प्रणालियों के लिए एक अरेखीय संयोजन फ़िल्टर की ओर|journal=Journal of Geophysical Research: Atmospheres |volume=108 |issue=D24 |year=2003 |pages=STS 2–1–10 |doi=10.1029/2002JD002900 |bibcode=2003JGRD..108.8775B |doi-access=free }}</ref> [[घनत्व अनुमान]] द्वारा कण भार की गणना के साथ कण फिल्टर का प्रकार,<ref name="Mandel-2006-PME"/>और कण फ़िल्टर#अनुक्रमिक महत्व पुनः नमूनाकरण (एसआईआर) को कम करने के लिए [[कॉची वितरण]] डेटा पीडीएफ के साथ कण फ़िल्टर का प्रकार।<ref name="vanLeeuwen-2003-VMF">{{cite journal |first=P. |last=van Leeuwen |title=बड़े पैमाने के अनुप्रयोगों के लिए एक विचरण-न्यूनीकरण फ़िल्टर|journal=Monthly Weather Review |volume=131 |year=2003 |issue=9 |pages=2071–2084 |doi=10.1175/1520-0493(2003)131<2071:AVFFLA>2.0.CO;2 |citeseerx=10.1.1.7.3719 |bibcode=2003MWRv..131.2071V }}</ref> | ||
Revision as of 17:39, 23 November 2023
एन्सेम्बल कल्मन फ़िल्टर (EnKF) पुनरावर्ती फ़िल्टर है जो बड़ी संख्या में चर वाली समस्याओं के लिए उपयुक्त है, जैसे कि भूभौतिकीय मॉडल में आंशिक अंतर समीकरणों का विवेकीकरण। EnKF की उत्पत्ति बड़ी समस्याओं के लिए कलमन फ़िल्टर के संस्करण के रूप में हुई (अनिवार्य रूप से, सहप्रसरण मैट्रिक्स को नमूना सहप्रसरण मैट्रिक्स द्वारा प्रतिस्थापित किया जाता है), और यह अब संयोजन पूर्वानुमान का महत्वपूर्ण डेटा आत्मसात घटक है। EnKF कण फिल्टर से संबंधित है (इस संदर्भ में, कण समूह सदस्य के समान है) लेकिन EnKF यह धारणा बनाता है कि इसमें शामिल सभी संभाव्यता वितरण सामान्य वितरण हैं; जब यह लागू होता है, तो यह कण फिल्टर की तुलना में बहुत अधिक कुशल होता है।
परिचय
एन्सेम्बल कल्मन फ़िल्टर (EnKF) बायेसियन अनुमान समस्या का मोंटे कार्लो विधि कार्यान्वयन है: मॉडल किए गए सिस्टम की स्थिति (पूर्व संभावना, जिसे अक्सर भूविज्ञान में पूर्वानुमान कहा जाता है) और डेटा संभावना की संभाव्यता घनत्व फ़ंक्शन (पीडीएफ) दी गई है। , बेयस प्रमेय का उपयोग डेटा संभावना को ध्यान में रखने के बाद पीडीएफ प्राप्त करने के लिए किया जाता है (पोस्टीरियर संभावना, जिसे अक्सर विश्लेषण कहा जाता है)। इसे बायेसियन अपडेट कहा जाता है। बायेसियन अपडेट को समय-समय पर नए डेटा को शामिल करते हुए मॉडल को आगे बढ़ाने के साथ जोड़ा जाता है। मूल कलमैन फ़िल्टर, 1960 में प्रस्तुत किया गया,[1] मानता है कि सभी पीडीएफ सामान्य वितरण (गॉसियन धारणा) हैं और बायेसियन अपडेट द्वारा माध्य और सहप्रसरण मैट्रिक्स के परिवर्तन के लिए बीजगणितीय सूत्र प्रदान करता है, साथ ही समय में माध्य और सहप्रसरण को आगे बढ़ाने के लिए सूत्र प्रदान करता है, बशर्ते सिस्टम रैखिक हो। हालाँकि, उच्च-आयामी प्रणालियों के लिए सहप्रसरण मैट्रिक्स को बनाए रखना कम्प्यूटेशनल रूप से संभव नहीं है। इस कारण से, EnKFs विकसित किए गए थे।[2][3] EnKFs राज्य वैक्टरों के संग्रह का उपयोग करके सिस्टम स्थिति के वितरण का प्रतिनिधित्व करते हैं, जिसे संख्यात्मक मौसम पूर्वानुमान#एनसेम्बल कहा जाता है, और सहप्रसरण मैट्रिक्स को समुच्चय से गणना किए गए नमूना सहप्रसरण द्वारा प्रतिस्थापित करते हैं। समूह को ऐसे संचालित किया जाता है जैसे कि यह यादृच्छिक नमूना हो, लेकिन समूह के सदस्य वास्तव में सांख्यिकीय स्वतंत्रता नहीं रखते हैं, क्योंकि वे सभी EnKF साझा करते हैं। EnKFs का फायदा यह है कि पीडीएफ को समय पर आगे बढ़ाने का काम केवल समूह के प्रत्येक सदस्य को आगे बढ़ाना है।[4]
व्युत्पत्ति
कलमैन फ़िल्टर
होने देना निरूपित करें मॉडल का -आयामी राज्य स्थान प्रतिनिधित्व, और मान लें कि इसका माध्य के साथ सामान्य वितरण है और सहप्रसरण यानी कि इसका पीडीएफ है
यहाँ और नीचे, मतलब आनुपातिक; पीडीएफ को हमेशा स्केल किया जाता है ताकि पूरे स्थान पर इसका अभिन्न अंग हो। यह , जिसे पूर्व संभाव्यता कहा जाता है, मॉडल को चलाकर समय पर विकसित किया गया था और अब इसे नए डेटा के लिए अद्यतन किया जाना है। यह मान लेना स्वाभाविक है कि डेटा का त्रुटि वितरण ज्ञात है; डेटा को त्रुटि अनुमान के साथ आना होगा, अन्यथा वे अर्थहीन हैं। यहाँ, डेटा ऐसा माना जाता है कि इसमें सहप्रसरण के साथ गॉसियन पीडीएफ है और मतलब , कहाँ तथाकथित टोपी मैट्रिक्स है। सहप्रसरण मैट्रिक्स डेटा की त्रुटि के अनुमान का वर्णन करता है; यदि डेटा वेक्टर की प्रविष्टियों में यादृच्छिक त्रुटियाँ हैं स्वतंत्र हैं, विकर्ण है और इसकी विकर्ण प्रविष्टियाँ डेटा वेक्टर की संबंधित प्रविष्टियों की त्रुटि के मानक विचलन ("त्रुटि आकार") के वर्ग हैं . मूल्य राज्य के लिए डेटा का मूल्य क्या होगा डेटा त्रुटियों के अभाव में. फिर संभाव्यता घनत्व डेटा का सिस्टम स्थिति की सशर्तता , जिसे संभावना फ़ंक्शन कहा जाता है, है
सिस्टम स्थिति की नई संभाव्यता घनत्व देने के लिए राज्य की पीडीएफ और संभावना फ़ंक्शन को संयोजित किया जाता है डेटा के मूल्य पर सशर्त (पश्च संभाव्यता) बेयस प्रमेय द्वारा#संभाव्यता घनत्व के लिए बेयस प्रमेय,
आंकड़ा बार प्राप्त होने के बाद यह तय हो जाता है, इसलिए पिछली स्थिति को इससे निरूपित करें के बजाय और पिछला पीडीएफ़ द्वारा . इसे बीजगणितीय जोड़-तोड़ द्वारा दिखाया जा सकता है[5] पिछला पीडीएफ भी गॉसियन है,
पश्च माध्य के साथ और सहप्रसरण कलमैन अद्यतन फ़ार्मुलों द्वारा दिया गया
कहाँ
तथाकथित कलमन फिल्टर#कलमैन लाभ व्युत्पत्ति मैट्रिक्स है।
कलामन फ़िल्टर इकट्ठा करें
EnKF कलमैन फ़िल्टर का मोंटे कार्लो सन्निकटन है, जो राज्य वेक्टर के पीडीएफ के सहप्रसरण मैट्रिक्स को विकसित करने से बचाता है . इसके बजाय, पीडीएफ को समूह द्वारा दर्शाया जाता है
मैट्रिक्स जिसके कॉलम समूह सदस्य हैं, और इसे पूर्व समूह कहा जाता है। आदर्श रूप से, समूह के सदस्य पूर्व वितरण से यादृच्छिक नमूना बनाएंगे। हालाँकि, प्रारंभिक समूह को छोड़कर समूह के सदस्य सामान्य रूप से सांख्यिकीय स्वतंत्रता में नहीं हैं, क्योंकि प्रत्येक EnKF कदम उन्हें साथ जोड़ता है। उन्हें लगभग स्वतंत्र माना जाता है, और सभी गणनाएँ ऐसे आगे बढ़ती हैं मानो वे वास्तव में स्वतंत्र हों।
डेटा को दोहराएँ में आव्यूह
ताकि प्रत्येक कॉलम डेटा वेक्टर से मिलकर बनता है प्लस से यादृच्छिक वेक्टर -आयामी सामान्य वितरण . यदि, इसके अतिरिक्त, के कॉलम पूर्व संभाव्यता वितरण से नमूना है, फिर के कॉलम
पश्च संभाव्यता वितरण से नमूना बनाएं। इसे अदिश मामले में देखने के लिए : होने देना , और तब
- .
पहला योग पश्च माध्य है, और दूसरे योग में, स्वतंत्रता को ध्यान में रखते हुए, भिन्नता है
- ,
जो पश्च विचरण है।
EnKF अब केवल राज्य सहप्रसरण को प्रतिस्थापित करके प्राप्त किया जाता है कलमन गेन मैट्रिक्स में नमूना सहप्रसरण द्वारा समूह के सदस्यों से गणना की गई (जिसे समूह सहप्रसरण कहा जाता है),[6] वह है:
कार्यान्वयन
बुनियादी सूत्रीकरण
यहां हम अनुसरण करते हैं।[7][8] मान लीजिए कि संयोजन मैट्रिक्स और डेटा मैट्रिक्स उपरोक्तानुसार हैं. समुच्चय माध्य और सहप्रसरण हैं
कहाँ
और संकेतित आकार के सभी के मैट्रिक्स को दर्शाता है।
पीछे का पहनावा फिर द्वारा दिया जाता है
जहां परेशान डेटा मैट्रिक्स ऊपर जैसा है.
ध्यान दें कि तब से सहप्रसरण मैट्रिक्स है, यह हमेशा सकारात्मक अर्धनिश्चित मैट्रिक्स होता है और आमतौर पर सकारात्मक अर्धनिश्चित मैट्रिक्स होता है, इसलिए उपरोक्त व्युत्क्रम मौजूद है और सूत्र कोलेस्की अपघटन द्वारा कार्यान्वित किया जा सकता है।[9] में,[7][8] नमूना सहप्रसरण द्वारा प्रतिस्थापित किया जाता है कहाँ और व्युत्क्रम को छद्म व्युत्क्रम से बदल दिया जाता है, जिसकी गणना एकवचन-मूल्य अपघटन (एसवीडी) का उपयोग करके की जाती है।
चूँकि ये सूत्र प्रमुख BLAS#स्तर 3 ऑपरेशन वाले मैट्रिक्स ऑपरेशन हैं,[10] वे LAPACK (सीरियल और साझा स्मृति वास्तुकला कंप्यूटर पर) और ScaLAPACK (वितरित मेमोरी कंप्यूटर पर) जैसे सॉफ़्टवेयर पैकेजों का उपयोग करके कुशल कार्यान्वयन के लिए उपयुक्त हैं।[9]किसी मैट्रिक्स के व्युत्क्रम मैट्रिक्स की गणना करने और उससे गुणा करने के बजायउलटा मैट्रिक्स के चॉलेस्की अपघटन की गणना करना और व्युत्क्रम द्वारा गुणन को कई के साथ रैखिक प्रणाली के समाधान के रूप में मानना बहुत बेहतर (कई गुना सस्ता और अधिक सटीक) है साथ दाहिनी ओर।[10]
अवलोकन मैट्रिक्स-मुक्त कार्यान्वयन
चूँकि हमने सहप्रसरण मैट्रिक्स को असेंबल सहप्रसरण के साथ बदल दिया है, इससे सरल सूत्र तैयार होता है जहाँ मैट्रिक्स को स्पष्ट रूप से निर्दिष्ट किए बिना समुच्चय अवलोकनों का सीधे उपयोग किया जाता है। . अधिक विशेष रूप से, किसी फ़ंक्शन को परिभाषित करें रूप का
कार्यक्रम इसे अवलोकन फ़ंक्शन कहा जाता है या, व्युत्क्रम समस्याओं के संदर्भ में, व्युत्क्रम समस्या # व्युत्क्रम समस्याओं का संभाव्य सूत्रीकरण कहा जाता है। का मान है राज्य के लिए डेटा का मूल्य क्या होगा यह मानते हुए कि माप सटीक है। फिर पीछे के पहनावे को फिर से लिखा जा सकता है
कहाँ
और
साथ
नतीजतन, अवलोकन फ़ंक्शन का मूल्यांकन करके संयोजन अद्यतन की गणना की जा सकती है प्रत्येक समूह सदस्य पर बार और मैट्रिक्स स्पष्ट रूप से जानने की आवश्यकता नहीं है। यह फार्मूला भी लागू है[9] अवलोकन समारोह के लिए निश्चित ऑफसेट के साथ , जिसे स्पष्ट रूप से जानने की भी आवश्यकता नहीं है। उपरोक्त सूत्र का उपयोग आमतौर पर अरेखीय अवलोकन फ़ंक्शन के लिए किया गया है , जैसे कि तूफान भंवर की स्थिति।[11] उस स्थिति में, अवलोकन फ़ंक्शन को अनिवार्य रूप से समूह सदस्यों पर इसके मूल्यों से रैखिक फ़ंक्शन द्वारा अनुमानित किया जाता है।
बड़ी संख्या में डेटा बिंदुओं के लिए कार्यान्वयन
बड़ी संख्या के लिए डेटा बिंदुओं का, से गुणा अड़चन बन जाता है. डेटा बिंदुओं की संख्या होने पर निम्नलिखित वैकल्पिक सूत्र लाभप्रद है बड़ा है (जैसे कि ग्रिड या पिक्सेल डेटा को आत्मसात करते समय) और डेटा त्रुटि सहप्रसरण मैट्रिक्स विकर्ण है (यह स्थिति तब होती है जब डेटा त्रुटियां असंबद्ध होती हैं), या विघटित करने के लिए सस्ता होता है (जैसे कि सीमित सहप्रसरण दूरी के कारण बैंडेड)। शर्मन-मॉरिसन-वुडबरी फॉर्मूला का उपयोग करना[12]
साथ
देता है
जिसके लिए केवल मैट्रिक्स वाले सिस्टम के समाधान की आवश्यकता होती है (सस्ता माना जाता है) और आकार की प्रणाली साथ दाहिनी ओर. देखना[9]ऑपरेशन गणना के लिए.
आगे का विस्तार
यहां वर्णित EnKF संस्करण में डेटा का यादृच्छिककरण शामिल है। डेटा के यादृच्छिकीकरण के बिना फ़िल्टर के लिए, देखें।[13][14][15] चूंकि समूह सहप्रसरण में रैंक की कमी है (समूह सदस्यों की तुलना में कई अधिक राज्य चर हैं, आम तौर पर लाखों, आमतौर पर सौ से कम), इसमें उन बिंदुओं के जोड़े के लिए बड़े शब्द हैं जो स्थानिक रूप से दूर हैं। चूँकि वास्तव में दूर के स्थानों पर भौतिक क्षेत्रों के मान इतने सहसंबद्ध नहीं हैं, दूरी के आधार पर सहप्रसरण मैट्रिक्स को कृत्रिम रूप से कम कर दिया जाता है, जो स्थानीयकृत कलमैन फ़िल्टर एल्गोरिदम को जन्म देता है।[16][17] ये विधियां गणनाओं में उपयोग किए जाने वाले सहप्रसरण मैट्रिक्स को संशोधित करती हैं और परिणामस्वरूप, पीछे का पहनावा अब केवल पिछले संयोजन के रैखिक संयोजनों से नहीं बना है।
गैर-रेखीय समस्याओं के लिए, EnKF गैर-भौतिक अवस्थाओं के साथ पश्च संयोजन बना सकता है। इसे तिखोनोव नियमितीकरण द्वारा कम किया जा सकता है, जैसे कि बड़े स्थानिक ग्रेडियेंट वाले राज्यों की दंड विधि।[6]
सुसंगत विशेषताओं वाली समस्याओं, जैसे कि तूफान, तूफान, आग रेखा , तूफान रेखा और बारिश के मोर्चों के लिए, अंतरिक्ष (इसके ग्रिड) में राज्य को विकृत करके और साथ ही राज्य के आयामों को सही करके संख्यात्मक मॉडल स्थिति को समायोजित करने की आवश्यकता है। . 2007 में, रवेला एट अल। एनसेंबल का उपयोग करके संयुक्त स्थिति-आयाम समायोजन मॉडल पेश करें, और व्यवस्थित रूप से अनुक्रमिक सन्निकटन प्राप्त करें जिसे एनकेएफ और अन्य फॉर्मूलेशन दोनों पर लागू किया जा सकता है।[18] उनकी पद्धति यह धारणा नहीं बनाती है कि आयाम और स्थिति त्रुटियां स्वतंत्र या संयुक्त रूप से गॉसियन हैं, जैसा कि अन्य करते हैं। रूप बदलना एनकेएफ राज्यों के रैखिक संयोजनों के बजाय, छवि पंजीकरण और मॉर्फिंग से उधार ली गई तकनीकों द्वारा प्राप्त मध्यवर्ती राज्यों को नियोजित करता है।[19][20] औपचारिक रूप से, EnKF गॉसियन धारणा पर भरोसा करते हैं। व्यवहार में इनका उपयोग अरैखिक समस्याओं के लिए भी किया जा सकता है, जहां गॉसियन धारणा संतुष्ट नहीं हो सकती है। एनकेएफ में गॉसियन धारणा को शिथिल करने का प्रयास करने वाले संबंधित फिल्टर, इसके फायदों को संरक्षित करते हुए, इसमें ऐसे फिल्टर शामिल हैं जो कई गॉसियन कर्नेल के साथ राज्य पीडीएफ को फिट करते हैं,[21] फ़िल्टर जो गाऊसी मिश्रण द्वारा राज्य पीडीएफ का अनुमान लगाते हैं,[22] घनत्व अनुमान द्वारा कण भार की गणना के साथ कण फिल्टर का प्रकार,[20]और कण फ़िल्टर#अनुक्रमिक महत्व पुनः नमूनाकरण (एसआईआर) को कम करने के लिए कॉची वितरण डेटा पीडीएफ के साथ कण फ़िल्टर का प्रकार।[23]
यह भी देखें
- डेटा आत्मसात
- संख्यात्मक मौसम भविष्यवाणी#समूह
- कण फिल्टर
- पुनरावर्ती बायेसियन अनुमान
संदर्भ
- ↑ Kalman, R. E. (1960). "रेखीय छानने और भविष्यवाणी की समस्याओं के लिए एक नया दृष्टिकोण". Journal of Basic Engineering. 82 (1): 35–45. doi:10.1115/1.3662552. S2CID 1242324.
- ↑ Evensen, G. (1994). "त्रुटि आँकड़ों का पूर्वानुमान लगाने के लिए मोंटे कार्लो विधियों का उपयोग करके गैर-रेखीय अर्ध-जियोस्ट्रोफिक मॉडल के साथ अनुक्रमिक डेटा आत्मसात". Journal of Geophysical Research. 99 (C5): 143–162. Bibcode:1994JGR....9910143E. doi:10.1029/94JC00572. hdl:1956/3035.
- ↑ Houtekamer, P.; Mitchell, H. L. (1998). "एन्सेम्बल कलमैन फ़िल्टर तकनीक का उपयोग करके डेटा आत्मसात करना". Monthly Weather Review. 126 (3): 796–811. Bibcode:1998MWRv..126..796H. CiteSeerX 10.1.1.3.1706. doi:10.1175/1520-0493(1998)126<0796:DAUAEK>2.0.CO;2.
- ↑ For a survey of EnKF and related data assimilation techniques, see Evensen, G. (2007). Data Assimilation : The Ensemble Kalman Filter. Berlin: Springer. ISBN 978-3-540-38300-0.
- ↑ Anderson, B. D. O.; Moore, J. B. (1979). इष्टतम फ़िल्टरिंग. Englewood Cliffs, NJ: Prentice-Hall. ISBN 978-0-13-638122-8.
- ↑ 6.0 6.1 Johns, C. J.; Mandel, J. (2008). "सहज डेटा सम्मिश्रण के लिए दो चरणों वाला कलमैन फ़िल्टर". Environmental and Ecological Statistics. 15 (1): 101–110. CiteSeerX 10.1.1.67.4916. doi:10.1007/s10651-007-0033-0. S2CID 14820232.
- ↑ 7.0 7.1 Burgers, G.; van Leeuwen, P. J.; Evensen, G. (1998). "एन्सेम्बल कलमन फ़िल्टर में विश्लेषण योजना". Monthly Weather Review. 126 (6): 1719–1724. Bibcode:1998MWRv..126.1719B. CiteSeerX 10.1.1.41.5827. doi:10.1175/1520-0493(1998)126<1719:ASITEK>2.0.CO;2.
- ↑ 8.0 8.1 Evensen, G. (2003). "The Ensemble Kalman Filter: Theoretical Formulation and Practical Implementation". Ocean Dynamics. 53 (4): 343–367. Bibcode:2003OcDyn..53..343E. CiteSeerX 10.1.1.5.6990. doi:10.1007/s10236-003-0036-9. S2CID 129233333.
- ↑ 9.0 9.1 9.2 9.3 Mandel, J. (June 2006). "एन्सेम्बल कलमन फ़िल्टर का कुशल कार्यान्वयन" (PDF). Center for Computational Mathematics Reports. University of Colorado at Denver and Health Sciences Center. 231.
- ↑ 10.0 10.1 Golub, G. H.; Loan, C. F. V. (1989). मैट्रिक्स संगणना (Second ed.). Baltimore: Johns Hopkins Univ. Press. ISBN 978-0-8018-3772-2.
- ↑ Chen, Y.; Snyder, C. (2007). "एन्सेम्बल कलमन फ़िल्टर के साथ भंवर स्थिति को आत्मसात करना". Monthly Weather Review. 135 (5): 1828–1845. Bibcode:2007MWRv..135.1828C. doi:10.1175/MWR3351.1.
- ↑ Hager, W. W. (1989). "मैट्रिक्स के व्युत्क्रम को अद्यतन करना". SIAM Review. 31 (2): 221–239. doi:10.1137/1031049.
- ↑ Anderson, J. L. (2001). "डेटा सम्मिश्रण के लिए एक संयोजन समायोजन कलमन फ़िल्टर". Monthly Weather Review. 129 (12): 2884–2903. Bibcode:2001MWRv..129.2884A. CiteSeerX 10.1.1.5.9952. doi:10.1175/1520-0493(2001)129<2884:AEAKFF>2.0.CO;2.
- ↑ Evensen, G. (2004). "EnKF के लिए नमूनाकरण रणनीतियाँ और वर्गमूल विश्लेषण योजनाएँ". Ocean Dynamics. 54 (6): 539–560. Bibcode:2004OcDyn..54..539E. CiteSeerX 10.1.1.3.6213. doi:10.1007/s10236-004-0099-2. S2CID 120171951.
- ↑ Tippett, M. K.; Anderson, J. L.; Bishop, C. H.; Hamill, T. M.; Whitaker, J. S. (2003). "वर्गमूल फिल्टरों को इकट्ठा करें". Monthly Weather Review. 131 (7): 1485–1490. Bibcode:2003MWRv..131.1485T. CiteSeerX 10.1.1.332.775. doi:10.1175/1520-0493(2003)131<1485:ESRF>2.0.CO;2.
- ↑ Anderson, J. L. (2003). "संयोजन फ़िल्टरिंग के लिए एक स्थानीय न्यूनतम वर्ग ढाँचा". Monthly Weather Review. 131 (4): 634–642. Bibcode:2003MWRv..131..634A. CiteSeerX 10.1.1.10.6543. doi:10.1175/1520-0493(2003)131<0634:ALLSFF>2.0.CO;2.
- ↑ Ott, E.; Hunt, B. R.; Szunyogh, I.; Zimin, A. V.; Kostelich, E. J.; Corazza, M.; Kalnay, E.; Patil, D.; Yorke, J. A. (2004). "वायुमंडलीय डेटा सम्मिलन के लिए एक स्थानीय पहनावा कलमन फ़िल्टर". Tellus A. 56 (5): 415–428. arXiv:physics/0203058. Bibcode:2004TellA..56..415O. doi:10.3402/tellusa.v56i5.14462. S2CID 218577557.
- ↑ Ravela, S.; Emanuel, K.; McLaughlin, D. (2007). "फ़ील्ड संरेखण द्वारा डेटा सम्मिलन". Physica. D: Nonlinear Phenomena. 230 (1–2): 127–145. Bibcode:2007PhyD..230..127R. doi:10.1016/j.physd.2006.09.035.
- ↑ Beezley, J. D.; Mandel, J. (2008). "मॉर्फ़िंग पहनावा कलमन फ़िल्टर". Tellus A. 60 (1): 131–140. arXiv:0705.3693. Bibcode:2008TellA..60..131B. doi:10.1111/j.1600-0870.2007.00275.x. S2CID 1009227.
- ↑ 20.0 20.1 Mandel, J.; Beezley, J. D. (November 2006). उच्च आयामी नॉनलाइनर सिस्टम में विरल डेटा को आत्मसात करने के लिए प्रीडिक्टर-करेक्टर और मॉर्फिंग एसेंबल फिल्टर (PDF). 11th Symposium on Integrated Observing and Assimilation Systems for the Atmosphere, Oceans, and Land Surface (IOAS-AOLS), CD-ROM, Paper 4.12, 87th American Meteorological Society Annual Meeting, San Antonio, TX, January 2007. CCM Report 239. University of Colorado at Denver and Health Sciences Center.
- ↑ Anderson, J. L.; Anderson, S. L. (1999). "सामूहिक सम्मिलन और पूर्वानुमान उत्पन्न करने के लिए नॉनलाइनियर फ़िल्टरिंग समस्या का मोंटे कार्लो कार्यान्वयन". Monthly Weather Review. 127 (12): 2741–2758. Bibcode:1999MWRv..127.2741A. doi:10.1175/1520-0493(1999)127<2741:AMCIOT>2.0.CO;2.
- ↑ Bengtsson, T.; Snyder, C.; Nychka, D. (2003). "उच्च आयामी प्रणालियों के लिए एक अरेखीय संयोजन फ़िल्टर की ओर". Journal of Geophysical Research: Atmospheres. 108 (D24): STS 2–1–10. Bibcode:2003JGRD..108.8775B. doi:10.1029/2002JD002900.
- ↑ van Leeuwen, P. (2003). "बड़े पैमाने के अनुप्रयोगों के लिए एक विचरण-न्यूनीकरण फ़िल्टर". Monthly Weather Review. 131 (9): 2071–2084. Bibcode:2003MWRv..131.2071V. CiteSeerX 10.1.1.7.3719. doi:10.1175/1520-0493(2003)131<2071:AVFFLA>2.0.CO;2.
बाहरी संबंध
- EnKF webpage
- TOPAZ, real-time forecasting of the North Atlantic ocean and Arctic sea-ice with the EnKF
- EnKF-C, a compact framework for data assimilation into large-scale layered geophysical models with the EnKF
- PDAF – Parallel Data Assimilation Framework – an open-source software for data assimilation providing different variants of the EnKF