अदृश्य मार्कोव मॉडल: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{short description|Statistical Markov model}} | {{short description|Statistical Markov model}} | ||
अदृश्य [[मार्कोव मॉडल|मार्कोव]] प्रारूप (एचएमएम) [[सांख्यिकीय मॉडल|सांख्यिकीय]] मार्कोव प्रारूप है जिसमें गणितीय प्रारूप वाली प्रणाली को [[मार्कोव प्रक्रिया]] माना जाता है- इसे कॉल करें <math> X </math> - अप्राप्य ( | अदृश्य [[मार्कोव मॉडल|मार्कोव]] प्रारूप (एचएमएम) [[सांख्यिकीय मॉडल|सांख्यिकीय]] मार्कोव प्रारूप है जिसमें गणितीय प्रारूप वाली प्रणाली को [[मार्कोव प्रक्रिया]] माना जाता है- इसे कॉल करें <math> X </math> - अप्राप्य (अदृश्य) अवस्थाओं के साथ। परिभाषा के भाग के रूप में, एचएमएम की आवश्यकता है कि अवलोकन योग्य प्रक्रिया हो <math> Y </math> जिनके परिणाम के प्रभाव से प्रभावित होते हैं <math>X</math> ज्ञात तरीके से। तब से <math> X </math> प्रत्यक्ष रूप से नहीं देखा जा सकता है, लक्ष्य के बारे में सीखना है <math>X</math> अवलोकन करके <math> Y. </math> एचएमएम की अतिरिक्त आवश्यकता है कि इसका परिणाम <math> Y </math> समय पर <math> t = t_0 </math> के परिणाम से विशेष रूप से प्रभावित होना चाहिए <math> X </math> पर <math> t = t_0 </math> और इसके परिणाम <math> X </math> और <math> Y </math> पर <math> t < t_0 </math> से सशर्त रूप से स्वतंत्र होना चाहिए <math> Y </math> पर <math> t=t_0 </math> दिया गया <math> X </math> समय पर <math> t = t_0. </math> | ||
अदृश्य मार्कोव प्रारूप [[ऊष्मप्रवैगिकी]], [[सांख्यिकीय यांत्रिकी]], भौतिकी, [[रसायन विज्ञान]], [[अर्थशास्त्र]], [[वित्त]], [[ संकेत आगे बढ़ाना ]], [[सूचना सिद्धांत]], पैटर्न पहचान - जैसे [[वाक् पहचान]], के लिए अपने अनुप्रयोगों के लिए जाने जाते हैं।<ref>{{cite web | url=https://scholar.google.com/scholar?q=levinson+hidden+markov+model+tutorial&hl=en&as_sdt=0&as_vis=1&oi=scholart | title=Google Scholar }}</ref> लिखावट पहचान, हावभाव पहचान,<ref>Thad Starner, Alex Pentland. [http://www.cc.gatech.edu/~thad/p/031_10_SL/real-time-asl-recognition-from%20video-using-hmm-ISCV95.pdf Real-Time American Sign Language Visual Recognition From Video Using Hidden Markov Models]. Master's Thesis, MIT, Feb 1995, Program in Media Arts</ref> [[पार्ट-ऑफ-स्पीच टैगिंग]], म्यूजिकल स्कोर फॉलोइंग,<ref>B. Pardo and W. Birmingham. [http://www.cs.northwestern.edu/~pardo/publications/pardo-birmingham-aaai-05.pdf Modeling Form for On-line Following of Musical Performances] {{Webarchive|url=https://web.archive.org/web/20120206123155/http://www.cs.northwestern.edu/~pardo/publications/pardo-birmingham-aaai-05.pdf |date=2012-02-06 }}. AAAI-05 Proc., July 2005.</ref> आंशिक निर्वहन<ref>Satish L, Gururaj BI (April 2003). "[http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=212242 Use of hidden Markov models for partial discharge pattern classification]". ''IEEE Transactions on Dielectrics and Electrical Insulation''.</ref> और जैव सूचना विज्ञान।<ref>{{cite journal|last1=Li|first1=N|last2=Stephens|first2=M|title=मॉडलिंग लिंकेज असमानता और एकल-न्यूक्लियोटाइड बहुरूपता डेटा का उपयोग करके पुनर्संयोजन हॉटस्पॉट की पहचान करना।|journal=Genetics|date=December 2003|volume=165|issue=4|pages=2213–33|doi=10.1093/genetics/165.4.2213|pmid=14704198|pmc=1462870}}</ref><ref>{{cite journal |last1=Ernst |first1=Jason |last2=Kellis |first2=Manolis |title=ChromHMM: automating chromatin-state discovery and characterization |journal=Nature Methods |date=March 2012 |volume=9 |issue=3 |pages=215–216 |doi=10.1038/nmeth.1906 |pmid=22373907 |url= |pmc=3577932 }}</ref> | |||
== परिभाषा == | == परिभाषा == | ||
होने देना <math>X_n</math> और <math>Y_n</math> असतत-समय स्टोकेस्टिक प्रक्रियाएं और <math>n\geq 1</math>. जोड़ी <math>(X_n,Y_n)</math> | होने देना <math>X_n</math> और <math>Y_n</math> असतत-समय स्टोकेस्टिक प्रक्रियाएं और <math>n\geq 1</math>. जोड़ी <math>(X_n,Y_n)</math> अदृश्य मार्कोव प्रारूप है यदि | ||
* <math>X_n</math> मार्कोव प्रक्रिया है जिसका व्यवहार प्रत्यक्ष रूप से देखने योग्य (छिपा हुआ) नहीं है; | * <math>X_n</math> मार्कोव प्रक्रिया है जिसका व्यवहार प्रत्यक्ष रूप से देखने योग्य (छिपा हुआ) नहीं है; | ||
Line 16: | Line 16: | ||
:हर के लिए <math> t_0, </math> हर बोरेल सेट <math> A, </math> और बोरेल सेट का हर परिवार <math> \{B_t\}_{t \leq t_0}. </math> | :हर के लिए <math> t_0, </math> हर बोरेल सेट <math> A, </math> और बोरेल सेट का हर परिवार <math> \{B_t\}_{t \leq t_0}. </math> | ||
=== शब्दावली === | === शब्दावली === | ||
प्रक्रिया की अवस्थाएँ <math>X_n</math> (प्रति. <math>X_t)</math> | प्रक्रिया की अवस्थाएँ <math>X_n</math> (प्रति. <math>X_t)</math> अदृश्य राज्य कहलाते हैं, और <math>\operatorname{\mathbf{P}}\bigl(Y_n \in A \mid X_n=x_n\bigr)</math> (प्रति. <math>\operatorname{\mathbf{P}}\bigl(Y_t \in A \mid X_t \in B_t\bigr))</math> उत्सर्जन संभावना या उत्पादन संभावना कहा जाता है। | ||
== उदाहरण == | == उदाहरण == | ||
=== | === अदृश्यकलश से गेंद निकालना === | ||
[[File:HiddenMarkovModel.svg|right|thumb|300px|चित्र 1. | [[File:HiddenMarkovModel.svg|right|thumb|300px|चित्र 1. अदृश्यमार्कोव प्रारूप के संभाव्य पैरामीटर (उदाहरण)<br /> | ||
एक्स — स्थिति<br /> | एक्स — स्थिति<br /> | ||
y — संभावित प्रेक्षण<br /> | y — संभावित प्रेक्षण<br /> | ||
Line 33: | Line 33: | ||
दो मित्रों, ऐलिस और बॉब पर विचार करें, जो एक-दूसरे से बहुत दूर रहते हैं और जो उस दिन के बारे में टेलीफोन पर प्रतिदिन साथ बात करते हैं। बॉब को केवल तीन गतिविधियों में दिलचस्पी है: पार्क में घूमना, खरीदारी करना और अपने अपार्टमेंट की सफाई करना। क्या करना है इसका चुनाव विशेष रूप से किसी दिए गए दिन के मौसम द्वारा निर्धारित किया जाता है। ऐलिस को मौसम के बारे में कोई निश्चित जानकारी नहीं है, लेकिन वह सामान्य रुझान जानती है। बॉब उसे जो बताता है उसके आधार पर वह हर दिन करता है, ऐलिस यह अनुमान लगाने की कोशिश करती है कि मौसम कैसा रहा होगा। | दो मित्रों, ऐलिस और बॉब पर विचार करें, जो एक-दूसरे से बहुत दूर रहते हैं और जो उस दिन के बारे में टेलीफोन पर प्रतिदिन साथ बात करते हैं। बॉब को केवल तीन गतिविधियों में दिलचस्पी है: पार्क में घूमना, खरीदारी करना और अपने अपार्टमेंट की सफाई करना। क्या करना है इसका चुनाव विशेष रूप से किसी दिए गए दिन के मौसम द्वारा निर्धारित किया जाता है। ऐलिस को मौसम के बारे में कोई निश्चित जानकारी नहीं है, लेकिन वह सामान्य रुझान जानती है। बॉब उसे जो बताता है उसके आधार पर वह हर दिन करता है, ऐलिस यह अनुमान लगाने की कोशिश करती है कि मौसम कैसा रहा होगा। | ||
ऐलिस का मानना है कि मौसम असतत [[मार्कोव श्रृंखला]] के रूप में कार्य करता है। वर्षा और सनी दो अवस्थाएँ हैं, लेकिन वह उन्हें प्रत्यक्ष रूप से नहीं देख सकती हैं, अर्थात वे उससे छिपी हुई हैं। प्रत्येक दिन, इस बात की निश्चित संभावना होती है कि बॉब मौसम के आधार पर निम्नलिखित में से कोई गतिविधि करेगा: चलना , खरीदारी करना , या साफ करना । चूँकि बॉब ऐलिस को उसकी गतिविधियों के बारे में बताता है, वे अवलोकन हैं। संपूर्ण प्रणाली | ऐलिस का मानना है कि मौसम असतत [[मार्कोव श्रृंखला]] के रूप में कार्य करता है। वर्षा और सनी दो अवस्थाएँ हैं, लेकिन वह उन्हें प्रत्यक्ष रूप से नहीं देख सकती हैं, अर्थात वे उससे छिपी हुई हैं। प्रत्येक दिन, इस बात की निश्चित संभावना होती है कि बॉब मौसम के आधार पर निम्नलिखित में से कोई गतिविधि करेगा: चलना , खरीदारी करना , या साफ करना । चूँकि बॉब ऐलिस को उसकी गतिविधियों के बारे में बताता है, वे अवलोकन हैं। संपूर्ण प्रणाली अदृश्यमार्कोव प्रारूप (HMM) की है। | ||
एलिस क्षेत्र में सामान्य मौसम के रुझान को जानती है, और बॉब औसतन क्या करना पसंद करता है। दूसरे शब्दों में, | एलिस क्षेत्र में सामान्य मौसम के रुझान को जानती है, और बॉब औसतन क्या करना पसंद करता है। दूसरे शब्दों में, एचएमएमके पैरामीटर ज्ञात हैं। उन्हें [[पायथन प्रोग्रामिंग भाषा]] में निम्नानुसार दर्शाया जा सकता है: | ||
<syntaxhighlight lang="python"> | <syntaxhighlight lang="python"> | ||
states = ("Rainy", "Sunny") | states = ("Rainy", "Sunny") | ||
Line 60: | Line 60: | ||
नीचे दिया गया चित्र तत्काल एचएमएम के सामान्य आर्किटेक्चर को दिखाता है। प्रत्येक अंडाकार आकार यादृच्छिक चर का प्रतिनिधित्व करता है जो कई मानों को अपना सकता है। यादृच्छिक चर x(t) समय पर छिपी हुई अवस्था है {{mvar|t}} (उपरोक्त आरेख से प्रारूप के साथ, x(t) ∈ { x<sub>1</sub>, एक्स<sub>2</sub>, एक्स<sub>3</sub>}). यादृच्छिक चर y(t) समय पर अवलोकन है {{mvar|t}} (y(t) ∈ { y<sub>1</sub>, और<sub>2</sub>, और<sub>3</sub>, और<sub>4</sub>}). आरेख में तीर (प्रायः [[जाली (ग्राफ)]]ग्राफ़) कहा जाता है) सशर्त निर्भरताओं को दर्शाता है। | नीचे दिया गया चित्र तत्काल एचएमएम के सामान्य आर्किटेक्चर को दिखाता है। प्रत्येक अंडाकार आकार यादृच्छिक चर का प्रतिनिधित्व करता है जो कई मानों को अपना सकता है। यादृच्छिक चर x(t) समय पर छिपी हुई अवस्था है {{mvar|t}} (उपरोक्त आरेख से प्रारूप के साथ, x(t) ∈ { x<sub>1</sub>, एक्स<sub>2</sub>, एक्स<sub>3</sub>}). यादृच्छिक चर y(t) समय पर अवलोकन है {{mvar|t}} (y(t) ∈ { y<sub>1</sub>, और<sub>2</sub>, और<sub>3</sub>, और<sub>4</sub>}). आरेख में तीर (प्रायः [[जाली (ग्राफ)]]ग्राफ़) कहा जाता है) सशर्त निर्भरताओं को दर्शाता है। | ||
आरेख से, यह स्पष्ट है कि समय पर | आरेख से, यह स्पष्ट है कि समय पर अदृश्यचर x(t) का [[सशर्त संभाव्यता वितरण]] {{mvar|t}}, अदृश्यचर के मान दिए गए हैं {{mvar|x}} हर समय, केवल अदृश्यचर x(t − 1) के मान पर निर्भर करता है; समय t − 2 और इससे पहले के मूल्यों का कोई प्रभाव नहीं है। इसे [[मार्कोव संपत्ति]] कहा जाता है। इसी तरह, प्रेक्षित चर y(t) का मान केवल अदृश्यचर x(t) के मान पर निर्भर करता है (दोनों समय पर {{mvar|t}}). | ||
यहां माने गए | यहां माने गए अदृश्यमार्कोव प्रारूप के मानक प्रकार में, अदृश्य चर का राज्य स्थान असतत है, जबकि अवलोकन स्वयं असतत हो सकते हैं (सामान्यतः स्पष्ट वितरण से उत्पन्न) या निरंतर (सामान्यतः गॉसियन वितरण से)। अदृश्यमार्कोव प्रारूप के पैरामीटर दो प्रकार के होते हैं, संक्रमण संभावनाएँ और उत्सर्जन संभावनाएँ (जिन्हें आउटपुट संभावनाएँ भी कहा जाता है)। संक्रमण की संभावनाएं समय पर अदृश्य स्थिति को नियंत्रित करती हैं {{mvar|t}} समय पर अदृश्यराज्य को चुना जाता है <math>t-1</math>. | ||
यह माना जाता है कि | यह माना जाता है कि अदृश्यराज्य स्थान में से सम्मिलित है {{mvar|N}} संभावित मान, श्रेणीबद्ध वितरण के रूप में प्रतिरूपित। (अन्य संभावनाओं के लिए एक्सटेंशन पर नीचे दिया गया अनुभाग देखें।) इसका मतलब है कि इनमें से प्रत्येक के लिए {{mvar|N}} संभावित बताता है कि समय पर अदृश्य चर {{mvar|t}} में हो सकता है, इस अवस्था से प्रत्येक में संक्रमण की संभावना है {{mvar|N}} समय पर अदृश्यचर की संभावित अवस्थाएँ <math>t+1</math>, कुल के लिए <math>N^2</math> संक्रमण की संभावनाएं। ध्यान दें कि किसी दिए गए राज्य से संक्रमण के लिए संक्रमण संभावनाओं का सेट 1 होना चाहिए। इस प्रकार, <math>N \times N</math> संक्रमण संभावनाओं का आव्यूह [[स्टोकेस्टिक मैट्रिक्स|स्टोकेस्टिक आव्यूह]] है। क्योंकि किसी भी संक्रमण संभावना को बार अन्य ज्ञात होने के बाद निर्धारित किया जा सकता है, कुल मिलाकर <math>N(N-1)</math> संक्रमण पैरामीटर। | ||
इसके अलावा, प्रत्येक के लिए {{mvar|N}} संभावित राज्यों, उस समय | इसके अलावा, प्रत्येक के लिए {{mvar|N}} संभावित राज्यों, उस समय अदृश्य चर की स्थिति को देखते हुए किसी विशेष समय पर देखे गए चर के वितरण को नियंत्रित करने वाली उत्सर्जन संभावनाओं का सेट होता है। इस सेट का आकार देखे गए चर की प्रकृति पर निर्भर करता है। उदाहरण के लिए, यदि प्रेक्षित चर असतत है {{mvar|M}} संभावित मान, श्रेणीबद्ध वितरण द्वारा शासित होंगे <math>M-1</math> अलग पैरामीटर, कुल के लिए <math>N(M-1)</math> सभी अदृश्यराज्यों पर उत्सर्जन पैरामीटर। दूसरी ओर, यदि प्रेक्षित चर है {{mvar|M}}-आयामी सदिश मनमाना [[बहुभिन्नरूपी गाऊसी वितरण]] के अनुसार वितरित किया जाएगा {{mvar|M}} पैरामीटर साधनों को नियंत्रित करते हैं और <math>\frac {M(M+1)} 2</math> सहप्रसरण आव्यूह को नियंत्रित करने वाले पैरामीटर, कुल के लिए <math>N \left(M + \frac{M(M+1)}{2}\right) = \frac {NM(M+3)} 2 = O(NM^2)</math> उत्सर्जन पैरामीटर। (ऐसी स्थिति में, जब तक कि का मान {{mvar|M}} छोटा है, अवलोकन वेक्टर के अलग-अलग तत्वों के मध्य सहप्रसरण की प्रकृति को प्रतिबंधित करना अधिक व्यावहारिक हो सकता है, उदा। यह मानते हुए कि तत्व दूसरे से स्वतंत्र हैं, या कम प्रतिबंधात्मक रूप से, आसन्न तत्वों की निश्चित संख्या को छोड़कर सभी से स्वतंत्र हैं।) | ||
[[File:hmm temporal bayesian net.svg|500px|center| | [[File:hmm temporal bayesian net.svg|500px|center|अदृश्यमार्कोव प्रारूप का अस्थायी विकास]] | ||
== निष्कर्ष == | == निष्कर्ष == | ||
Line 75: | Line 75: | ||
4 3 2 5 3 2<br /> | 4 3 2 5 3 2<br /> | ||
3 1 2 5 3 2<br /> | 3 1 2 5 3 2<br /> | ||
हम राज्य अनुक्रम और प्रत्येक मामले के अवलोकन दोनों की संयुक्त संभावना का मूल्यांकन करके सबसे अधिक संभावित अनुक्रम पा सकते हैं (केवल प्रायिकता मानों को गुणा करके, जो यहां सम्मिलित तीरों की अस्पष्टता के अनुरूप हैं)। सामान्यतः , इस प्रकार की समस्या (अर्थात अवलोकन अनुक्रम के लिए सबसे अधिक संभावित स्पष्टीकरण खोजना) को [[विटरबी एल्गोरिथ्म]] का उपयोग करके कुशलता से हल किया जा सकता है।]] | हम राज्य अनुक्रम और प्रत्येक मामले के अवलोकन दोनों की संयुक्त संभावना का मूल्यांकन करके सबसे अधिक संभावित अनुक्रम पा सकते हैं (केवल प्रायिकता मानों को गुणा करके, जो यहां सम्मिलित तीरों की अस्पष्टता के अनुरूप हैं)। सामान्यतः , इस प्रकार की समस्या (अर्थात अवलोकन अनुक्रम के लिए सबसे अधिक संभावित स्पष्टीकरण खोजना) को [[विटरबी एल्गोरिथ्म]] का उपयोग करके कुशलता से हल किया जा सकता है।]]अदृश्यमार्कोव प्रारूप के साथ कई [[अनुमान]] समस्याएं जुड़ी हुई हैं, जैसा कि नीचे बताया गया है। | ||
=== देखे गए अनुक्रम की संभावना === | === देखे गए अनुक्रम की संभावना === | ||
Line 91: | Line 91: | ||
प्रारूप के मापदंडों और टिप्पणियों के अनुक्रम को देखते हुए कई संबंधित कार्य या अधिक अव्यक्त चर की संभावना के बारे में पूछते हैं <math>y(1),\dots,y(t).</math> | प्रारूप के मापदंडों और टिप्पणियों के अनुक्रम को देखते हुए कई संबंधित कार्य या अधिक अव्यक्त चर की संभावना के बारे में पूछते हैं <math>y(1),\dots,y(t).</math> | ||
==== छानना ==== | ==== छानना ==== | ||
कार्य गणना करना है, प्रारूप के पैरामीटर और अवलोकनों का अनुक्रम दिया गया है, अनुक्रम के अंत में अंतिम गुप्त चर के | कार्य गणना करना है, प्रारूप के पैरामीटर और अवलोकनों का अनुक्रम दिया गया है, अनुक्रम के अंत में अंतिम गुप्त चर के अदृश्य राज्यों पर वितरण, यानी गणना करने के लिए <math>P(x(t)\ |\ y(1),\dots,y(t))</math>. यह कार्य सामान्य रूप से तब उपयोग किया जाता है जब अव्यक्त चर के अनुक्रम को अंतर्निहित राज्यों के रूप में माना जाता है कि समय के प्रत्येक बिंदु पर संबंधित टिप्पणियों के साथ प्रक्रिया समय के बिंदुओं के अनुक्रम से गुजरती है। फिर, अंत में प्रक्रिया की स्थिति के बारे में पूछना स्वाभाविक है। | ||
फॉरवर्ड एल्गोरिथम का उपयोग करके इस समस्या को कुशलता से नियंत्रित किया जा सकता है। | फॉरवर्ड एल्गोरिथम का उपयोग करके इस समस्या को कुशलता से नियंत्रित किया जा सकता है। | ||
==== चौरसाई ==== | ==== चौरसाई ==== | ||
यह फ़िल्टरिंग के समान है लेकिन अनुक्रम के मध्य में कहीं गुप्त चर के वितरण के बारे में पूछता है, यानी गणना करने के लिए <math>P(x(k)\ |\ y(1), \dots, y(t))</math> कुछ के लिए <math>k < t</math>. ऊपर वर्णित परिप्रेक्ष्य से, इसे समय टी के सापेक्ष अतीत में बिंदु k के लिए | यह फ़िल्टरिंग के समान है लेकिन अनुक्रम के मध्य में कहीं गुप्त चर के वितरण के बारे में पूछता है, यानी गणना करने के लिए <math>P(x(k)\ |\ y(1), \dots, y(t))</math> कुछ के लिए <math>k < t</math>. ऊपर वर्णित परिप्रेक्ष्य से, इसे समय टी के सापेक्ष अतीत में बिंदु k के लिए अदृश्यराज्यों पर संभाव्यता वितरण के रूप में माना जा सकता है। | ||
[[आगे-पीछे एल्गोरिदम]] सभी | [[आगे-पीछे एल्गोरिदम]] सभी अदृश्य स्टेट वेरिएबल्स के लिए स्मूथ वैल्यू की गणना करने के लिए अच्छा तरीका है। | ||
==== सबसे अधिक संभावना स्पष्टीकरण ==== | ==== सबसे अधिक संभावना स्पष्टीकरण ==== | ||
कार्य, पिछले दो के विपरीत, | कार्य, पिछले दो के विपरीत, अदृश्यराज्यों के पूरे अनुक्रम की संयुक्त संभावना के बारे में पूछता है जो टिप्पणियों का विशेष अनुक्रम उत्पन्न करता है (दाईं ओर चित्रण देखें)। यह कार्य सामान्यतः तब लागू होता है जब एचएमएम को विभिन्न प्रकार की समस्याओं पर लागू किया जाता है, जिनके लिए फ़िल्टरिंग और स्मूथिंग के कार्य लागू होते हैं। उदाहरण पार्ट-ऑफ-स्पीच टैगिंग है, जहां अदृश्य राज्य शब्दों के देखे गए अनुक्रम के अनुरूप अंतर्निहित पार्ट-ऑफ-स्पीच टैगिंग का प्रतिनिधित्व करते हैं। इस मामले में, रुचि का क्या है, भाषण के कुछ हिस्सों का पूरा क्रम, न कि केवल शब्द के लिए भाषण का हिस्सा, जैसा कि फ़िल्टरिंग या स्मूथिंग गणना करेगा। | ||
इस कार्य के लिए सभी संभावित राज्य अनुक्रमों में अधिकतम खोजने की आवश्यकता है, और Viterbi एल्गोरिथ्म द्वारा कुशलतापूर्वक हल किया जा सकता है। | इस कार्य के लिए सभी संभावित राज्य अनुक्रमों में अधिकतम खोजने की आवश्यकता है, और Viterbi एल्गोरिथ्म द्वारा कुशलतापूर्वक हल किया जा सकता है। | ||
Line 110: | Line 110: | ||
== सीखना == | == सीखना == | ||
एचएमएम में पैरामीटर सीखने का कार्य आउटपुट अनुक्रम या ऐसे अनुक्रमों का सेट, राज्य संक्रमण और उत्सर्जन संभावनाओं का सबसे अच्छा सेट खोजना है। कार्य सामान्यतः आउटपुट अनुक्रमों के सेट को देखते हुए | एचएमएम में पैरामीटर सीखने का कार्य आउटपुट अनुक्रम या ऐसे अनुक्रमों का सेट, राज्य संक्रमण और उत्सर्जन संभावनाओं का सबसे अच्छा सेट खोजना है। कार्य सामान्यतः आउटपुट अनुक्रमों के सेट को देखते हुए एचएमएमके मापदंडों के अधिकतम संभावना अनुमान को प्राप्त करने के लिए होता है। इस समस्या को ठीक से हल करने के लिए कोई ट्रैक्टेबल एल्गोरिदम नहीं जाना जाता है, लेकिन बॉम-वेल्च एल्गोरिदम या बाल्दी-चाउविन एल्गोरिदम का उपयोग करके स्थानीय अधिकतम संभावना कुशलतापूर्वक प्राप्त की जा सकती है। बॉम-वेल्च एल्गोरिथम [[अपेक्षा-अधिकतमकरण एल्गोरिथम]] का विशेष मामला है। | ||
यदि एचएमएम का उपयोग समय श्रृंखला भविष्यवाणी के लिए किया जाता है, तो [[मार्कोव चेन मोंटे कार्लो]] (एमसीएमसी) नमूनाकरण जैसे अधिक परिष्कृत बायेसियन अनुमान पद्धति सटीकता और स्थिरता दोनों के मामले में एकल अधिकतम संभावना प्रारूप खोजने के लिए अनुकूल साबित होती है।<ref>Sipos, I. Róbert. ''Parallel stratified MCMC sampling of AR-HMMs for stochastic time series prediction''. In: Proceedings, 4th Stochastic Modeling Techniques and Data Analysis International Conference with Demographics Workshop (SMTDA2016), pp. 295-306. Valletta, 2016. [http://1drv.ms/b/s!ApL_0Av0YGDLglwEOv1aYAGbmQeL PDF]</ref> चूंकि MCMC महत्वपूर्ण कम्प्यूटेशनल बोझ लगाता है, ऐसे मामलों में जहां कम्प्यूटेशनल स्केलेबिलिटी भी ब्याज की है, कोई वैकल्पिक रूप से बायेसियन अनुमान के लिए वैरिएबल सन्निकटन का सहारा ले सकता है, उदा।<ref>{{cite journal |url=http://users.iit.demokritos.gr/~dkosmo/downloads/patrec10/vbb10.pdf |doi=10.1016/j.patcog.2010.09.001 |volume=44 |issue=2 |title=छात्र-टी मिश्रणों का उपयोग करते हुए छिपे हुए मार्कोव मॉडल के लिए एक विविधतापूर्ण बायेसियन पद्धति|year=2011 |journal=Pattern Recognition |pages=295–306 |last1=Chatzis |first1=Sotirios P. |last2=Kosmopoulos |first2=Dimitrios I. |bibcode=2011PatRe..44..295C |citeseerx=10.1.1.629.6275}}</ref> वास्तव में, अनुमानित परिवर्तनशील अनुमान अपेक्षा-अधिकतमकरण की तुलना में कम्प्यूटेशनल दक्षता प्रदान करता है, जबकि सटीक MCMC-प्रकार बायेसियन अनुमान से थोड़ा ही कम सटीकता प्रोफ़ाइल प्रदान करता है। | यदि एचएमएम का उपयोग समय श्रृंखला भविष्यवाणी के लिए किया जाता है, तो [[मार्कोव चेन मोंटे कार्लो]] (एमसीएमसी) नमूनाकरण जैसे अधिक परिष्कृत बायेसियन अनुमान पद्धति सटीकता और स्थिरता दोनों के मामले में एकल अधिकतम संभावना प्रारूप खोजने के लिए अनुकूल साबित होती है।<ref>Sipos, I. Róbert. ''Parallel stratified MCMC sampling of AR-HMMs for stochastic time series prediction''. In: Proceedings, 4th Stochastic Modeling Techniques and Data Analysis International Conference with Demographics Workshop (SMTDA2016), pp. 295-306. Valletta, 2016. [http://1drv.ms/b/s!ApL_0Av0YGDLglwEOv1aYAGbmQeL PDF]</ref> चूंकि MCMC महत्वपूर्ण कम्प्यूटेशनल बोझ लगाता है, ऐसे मामलों में जहां कम्प्यूटेशनल स्केलेबिलिटी भी ब्याज की है, कोई वैकल्पिक रूप से बायेसियन अनुमान के लिए वैरिएबल सन्निकटन का सहारा ले सकता है, उदा।<ref>{{cite journal |url=http://users.iit.demokritos.gr/~dkosmo/downloads/patrec10/vbb10.pdf |doi=10.1016/j.patcog.2010.09.001 |volume=44 |issue=2 |title=छात्र-टी मिश्रणों का उपयोग करते हुए छिपे हुए मार्कोव मॉडल के लिए एक विविधतापूर्ण बायेसियन पद्धति|year=2011 |journal=Pattern Recognition |pages=295–306 |last1=Chatzis |first1=Sotirios P. |last2=Kosmopoulos |first2=Dimitrios I. |bibcode=2011PatRe..44..295C |citeseerx=10.1.1.629.6275}}</ref> वास्तव में, अनुमानित परिवर्तनशील अनुमान अपेक्षा-अधिकतमकरण की तुलना में कम्प्यूटेशनल दक्षता प्रदान करता है, जबकि सटीक MCMC-प्रकार बायेसियन अनुमान से थोड़ा ही कम सटीकता प्रोफ़ाइल प्रदान करता है। | ||
Line 140: | Line 140: | ||
*[[सौर विकिरण]] परिवर्तनशीलता <ref>{{Cite journal|title=स्टोचैस्टिक दो-राज्य सौर विकिरण मॉडल (STSIM)|last1=Morf|first1=H.|journal=Solar Energy|volume=62|issue=2|pages=101–112|date=Feb 1998|bibcode=1998SoEn...62..101M|doi=10.1016/S0038-092X(98)00004-8}}</ref><ref>{{Cite journal|title=क्लियर-स्काई इंडेक्स के लिए एक मार्कोव-श्रृंखला संभाव्यता वितरण मिश्रण दृष्टिकोण|last1=Munkhammar|first1=J.|last2=Widén|first2=J.|journal = Solar Energy|date=Aug 2018|volume=170|pages=174–183|bibcode=2018SoEn..170..174M|doi=10.1016/j.solener.2018.05.055|s2cid=125867684}}</ref><ref>{{Cite journal|title=क्लियर-स्काई इंडेक्स का एक एन-स्टेट मार्कोव-चेन मिश्रण वितरण मॉडल|last1=Munkhammar|first1=J.|last2=Widén|first2=J.|journal=Solar Energy|volume=173|pages=487–495|date=Oct 2018|bibcode=2018SoEn..173..487M|doi=10.1016/j.solener.2018.07.056|s2cid=125538244}}</ref> | *[[सौर विकिरण]] परिवर्तनशीलता <ref>{{Cite journal|title=स्टोचैस्टिक दो-राज्य सौर विकिरण मॉडल (STSIM)|last1=Morf|first1=H.|journal=Solar Energy|volume=62|issue=2|pages=101–112|date=Feb 1998|bibcode=1998SoEn...62..101M|doi=10.1016/S0038-092X(98)00004-8}}</ref><ref>{{Cite journal|title=क्लियर-स्काई इंडेक्स के लिए एक मार्कोव-श्रृंखला संभाव्यता वितरण मिश्रण दृष्टिकोण|last1=Munkhammar|first1=J.|last2=Widén|first2=J.|journal = Solar Energy|date=Aug 2018|volume=170|pages=174–183|bibcode=2018SoEn..170..174M|doi=10.1016/j.solener.2018.05.055|s2cid=125867684}}</ref><ref>{{Cite journal|title=क्लियर-स्काई इंडेक्स का एक एन-स्टेट मार्कोव-चेन मिश्रण वितरण मॉडल|last1=Munkhammar|first1=J.|last2=Widén|first2=J.|journal=Solar Energy|volume=173|pages=487–495|date=Oct 2018|bibcode=2018SoEn..173..487M|doi=10.1016/j.solener.2018.07.056|s2cid=125538244}}</ref> | ||
== इतिहास == | == इतिहास == | ||
1960 के दशक के उत्तरार्ध में लियोनार्ड ई. बॉम और अन्य लेखकों द्वारा सांख्यिकीय पत्रों की श्रृंखला में | 1960 के दशक के उत्तरार्ध में लियोनार्ड ई. बॉम और अन्य लेखकों द्वारा सांख्यिकीय पत्रों की श्रृंखला में अदृश्य मार्कोव प्रारूप का वर्णन किया गया था।<ref>{{cite journal |last=Baum |first=L. E. |author2=Petrie, T. |title=परिमित राज्य मार्कोव श्रृंखलाओं के संभाव्य कार्यों के लिए सांख्यिकीय निष्कर्ष|journal=The Annals of Mathematical Statistics |year=1966 |volume=37 |issue=6 |pages=1554–1563 |doi=10.1214/aoms/1177699147|doi-access=free }}</ref><ref>{{Cite journal |last1=Baum |first1=L. E. |last2=Eagon |first2=J. A. |doi=10.1090/S0002-9904-1967-11751-8 |title=मार्कोव प्रक्रियाओं के संभाव्य कार्यों और पारिस्थितिकी के लिए एक मॉडल के लिए सांख्यिकीय अनुमान के लिए अनुप्रयोगों के साथ एक असमानता|journal=[[Bulletin of the American Mathematical Society]] |volume=73 |issue=3 |pages=360 |year=1967 |zbl=0157.11101 |url=http://projecteuclid.org/euclid.bams/1183528841 |doi-access=free }}</ref><ref>{{cite journal |last=Baum |first=L. E. |author2=Sell, G. R. |title=मैनिफोल्ड्स पर कार्यों के लिए विकास परिवर्तन|journal=Pacific Journal of Mathematics |year=1968 |volume=27 |issue=2 |pages=211–227 |url=https://www.scribd.com/doc/6369908/Growth-Functions-for-Transformations-on-Manifolds |access-date=28 November 2011 |doi=10.2140/pjm.1968.27.211|doi-access=free }}</ref><ref>{{Cite journal |last1=Baum |first1=L. E. |author-link1=Leonard E. Baum |last2=Petrie |first2=T. |last3=Soules |first3=G. |last4=Weiss |first4=N. |title=मार्कोव जंजीरों के संभाव्य कार्यों के सांख्यिकीय विश्लेषण में होने वाली अधिकतमकरण तकनीक|doi=10.1214/aoms/1177697196 |journal=[[The Annals of Mathematical Statistics]] |volume=41 |issue=1 |pages=164–171 |year=1970 |jstor=2239727 |zbl=0188.49603 |mr=287613 |doi-access=free }}</ref><ref>{{cite journal |last=Baum |first=L.E. |title=एक मार्कोव प्रक्रिया के संभाव्य कार्यों के सांख्यिकीय अनुमान में एक असमानता और संबद्ध अधिकतमकरण तकनीक|journal=Inequalities |year=1972 |volume=3 |pages=1–8}}</ref> एचएमएम के पहले अनुप्रयोगों में से भाषण पहचान था, जो 1970 के दशक के मध्य में शुरू हुआ था।<ref>{{Cite journal |last1=Baker |first1=J. |author-link1=James K. Baker |doi=10.1109/TASSP.1975.1162650 |title=The DRAGON system—An overview |journal=IEEE Transactions on Acoustics, Speech, and Signal Processing |volume=23 |pages=24–29 |year=1975 }}</ref><ref>{{Cite journal |last1=Jelinek |first1=F. |last2=Bahl |first2=L. |last3=Mercer |first3=R. |doi=10.1109/TIT.1975.1055384 |title=निरंतर भाषण की पहचान के लिए भाषाई सांख्यिकीय डिकोडर का डिज़ाइन|journal=[[IEEE Transactions on Information Theory]] |volume=21 |issue=3 |pages=250 |year=1975 }}</ref><ref>{{cite book |title=वाक् पहचान के लिए छिपे हुए मार्कोव मॉडल|publisher=Edinburgh University Press |year=1990 |isbn=978-0-7486-0162-2 |author1=Xuedong Huang |author2=M. Jack |author3=Y. Ariki |author-link1=Xuedong Huang}}</ref><ref>{{cite book |title=बोली जाने वाली भाषा प्रसंस्करण|publisher=Prentice Hall |year=2001 |isbn=978-0-13-022616-7 |author1=Xuedong Huang |author2=Alex Acero |author3=Hsiao-Wuen Hon |author-link1=Xuedong Huang}}</ref> | ||
1980 के दशक के उत्तरार्ध में, HMMs को जैविक अनुक्रमों के विश्लेषण के लिए लागू किया जाने लगा,<ref>{{cite journal |doi=10.1016/0022-2836(86)90289-5 |author=M. Bishop and E. Thompson |title=डीएनए अनुक्रमों की अधिकतम संभावना संरेखण|journal=[[Journal of Molecular Biology]] |volume=190 |issue=2 |pages=159–165 |year=1986 |pmid=3641921}} {{subscription required}} {{closed access}}</ref> विशेष रूप से [[डीएनए]]। तब से, वे जैव सूचना विज्ञान के क्षेत्र में सर्वव्यापी हो गए हैं।<ref name=durbin>{{Durbin 1998|mode=cs1}}</ref> | 1980 के दशक के उत्तरार्ध में, HMMs को जैविक अनुक्रमों के विश्लेषण के लिए लागू किया जाने लगा,<ref>{{cite journal |doi=10.1016/0022-2836(86)90289-5 |author=M. Bishop and E. Thompson |title=डीएनए अनुक्रमों की अधिकतम संभावना संरेखण|journal=[[Journal of Molecular Biology]] |volume=190 |issue=2 |pages=159–165 |year=1986 |pmid=3641921}} {{subscription required}} {{closed access}}</ref> विशेष रूप से [[डीएनए]]। तब से, वे जैव सूचना विज्ञान के क्षेत्र में सर्वव्यापी हो गए हैं।<ref name=durbin>{{Durbin 1998|mode=cs1}}</ref> | ||
== एक्सटेंशन == | == एक्सटेंशन == | ||
ऊपर विचार किए गए | ऊपर विचार किए गए अदृश्य मार्कोव प्रारूप में, अदृश्य चर का राज्य स्थान असतत है, जबकि अवलोकन स्वयं असतत हो सकते हैं (सामान्यतः स्पष्ट वितरण से उत्पन्न) या निरंतर (सामान्यतः गॉसियन वितरण से)। अदृश्य मार्कोव प्रारूप को निरंतर राज्य रिक्त स्थान की अनुमति देने के लिए भी सामान्यीकृत किया जा सकता है। ऐसे मॉडलों के उदाहरण वे हैं जहां अदृश्य चर पर मार्कोव प्रक्रिया [[रैखिक गतिशील प्रणाली]] है, जिसमें संबंधित चर के मध्य रैखिक संबंध है और जहां सभी अदृश्यऔर देखे गए चर गॉसियन वितरण का पालन करते हैं। सरल मामलों में, जैसे कि रैखिक गतिशील प्रणाली का अभी उल्लेख किया गया है, सटीक अनुमान ट्रैक्टेबल है (इस मामले में, [[कलमन फिल्टर]] का उपयोग करके); हालांकि, सामान्यतः , निरंतर अव्यक्त चर के साथ एचएमएम में सटीक अनुमान संभव नहीं है, और अनुमानित विधियों का उपयोग किया जाना चाहिए, जैसे [[विस्तारित कलमन फ़िल्टर]] या कण फ़िल्टर। | ||
अदृश्यमार्कोव प्रारूप [[जनरेटिव मॉडल|जनरेटिव]] प्रारूप हैं, जिसमें अवलोकनों और अदृश्यराज्यों का [[संयुक्त वितरण]], या समान रूप से अदृश्यराज्यों के [[पूर्व वितरण]] (संक्रमण संभावनाएं) और दिए गए राज्यों (उत्सर्जन संभावनाएं) के [[सशर्त वितरण]] को प्रारूप किया गया है। उपरोक्त एल्गोरिदम स्पष्ट रूप से संक्रमण संभावनाओं पर [[समान वितरण (निरंतर)]] पूर्व वितरण मानते हैं। हालाँकि, अन्य प्रकार के पूर्व वितरणों के साथ अदृश्यमार्कोव प्रारूप बनाना भी संभव है। स्पष्ट उम्मीदवार, संक्रमण संभावनाओं के स्पष्ट वितरण को देखते हुए, [[डिरिचलेट वितरण]] है, जो श्रेणीबद्ध वितरण का संयुग्मित पूर्व वितरण है। आमतौर पर, सममित डिरिचलेट वितरण चुना जाता है, जो अज्ञानता को दर्शाता है कि किन राज्यों में दूसरों की तुलना में स्वाभाविक रूप से अधिक संभावना है। इस वितरण का एकल पैरामीटर (एकाग्रता पैरामीटर कहा जाता है) परिणामी संक्रमण आव्यूह के सापेक्ष घनत्व या विरलता को नियंत्रित करता है। 1 का विकल्प समान वितरण देता है। 1 से अधिक मान सघन आव्यूह उत्पन्न करते हैं, जिसमें राज्यों के जोड़े के मध्य संक्रमण की संभावनाएं लगभग बराबर होने की संभावना है। 1 से कम मान विरल आव्यूह में परिणामित होते हैं, जिसमें प्रत्येक दिए गए स्रोत राज्य के लिए, केवल कुछ ही गंतव्य राज्यों में गैर-नगण्य संक्रमण संभावनाएँ होती हैं। दो-स्तरीय पूर्व डिरिचलेट वितरण का उपयोग करना भी संभव है, जिसमें डिरिचलेट वितरण (ऊपरी वितरण) दूसरे डिरिचलेट वितरण (कम वितरण) के मापदंडों को नियंत्रित करता है, जो बदले में संक्रमण की संभावनाओं को नियंत्रित करता है। ऊपरी वितरण राज्यों के समग्र वितरण को नियंत्रित करता है, यह निर्धारित करता है कि प्रत्येक राज्य के होने की कितनी संभावना है; इसका सघनता पैरामीटर राज्यों के घनत्व या विरलता को निर्धारित करता है। इस प्रकार के दो-स्तरीय पूर्व वितरण, जहां दोनों एकाग्रता पैरामीटर विरल वितरण का उत्पादन करने के लिए सेट किए गए हैं, उदाहरण के लिए अनपेक्षित लर्निंग पार्ट-ऑफ-स्पीच टैगिंग में उपयोगी हो सकते हैं, जहां भाषण के कुछ हिस्से दूसरों की तुलना में बहुत अधिक होते हैं; सीखने के एल्गोरिदम जो समान पूर्व वितरण मानते हैं, सामान्यतः इस कार्य पर खराब प्रदर्शन करते हैं। इस प्रकार के प्रारूप के पैरामीटर, गैर-समान पूर्व वितरण के साथ, [[गिब्स नमूनाकरण]] या अपेक्षा-अधिकतमकरण एल्गोरिदम के विस्तारित संस्करणों का उपयोग करके सीखा जा सकता है। | |||
डिरिचलेट वितरण पुजारियों के साथ पहले वर्णित | डिरिचलेट वितरण पुजारियों के साथ पहले वर्णित अदृश्यमार्कोव प्रारूप का विस्तार डिरिचलेट वितरण के स्थान पर [[डिरिचलेट प्रक्रिया]] का उपयोग करता है। इस प्रकार का प्रारूप अज्ञात और संभावित रूप से अनंत राज्यों की अनुमति देता है। डिरिचलेट वितरण के दो स्तरों के साथ पहले वर्णित प्रारूप के समान दो-स्तरीय डिरिचलेट प्रक्रिया का उपयोग करना आम है। इस प्रकार के प्रारूप को पदानुक्रमित डिरिचलेट प्रक्रिया हिडन मार्कोव मॉडल, या संक्षेप में एचडीपी-एचएमएम कहा जाता है। इसे मूल रूप से इनफिनिट हिडन मार्कोव प्रारूप के नाम से वर्णित किया गया था<ref>Beal, Matthew J., Zoubin Ghahramani, and Carl Edward Rasmussen. "The infinite hidden Markov model." Advances in neural information processing systems 14 (2002): 577-584.</ref> और आगे पदानुक्रमित डिरिचलेट प्रक्रियाओं में औपचारिक रूप दिया गया।<ref>Teh, Yee Whye, et al. "Hierarchical dirichlet processes." Journal of the American Statistical Association 101.476 (2006).</ref> | ||
अलग प्रकार का विस्तार मानक एचएमएम के जनरेटिव प्रारूप के स्थान पर [[भेदभावपूर्ण मॉडल|भेदभावपूर्ण]] प्रारूप का उपयोग करता है। इस प्रकार का प्रारूप सीधे तौर पर संयुक्त वितरण को मॉडलिंग करने के अतिरिक्त | अलग प्रकार का विस्तार मानक एचएमएम के जनरेटिव प्रारूप के स्थान पर [[भेदभावपूर्ण मॉडल|भेदभावपूर्ण]] प्रारूप का उपयोग करता है। इस प्रकार का प्रारूप सीधे तौर पर संयुक्त वितरण को मॉडलिंग करने के अतिरिक्त अदृश्यराज्यों के सशर्त वितरण का प्रारूप करता है। इस प्रारूप का उदाहरण तथाकथित [[अधिकतम एन्ट्रॉपी मार्कोव मॉडल|अधिकतम एन्ट्रॉपी मार्कोव]] प्रारूप (एमईएमएम) है, जो [[ संभार तन्त्र परावर्तन ]] (जिसे अधिकतम एंट्रॉपी संभाव्यता वितरण प्रारूप के रूप में भी जाना जाता है) का उपयोग करके राज्यों के सशर्त वितरण का प्रारूप करता है। इस प्रकार के प्रारूप का लाभ यह है कि प्रेक्षणों की मनमानी विशेषताओं (यानी कार्यों) को प्रारूप किया जा सकता है, जिससे समस्या के डोमेन-विशिष्ट ज्ञान को प्रारूप में इंजेक्ट किया जा सकता है। इस प्रकार के प्रारूप अदृश्यराज्य और उससे जुड़े अवलोकन के मध्य प्रत्यक्ष निर्भरता के मॉडलिंग तक सीमित नहीं हैं; बल्कि, आस-पास के अवलोकनों की विशेषताएं, संबंधित अवलोकनों और आस-पास के अवलोकनों के संयोजन, या वास्तव में किसी अदृश्यराज्य से किसी भी दूरी पर मनमाने ढंग से अवलोकनों को अदृश्यराज्य के मूल्य को निर्धारित करने के लिए उपयोग की जाने वाली प्रक्रिया में सम्मिलित किया जा सकता है। इसके अलावा, इन सुविधाओं को दूसरे से [[सांख्यिकीय रूप से स्वतंत्र]] होने की कोई आवश्यकता नहीं है, जैसा कि मामला होगा यदि ऐसी सुविधाओं का उपयोग जनरेटिव प्रारूप में किया गया हो। अंत में, सरल संक्रमण संभावनाओं के अतिरिक्त आसन्न अदृश्यराज्यों के जोड़े पर मनमाने ढंग से सुविधाओं का उपयोग किया जा सकता है। ऐसे मॉडलों के नुकसान हैं: (1) अदृश्यराज्यों पर रखे जा सकने वाले पूर्व वितरण के प्रकार गंभीर रूप से सीमित हैं; (2) मनमाना अवलोकन देखने की संभावना का अनुमान लगाना संभव नहीं है। यह दूसरी सीमा प्रायः व्यवहार में कोई समस्या नहीं होती है, क्योंकि एचएमएमके कई सामान्य उपयोगों के लिए ऐसी पूर्वानुमानित संभावनाओं की आवश्यकता नहीं होती है। | ||
पहले वर्णित भेदभावपूर्ण प्रारूप का प्रकार रैखिक-श्रृंखला [[सशर्त यादृच्छिक क्षेत्र]] है। यह MEMM और इसी प्रकार के प्रारूप के निर्देशित ग्राफिकल प्रारूप के अतिरिक्त अप्रत्यक्ष ग्राफिकल प्रारूप (उर्फ [[मार्कोव यादृच्छिक क्षेत्र]]) का उपयोग करता है। इस प्रकार के प्रारूप का लाभ यह है कि यह एमईएमएम की तथाकथित लेबल बायस समस्या से पीड़ित नहीं है, और इस प्रकार अधिक सटीक भविष्यवाणियां कर सकता है। नुकसान यह है कि MEMM की तुलना में प्रशिक्षण धीमा हो सकता है। | पहले वर्णित भेदभावपूर्ण प्रारूप का प्रकार रैखिक-श्रृंखला [[सशर्त यादृच्छिक क्षेत्र]] है। यह MEMM और इसी प्रकार के प्रारूप के निर्देशित ग्राफिकल प्रारूप के अतिरिक्त अप्रत्यक्ष ग्राफिकल प्रारूप (उर्फ [[मार्कोव यादृच्छिक क्षेत्र]]) का उपयोग करता है। इस प्रकार के प्रारूप का लाभ यह है कि यह एमईएमएम की तथाकथित लेबल बायस समस्या से पीड़ित नहीं है, और इस प्रकार अधिक सटीक भविष्यवाणियां कर सकता है। नुकसान यह है कि MEMM की तुलना में प्रशिक्षण धीमा हो सकता है। | ||
फिर भी अन्य संस्करण फैक्टोरियल हिडन मार्कोव प्रारूप है, जो एकल अवलोकन को सेट के संबंधित | फिर भी अन्य संस्करण फैक्टोरियल हिडन मार्कोव प्रारूप है, जो एकल अवलोकन को सेट के संबंधित अदृश्यचर पर वातानुकूलित करने की अनुमति देता है। <math>K</math> एकल मार्कोव श्रृंखला के अतिरिक्त स्वतंत्र मार्कोव श्रृंखला। यह एचएमएम के बराबर है, साथ में <math>N^K</math> राज्य (यह मानते हुए कि वहाँ हैं <math>N</math> प्रत्येक श्रृंखला के लिए राज्य), और इसलिए, ऐसे प्रारूप में सीखना मुश्किल है: लंबाई के अनुक्रम के लिए <math>T</math>, सरल Viterbi एल्गोरिथम में जटिलता है <math>O(N^{2K} \, T)</math>. सटीक समाधान खोजने के लिए, जंक्शन ट्री एल्गोरिथम का उपयोग किया जा सकता है, लेकिन इसका परिणाम होता है <math>O(N^{K+1} \, K \, T)</math> जटिलता। व्यवहार में, अनुमानित तकनीकों, जैसे परिवर्तनशील दृष्टिकोण, का उपयोग किया जा सकता है।<ref>{{cite journal |last1=Ghahramani |first1=Zoubin |author-link1=Zoubin Ghahramani |last2=Jordan |first2=Michael I. |author-link2=Michael I. Jordan |title=फैक्टोरियल हिडन मार्कोव मॉडल|journal=[[Machine Learning (journal)|Machine Learning]] |year=1997 |volume=29 |issue=2/3 |pages=245–273 |doi=10.1023/A:1007425814087|doi-access=free }}</ref> | ||
उपरोक्त सभी मॉडलों को | उपरोक्त सभी मॉडलों को अदृश्यराज्यों के मध्य अधिक दूर की निर्भरता की अनुमति देने के लिए बढ़ाया जा सकता है, उदा। किसी दिए गए राज्य को पिछले राज्य के अतिरिक्त पिछले दो या तीन राज्यों पर निर्भर होने की अनुमति देना; यानी तीन या चार आसन्न राज्यों (या सामान्यतः ) के सेट को सम्मिलित करने के लिए संक्रमण की संभावनाओं को बढ़ाया जाता है <math>K</math> आसन्न राज्य)। ऐसे मॉडलों का नुकसान यह है कि उनके प्रशिक्षण के लिए डायनेमिक-प्रोग्रामिंग एल्गोरिदम में है <math>O(N^K \, T)</math> चलने का समय, के लिए <math>K</math> आसन्न राज्य और <math>T</math> कुल अवलोकन (यानी लंबाई-<math>T</math> मार्कोव श्रृंखला)। | ||
और हालिया विस्तार ट्रिपल मार्कोव प्रारूप है,<ref name="TMM">{{cite journal |doi=10.1016/S1631-073X(02)02462-7 |volume=335 |issue=3 |title=Chaı̂nes de Markov Triplet |year=2002 |journal=Comptes Rendus Mathématique |pages=275–278 |last1=Pieczynski |first1=Wojciech|url=https://comptes-rendus.academie-sciences.fr/mathematique/articles/10.1016/S1631-073X(02)02462-7/ }}</ref> जिसमें कुछ डेटा विशिष्टताओं को प्रारूप करने के लिए सहायक अंतर्निहित प्रक्रिया जोड़ी जाती है। इस प्रारूप के कई रूप प्रस्तावित किए गए हैं। साक्ष्य के सिद्धांत और ट्रिपल मार्कोव प्रारूप के मध्य स्थापित दिलचस्प लिंक का भी उल्लेख करना चाहिए<ref name="TMMEV">{{cite journal |doi=10.1016/j.ijar.2006.05.001 |volume=45 |title=मल्टीसेंसर ट्रिपल मार्कोव चेन और साक्ष्य का सिद्धांत|year=2007 |journal=International Journal of Approximate Reasoning |pages=1–16 |last1=Pieczynski |first1=Wojciech|doi-access=free }}</ref> और जो मार्कोवियन संदर्भ में डेटा को फ्यूज करने की अनुमति देता है<ref name="JASP">[http://asp.eurasipjournals.com/content/pdf/1687-6180-2012-134.pdf Boudaren et al.] {{Webarchive|url=https://web.archive.org/web/20140311164443/http://asp.eurasipjournals.com/content/pdf/1687-6180-2012-134.pdf |date=2014-03-11 }}, M. Y. Boudaren, E. Monfrini, W. Pieczynski, and A. Aissani, Dempster-Shafer fusion of multisensor signals in nonstationary Markovian context, EURASIP Journal on Advances in Signal Processing, No. 134, 2012.</ref> और गैर-स्थिर डेटा को प्रारूप करने के लिए।<ref name="TSP">[http://ieeexplore.ieee.org/xpl/articleDetails.jsp?tp=&arnumber=1468502&contentType=Journals+%26+Magazines&searchField%3DSearch_All%26queryText%3Dlanchantin+pieczynski Lanchantin et al.], P. Lanchantin and W. Pieczynski, Unsupervised restoration of hidden non stationary Markov chain using evidential priors, IEEE Transactions on Signal Processing, Vol. 53, No. 8, pp. 3091-3098, 2005.</ref><ref name="SPL">[http://ieeexplore.ieee.org/xpl/articleDetails.jsp?tp=&arnumber=6244854&contentType=Journals+%26+Magazines&searchField%3DSearch_All%26queryText%3Dboudaren Boudaren et al.], M. Y. Boudaren, E. Monfrini, and W. Pieczynski, Unsupervised segmentation of random discrete data hidden with switching noise distributions, IEEE Signal Processing Letters, Vol. 19, No. 10, pp. 619-622, October 2012.</ref> ध्यान दें कि हाल के साहित्य में वैकल्पिक मल्टी-स्ट्रीम डेटा फ़्यूज़न रणनीतियों को भी प्रस्तावित किया गया है, उदा।<ref>Sotirios P. Chatzis, Dimitrios Kosmopoulos, [https://ieeexplore.ieee.org/document/6164251/ "Visual Workflow Recognition Using a Variational Bayesian Treatment of Multistream Fused Hidden Markov Models,"] IEEE Transactions on Circuits and Systems for Video Technology, vol. 22, no. 7, pp. 1076-1086, July 2012.</ref> | और हालिया विस्तार ट्रिपल मार्कोव प्रारूप है,<ref name="TMM">{{cite journal |doi=10.1016/S1631-073X(02)02462-7 |volume=335 |issue=3 |title=Chaı̂nes de Markov Triplet |year=2002 |journal=Comptes Rendus Mathématique |pages=275–278 |last1=Pieczynski |first1=Wojciech|url=https://comptes-rendus.academie-sciences.fr/mathematique/articles/10.1016/S1631-073X(02)02462-7/ }}</ref> जिसमें कुछ डेटा विशिष्टताओं को प्रारूप करने के लिए सहायक अंतर्निहित प्रक्रिया जोड़ी जाती है। इस प्रारूप के कई रूप प्रस्तावित किए गए हैं। साक्ष्य के सिद्धांत और ट्रिपल मार्कोव प्रारूप के मध्य स्थापित दिलचस्प लिंक का भी उल्लेख करना चाहिए<ref name="TMMEV">{{cite journal |doi=10.1016/j.ijar.2006.05.001 |volume=45 |title=मल्टीसेंसर ट्रिपल मार्कोव चेन और साक्ष्य का सिद्धांत|year=2007 |journal=International Journal of Approximate Reasoning |pages=1–16 |last1=Pieczynski |first1=Wojciech|doi-access=free }}</ref> और जो मार्कोवियन संदर्भ में डेटा को फ्यूज करने की अनुमति देता है<ref name="JASP">[http://asp.eurasipjournals.com/content/pdf/1687-6180-2012-134.pdf Boudaren et al.] {{Webarchive|url=https://web.archive.org/web/20140311164443/http://asp.eurasipjournals.com/content/pdf/1687-6180-2012-134.pdf |date=2014-03-11 }}, M. Y. Boudaren, E. Monfrini, W. Pieczynski, and A. Aissani, Dempster-Shafer fusion of multisensor signals in nonstationary Markovian context, EURASIP Journal on Advances in Signal Processing, No. 134, 2012.</ref> और गैर-स्थिर डेटा को प्रारूप करने के लिए।<ref name="TSP">[http://ieeexplore.ieee.org/xpl/articleDetails.jsp?tp=&arnumber=1468502&contentType=Journals+%26+Magazines&searchField%3DSearch_All%26queryText%3Dlanchantin+pieczynski Lanchantin et al.], P. Lanchantin and W. Pieczynski, Unsupervised restoration of hidden non stationary Markov chain using evidential priors, IEEE Transactions on Signal Processing, Vol. 53, No. 8, pp. 3091-3098, 2005.</ref><ref name="SPL">[http://ieeexplore.ieee.org/xpl/articleDetails.jsp?tp=&arnumber=6244854&contentType=Journals+%26+Magazines&searchField%3DSearch_All%26queryText%3Dboudaren Boudaren et al.], M. Y. Boudaren, E. Monfrini, and W. Pieczynski, Unsupervised segmentation of random discrete data hidden with switching noise distributions, IEEE Signal Processing Letters, Vol. 19, No. 10, pp. 619-622, October 2012.</ref> ध्यान दें कि हाल के साहित्य में वैकल्पिक मल्टी-स्ट्रीम डेटा फ़्यूज़न रणनीतियों को भी प्रस्तावित किया गया है, उदा।<ref>Sotirios P. Chatzis, Dimitrios Kosmopoulos, [https://ieeexplore.ieee.org/document/6164251/ "Visual Workflow Recognition Using a Variational Bayesian Treatment of Multistream Fused Hidden Markov Models,"] IEEE Transactions on Circuits and Systems for Video Technology, vol. 22, no. 7, pp. 1076-1086, July 2012.</ref> | ||
अंत में, 2012 में | अंत में, 2012 में अदृश्यमार्कोव प्रारूप के माध्यम से गैर-स्थिर डेटा मॉडलिंग की समस्या को हल करने के लिए अलग तर्क सुझाया गया था।<ref name="Reservoir-HMM">{{cite journal |last1=Chatzis |first1=Sotirios P. |last2=Demiris |first2=Yiannis |year=2012 |title=एक जलाशय-संचालित गैर-स्थिर छिपा हुआ मार्कोव मॉडल|journal=Pattern Recognition |volume=45 |issue=11 |pages=3985–3996 |doi=10.1016/j.patcog.2012.04.018|bibcode=2012PatRe..45.3985C |hdl=10044/1/12611 |hdl-access=free }}</ref> इसमें छोटे आवर्ती तंत्रिका नेटवर्क (आरएनएन) को नियोजित करना सम्मिलित है, विशेष रूप से जलाशय नेटवर्क,<ref>M. Lukosevicius, H. Jaeger (2009) Reservoir computing approaches to recurrent neural network training, Computer Science Review '''3''': 127–149.</ref> देखे गए डेटा में लौकिक गतिकी के विकास को पकड़ने के लिए। उच्च-आयामी वेक्टर के रूप में एन्कोडेड यह जानकारी एचएमएम राज्य संक्रमण संभावनाओं के कंडीशनिंग चर के रूप में उपयोग की जाती है। इस प्रकार के सेटअप के तहत, हम अंततः गैर-स्टेशनरी एचएमएम प्राप्त करते हैं, जिसकी संक्रमण संभावनाएँ समय के साथ इस प्रकार से विकसित होती हैं, जो डेटा से ही अनुमानित होती हैं, जैसा कि लौकिक विकास के कुछ अवास्तविक तदर्थ प्रारूप के विपरीत है। | ||
अनुदैर्ध्य डेटा के संदर्भ में उपयुक्त प्रारूप को गुप्त मार्कोव प्रारूप नाम दिया गया है।<ref>{{Cite book|title=Panel Analysis: Latent Probability Models for Attitude and Behaviour Processes|last=Wiggins|first=L. M.|publisher=Elsevier|year=1973|location=Amsterdam}}</ref> इस प्रारूप के मूल संस्करण को अलग-अलग सहसंयोजकों, यादृच्छिक प्रभावों और बहुस्तरीय डेटा जैसे अधिक जटिल डेटा संरचनाओं को प्रारूप करने के लिए विस्तारित किया गया है। प्रारूप मान्यताओं और उनके व्यावहारिक उपयोग पर विशेष ध्यान देने के साथ गुप्त मार्कोव प्रारूप का पूरा अवलोकन प्रदान किया गया है<ref>{{Cite book|url=https://sites.google.com/site/latentmarkovbook/home|title=अनुदैर्ध्य डेटा के लिए अव्यक्त मार्कोव मॉडल|last1=Bartolucci|first1=F.|last2=Farcomeni|first2=A.|last3=Pennoni|first3=F.|publisher=Chapman and Hall/CRC|year=2013|isbn=978-14-3981-708-7|location=Boca Raton}}</ref> | अनुदैर्ध्य डेटा के संदर्भ में उपयुक्त प्रारूप को गुप्त मार्कोव प्रारूप नाम दिया गया है।<ref>{{Cite book|title=Panel Analysis: Latent Probability Models for Attitude and Behaviour Processes|last=Wiggins|first=L. M.|publisher=Elsevier|year=1973|location=Amsterdam}}</ref> इस प्रारूप के मूल संस्करण को अलग-अलग सहसंयोजकों, यादृच्छिक प्रभावों और बहुस्तरीय डेटा जैसे अधिक जटिल डेटा संरचनाओं को प्रारूप करने के लिए विस्तारित किया गया है। प्रारूप मान्यताओं और उनके व्यावहारिक उपयोग पर विशेष ध्यान देने के साथ गुप्त मार्कोव प्रारूप का पूरा अवलोकन प्रदान किया गया है<ref>{{Cite book|url=https://sites.google.com/site/latentmarkovbook/home|title=अनुदैर्ध्य डेटा के लिए अव्यक्त मार्कोव मॉडल|last1=Bartolucci|first1=F.|last2=Farcomeni|first2=A.|last3=Pennoni|first3=F.|publisher=Chapman and Hall/CRC|year=2013|isbn=978-14-3981-708-7|location=Boca Raton}}</ref> | ||
Line 193: | Line 193: | ||
=== अवधारणाएं === | === अवधारणाएं === | ||
* {{cite journal |last1=Teif |first1=V. B. |last2=Rippe |first2=K. |year=2010 |title=क्रोमैटिन में प्रोटीन-डीएनए बंधन के लिए सांख्यिकीय-यांत्रिक जाली मॉडल|journal=J. Phys.: Condens. Matter |volume=22 |issue=41 |page=414105 |doi=10.1088/0953-8984/22/41/414105 |pmid=21386588 |arxiv=1004.5514|bibcode=2010JPCM...22O4105T |s2cid=103345 }} | * {{cite journal |last1=Teif |first1=V. B. |last2=Rippe |first2=K. |year=2010 |title=क्रोमैटिन में प्रोटीन-डीएनए बंधन के लिए सांख्यिकीय-यांत्रिक जाली मॉडल|journal=J. Phys.: Condens. Matter |volume=22 |issue=41 |page=414105 |doi=10.1088/0953-8984/22/41/414105 |pmid=21386588 |arxiv=1004.5514|bibcode=2010JPCM...22O4105T |s2cid=103345 }} | ||
* [http://www.cs.sjsu.edu/~stamp/RUA/HMM.pdf | * [http://www.cs.sjsu.edu/~stamp/RUA/HMM.pdf अदृश्यमार्कोव प्रारूप का खुलासा परिचय] मार्क स्टैम्प, सैन जोस स्टेट यूनिवर्सिटी द्वारा। | ||
* [https://web.archive.org/web/20120415032315/http://www.ee.washington.edu/research/guptalab/publications/EMbookChenGupta2010.pdf अपेक्षा-अधिकतमकरण के साथ | * [https://web.archive.org/web/20120415032315/http://www.ee.washington.edu/research/guptalab/publications/EMbookChenGupta2010.pdf अपेक्षा-अधिकतमकरण के साथ एचएमएमकी फिटिंग - पूर्ण व्युत्पत्ति] | ||
* [http://www.comp.leeds.ac.uk/roger/HiddenMarkovModels/html_dev/main.html HMMs पर चरण-दर-चरण ट्यूटोरियल] {{Webarchive|url=https://web.archive.org/web/20170813231824/http://www.comp.leeds.ac.uk/roger/HiddenMarkovModels/html_dev/main.html |date=2017-08-13 }} (लीड्स विश्वविद्यालय) | * [http://www.comp.leeds.ac.uk/roger/HiddenMarkovModels/html_dev/main.html HMMs पर चरण-दर-चरण ट्यूटोरियल] {{Webarchive|url=https://web.archive.org/web/20170813231824/http://www.comp.leeds.ac.uk/roger/HiddenMarkovModels/html_dev/main.html |date=2017-08-13 }} (लीड्स विश्वविद्यालय) | ||
* [http://www.cs.brown.edu/research/ai/dynamics/tutorial/Documents/HiddenMarkovModels.html | * [http://www.cs.brown.edu/research/ai/dynamics/tutorial/Documents/HiddenMarkovModels.html अदृश्यमार्कोव] प्रारूप (बुनियादी गणित का उपयोग करके प्रदर्शनी) | ||
* [http://jedlik.phy.bme.hu/~gerjanos/HMM/node2.html | * [http://jedlik.phy.bme.hu/~gerjanos/HMM/node2.html अदृश्यमार्कोव] प्रारूप (नारद वारकागोडा द्वारा) | ||
* | * अदृश्यमार्कोव मॉडल: बुनियादी सिद्धांत और अनुप्रयोग [http://www.eecis.udel.edu/~lliao/cis841s06/hmmtutorialpart1.pdf भाग 1], [http://www.eecis.udel.edu/~lliao/cis841s06 /hmmtutorialpart2.pdf भाग 2] (वी. पेट्रुशिन द्वारा) | ||
* जेसन आइजनर द्वारा स्प्रेडशीट पर व्याख्यान, [http://videolectures.net/hltss2010_eisner_plm/video/2/ वीडियो] और [http://www.cs.jhu.edu/~jason/papers/eisner.hmm.xls इंटरैक्टिव स्प्रेडशीट] | * जेसन आइजनर द्वारा स्प्रेडशीट पर व्याख्यान, [http://videolectures.net/hltss2010_eisner_plm/video/2/ वीडियो] और [http://www.cs.jhu.edu/~jason/papers/eisner.hmm.xls इंटरैक्टिव स्प्रेडशीट] | ||
Line 204: | Line 204: | ||
{{Authority control}} | {{Authority control}} | ||
श्रेणी: | श्रेणी:अदृश्यमार्कोव मॉडल | ||
श्रेणी:मार्कोव मॉडल | श्रेणी:मार्कोव मॉडल | ||
श्रेणी:जैव सूचना विज्ञान | श्रेणी:जैव सूचना विज्ञान |
Revision as of 21:37, 16 May 2023
अदृश्य मार्कोव प्रारूप (एचएमएम) सांख्यिकीय मार्कोव प्रारूप है जिसमें गणितीय प्रारूप वाली प्रणाली को मार्कोव प्रक्रिया माना जाता है- इसे कॉल करें - अप्राप्य (अदृश्य) अवस्थाओं के साथ। परिभाषा के भाग के रूप में, एचएमएम की आवश्यकता है कि अवलोकन योग्य प्रक्रिया हो जिनके परिणाम के प्रभाव से प्रभावित होते हैं ज्ञात तरीके से। तब से प्रत्यक्ष रूप से नहीं देखा जा सकता है, लक्ष्य के बारे में सीखना है अवलोकन करके एचएमएम की अतिरिक्त आवश्यकता है कि इसका परिणाम समय पर के परिणाम से विशेष रूप से प्रभावित होना चाहिए पर और इसके परिणाम और पर से सशर्त रूप से स्वतंत्र होना चाहिए पर दिया गया समय पर अदृश्य मार्कोव प्रारूप ऊष्मप्रवैगिकी, सांख्यिकीय यांत्रिकी, भौतिकी, रसायन विज्ञान, अर्थशास्त्र, वित्त, संकेत आगे बढ़ाना , सूचना सिद्धांत, पैटर्न पहचान - जैसे वाक् पहचान, के लिए अपने अनुप्रयोगों के लिए जाने जाते हैं।[1] लिखावट पहचान, हावभाव पहचान,[2] पार्ट-ऑफ-स्पीच टैगिंग, म्यूजिकल स्कोर फॉलोइंग,[3] आंशिक निर्वहन[4] और जैव सूचना विज्ञान।[5][6]
परिभाषा
होने देना और असतत-समय स्टोकेस्टिक प्रक्रियाएं और . जोड़ी अदृश्य मार्कोव प्रारूप है यदि
- मार्कोव प्रक्रिया है जिसका व्यवहार प्रत्यक्ष रूप से देखने योग्य (छिपा हुआ) नहीं है;
- हर के लिए और हर बोरेल सेट सेट .
होने देना और निरंतर-समय की स्टोकेस्टिक प्रक्रियाएँ हों। जोड़ी छिपा हुआ मार्कोव प्रारूप है यदि
- मार्कोव प्रक्रिया है जिसका व्यवहार प्रत्यक्ष रूप से देखने योग्य (छिपा हुआ) नहीं है;
- ,
- हर के लिए हर बोरेल सेट और बोरेल सेट का हर परिवार
शब्दावली
प्रक्रिया की अवस्थाएँ (प्रति. अदृश्य राज्य कहलाते हैं, और (प्रति. उत्सर्जन संभावना या उत्पादन संभावना कहा जाता है।
उदाहरण
अदृश्यकलश से गेंद निकालना
अपने असतत रूप में, छिपी हुई मार्कोव प्रक्रिया को प्रतिस्थापन के साथ कलश समस्या के सामान्यीकरण के रूप में देखा जा सकता है (जहां कलश से प्रत्येक वस्तु अगले चरण से पहले मूल कलश में वापस आ जाती है)।[7] इस उदाहरण पर विचार करें: कमरे में जो प्रेक्षक को दिखाई नहीं देता है वहां जिन्न है। कमरे में कलश X1, X2, X3, ... हैं जिनमें से प्रत्येक में गेंदों का ज्ञात मिश्रण है, प्रत्येक गेंद पर y1, y2, y3, ... का लेबल लगा है। जिन्न उस कमरे में कलश चुनता है और बेतरतीब ढंग से उस कलश से गेंद निकालता है। इसके बाद यह गेंद को कन्वेयर बेल्ट पर रखता है, जहां पर्यवेक्षक गेंदों के अनुक्रम का निरीक्षण कर सकता है, लेकिन कलशों का क्रम नहीं, जिससे वे निकाले गए थे। जिन्न के पास कलश चुनने की कुछ प्रक्रिया होती है; n-वीं गेंद के लिए कलश का चुनाव केवल यादृच्छिक संख्या पर निर्भर करता है और (n − 1)-वीं गेंद के लिए कलश का चुनाव। कलश का चुनाव इस एकल पिछले कलश से पहले चुने गए कलशों पर सीधे निर्भर नहीं करता है; इसलिए, इसे मार्कोव प्रक्रिया कहा जाता है। इसे चित्र 1 के ऊपरी भाग द्वारा वर्णित किया जा सकता है।
मार्कोव प्रक्रिया को ही नहीं देखा जा सकता है, केवल लेबल वाली गेंदों का क्रम, इस प्रकार इस व्यवस्था को छिपी हुई मार्कोव प्रक्रिया कहा जाता है। यह चित्र 1 में दिखाए गए आरेख के निचले भाग द्वारा चित्रित किया गया है, जहां कोई देख सकता है कि गेंदों y1, y2, y3, y4 को प्रत्येक राज्य में खींचा जा सकता है। भले ही पर्यवेक्षक कलशों की संरचना को जानता हो और उसने अभी तीन गेंदों का क्रम देखा हो, उदा। कन्वेयर बेल्ट पर y1, y2 और y3, प्रेक्षक अभी भी सुनिश्चित नहीं हो सकता है कि जिन्न ने तीसरी गेंद को किस कलश (यानी, किस अवस्था में) से निकाला है। हालाँकि, प्रेक्षक अन्य सूचनाओं पर काम कर सकता है, जैसे कि संभावना है कि तीसरी गेंद प्रत्येक कलश से आई है।
मौसम अनुमान लगाने का खेल
दो मित्रों, ऐलिस और बॉब पर विचार करें, जो एक-दूसरे से बहुत दूर रहते हैं और जो उस दिन के बारे में टेलीफोन पर प्रतिदिन साथ बात करते हैं। बॉब को केवल तीन गतिविधियों में दिलचस्पी है: पार्क में घूमना, खरीदारी करना और अपने अपार्टमेंट की सफाई करना। क्या करना है इसका चुनाव विशेष रूप से किसी दिए गए दिन के मौसम द्वारा निर्धारित किया जाता है। ऐलिस को मौसम के बारे में कोई निश्चित जानकारी नहीं है, लेकिन वह सामान्य रुझान जानती है। बॉब उसे जो बताता है उसके आधार पर वह हर दिन करता है, ऐलिस यह अनुमान लगाने की कोशिश करती है कि मौसम कैसा रहा होगा।
ऐलिस का मानना है कि मौसम असतत मार्कोव श्रृंखला के रूप में कार्य करता है। वर्षा और सनी दो अवस्थाएँ हैं, लेकिन वह उन्हें प्रत्यक्ष रूप से नहीं देख सकती हैं, अर्थात वे उससे छिपी हुई हैं। प्रत्येक दिन, इस बात की निश्चित संभावना होती है कि बॉब मौसम के आधार पर निम्नलिखित में से कोई गतिविधि करेगा: चलना , खरीदारी करना , या साफ करना । चूँकि बॉब ऐलिस को उसकी गतिविधियों के बारे में बताता है, वे अवलोकन हैं। संपूर्ण प्रणाली अदृश्यमार्कोव प्रारूप (HMM) की है।
एलिस क्षेत्र में सामान्य मौसम के रुझान को जानती है, और बॉब औसतन क्या करना पसंद करता है। दूसरे शब्दों में, एचएमएमके पैरामीटर ज्ञात हैं। उन्हें पायथन प्रोग्रामिंग भाषा में निम्नानुसार दर्शाया जा सकता है:
states = ("Rainy", "Sunny")
observations = ("walk", "shop", "clean")
start_probability = {"Rainy": 0.6, "Sunny": 0.4}
transition_probability = {
"Rainy": {"Rainy": 0.7, "Sunny": 0.3},
"Sunny": {"Rainy": 0.4, "Sunny": 0.6},
}
emission_probability = {
"Rainy": {"walk": 0.1, "shop": 0.4, "clean": 0.5},
"Sunny": {"walk": 0.6, "shop": 0.3, "clean": 0.1},
}
कोड के इस टुकड़े में, start_probability
ऐलिस के विश्वास का प्रतिनिधित्व करता है कि एचएमएम किस स्थिति में है जब बॉब पहली बार उसे बुलाता है (वह केवल इतना जानती है कि औसतन बारिश होती है)। यहां उपयोग किया जाने वाला विशेष संभाव्यता वितरण संतुलन नहीं है, जो लगभग (संक्रमण संभावनाओं को देखते हुए) है {'Rainy': 0.57, 'Sunny': 0.43}
. transition_probability
ई> अंतर्निहित मार्कोव श्रृंखला में मौसम के परिवर्तन का प्रतिनिधित्व करता है। इस उदाहरण में, यदि आज बरसात है तो कल धूप खिली रहने की संभावना केवल 30% है। emission_probability
e> दर्शाता है कि बॉब के प्रत्येक दिन निश्चित गतिविधि करने की कितनी संभावना है। यदि बारिश हो रही है, तो 50% संभावना है कि वह अपने अपार्टमेंट की सफाई कर रहा है; यदि धूप है, तो 60% संभावना है कि वह टहलने के लिए बाहर है।
इसी प्रकार के उदाहरण को विटरबी एल्गोरिथम # उदाहरण पृष्ठ में और विस्तृत किया गया है।
संरचनात्मक वास्तुकला
नीचे दिया गया चित्र तत्काल एचएमएम के सामान्य आर्किटेक्चर को दिखाता है। प्रत्येक अंडाकार आकार यादृच्छिक चर का प्रतिनिधित्व करता है जो कई मानों को अपना सकता है। यादृच्छिक चर x(t) समय पर छिपी हुई अवस्था है t (उपरोक्त आरेख से प्रारूप के साथ, x(t) ∈ { x1, एक्स2, एक्स3}). यादृच्छिक चर y(t) समय पर अवलोकन है t (y(t) ∈ { y1, और2, और3, और4}). आरेख में तीर (प्रायः जाली (ग्राफ)ग्राफ़) कहा जाता है) सशर्त निर्भरताओं को दर्शाता है।
आरेख से, यह स्पष्ट है कि समय पर अदृश्यचर x(t) का सशर्त संभाव्यता वितरण t, अदृश्यचर के मान दिए गए हैं x हर समय, केवल अदृश्यचर x(t − 1) के मान पर निर्भर करता है; समय t − 2 और इससे पहले के मूल्यों का कोई प्रभाव नहीं है। इसे मार्कोव संपत्ति कहा जाता है। इसी तरह, प्रेक्षित चर y(t) का मान केवल अदृश्यचर x(t) के मान पर निर्भर करता है (दोनों समय पर t).
यहां माने गए अदृश्यमार्कोव प्रारूप के मानक प्रकार में, अदृश्य चर का राज्य स्थान असतत है, जबकि अवलोकन स्वयं असतत हो सकते हैं (सामान्यतः स्पष्ट वितरण से उत्पन्न) या निरंतर (सामान्यतः गॉसियन वितरण से)। अदृश्यमार्कोव प्रारूप के पैरामीटर दो प्रकार के होते हैं, संक्रमण संभावनाएँ और उत्सर्जन संभावनाएँ (जिन्हें आउटपुट संभावनाएँ भी कहा जाता है)। संक्रमण की संभावनाएं समय पर अदृश्य स्थिति को नियंत्रित करती हैं t समय पर अदृश्यराज्य को चुना जाता है .
यह माना जाता है कि अदृश्यराज्य स्थान में से सम्मिलित है N संभावित मान, श्रेणीबद्ध वितरण के रूप में प्रतिरूपित। (अन्य संभावनाओं के लिए एक्सटेंशन पर नीचे दिया गया अनुभाग देखें।) इसका मतलब है कि इनमें से प्रत्येक के लिए N संभावित बताता है कि समय पर अदृश्य चर t में हो सकता है, इस अवस्था से प्रत्येक में संक्रमण की संभावना है N समय पर अदृश्यचर की संभावित अवस्थाएँ , कुल के लिए संक्रमण की संभावनाएं। ध्यान दें कि किसी दिए गए राज्य से संक्रमण के लिए संक्रमण संभावनाओं का सेट 1 होना चाहिए। इस प्रकार, संक्रमण संभावनाओं का आव्यूह स्टोकेस्टिक आव्यूह है। क्योंकि किसी भी संक्रमण संभावना को बार अन्य ज्ञात होने के बाद निर्धारित किया जा सकता है, कुल मिलाकर संक्रमण पैरामीटर।
इसके अलावा, प्रत्येक के लिए N संभावित राज्यों, उस समय अदृश्य चर की स्थिति को देखते हुए किसी विशेष समय पर देखे गए चर के वितरण को नियंत्रित करने वाली उत्सर्जन संभावनाओं का सेट होता है। इस सेट का आकार देखे गए चर की प्रकृति पर निर्भर करता है। उदाहरण के लिए, यदि प्रेक्षित चर असतत है M संभावित मान, श्रेणीबद्ध वितरण द्वारा शासित होंगे अलग पैरामीटर, कुल के लिए सभी अदृश्यराज्यों पर उत्सर्जन पैरामीटर। दूसरी ओर, यदि प्रेक्षित चर है M-आयामी सदिश मनमाना बहुभिन्नरूपी गाऊसी वितरण के अनुसार वितरित किया जाएगा M पैरामीटर साधनों को नियंत्रित करते हैं और सहप्रसरण आव्यूह को नियंत्रित करने वाले पैरामीटर, कुल के लिए उत्सर्जन पैरामीटर। (ऐसी स्थिति में, जब तक कि का मान M छोटा है, अवलोकन वेक्टर के अलग-अलग तत्वों के मध्य सहप्रसरण की प्रकृति को प्रतिबंधित करना अधिक व्यावहारिक हो सकता है, उदा। यह मानते हुए कि तत्व दूसरे से स्वतंत्र हैं, या कम प्रतिबंधात्मक रूप से, आसन्न तत्वों की निश्चित संख्या को छोड़कर सभी से स्वतंत्र हैं।)
निष्कर्ष
अदृश्यमार्कोव प्रारूप के साथ कई अनुमान समस्याएं जुड़ी हुई हैं, जैसा कि नीचे बताया गया है।
देखे गए अनुक्रम की संभावना
प्रारूप के मापदंडों को देखते हुए, किसी विशेष आउटपुट अनुक्रम की संभावना को देखते हुए कार्य सर्वोत्तम तरीके से गणना करना है। इसके लिए सभी संभावित राज्य अनुक्रमों पर योग की आवश्यकता है:
किसी अनुक्रम के प्रेक्षण की प्रायिकता
लंबाई एल द्वारा दिया गया है
जहां योग सभी संभावित छिपे-नोड अनुक्रमों पर चलता है
गतिशील प्रोग्रामिंग के सिद्धांत को लागू करते हुए, इस समस्या को भी आगे एल्गोरिथ्म का उपयोग करके कुशलता से नियंत्रित किया जा सकता है।
अव्यक्त चर की संभावना
प्रारूप के मापदंडों और टिप्पणियों के अनुक्रम को देखते हुए कई संबंधित कार्य या अधिक अव्यक्त चर की संभावना के बारे में पूछते हैं
छानना
कार्य गणना करना है, प्रारूप के पैरामीटर और अवलोकनों का अनुक्रम दिया गया है, अनुक्रम के अंत में अंतिम गुप्त चर के अदृश्य राज्यों पर वितरण, यानी गणना करने के लिए . यह कार्य सामान्य रूप से तब उपयोग किया जाता है जब अव्यक्त चर के अनुक्रम को अंतर्निहित राज्यों के रूप में माना जाता है कि समय के प्रत्येक बिंदु पर संबंधित टिप्पणियों के साथ प्रक्रिया समय के बिंदुओं के अनुक्रम से गुजरती है। फिर, अंत में प्रक्रिया की स्थिति के बारे में पूछना स्वाभाविक है।
फॉरवर्ड एल्गोरिथम का उपयोग करके इस समस्या को कुशलता से नियंत्रित किया जा सकता है।
चौरसाई
यह फ़िल्टरिंग के समान है लेकिन अनुक्रम के मध्य में कहीं गुप्त चर के वितरण के बारे में पूछता है, यानी गणना करने के लिए कुछ के लिए . ऊपर वर्णित परिप्रेक्ष्य से, इसे समय टी के सापेक्ष अतीत में बिंदु k के लिए अदृश्यराज्यों पर संभाव्यता वितरण के रूप में माना जा सकता है।
आगे-पीछे एल्गोरिदम सभी अदृश्य स्टेट वेरिएबल्स के लिए स्मूथ वैल्यू की गणना करने के लिए अच्छा तरीका है।
सबसे अधिक संभावना स्पष्टीकरण
कार्य, पिछले दो के विपरीत, अदृश्यराज्यों के पूरे अनुक्रम की संयुक्त संभावना के बारे में पूछता है जो टिप्पणियों का विशेष अनुक्रम उत्पन्न करता है (दाईं ओर चित्रण देखें)। यह कार्य सामान्यतः तब लागू होता है जब एचएमएम को विभिन्न प्रकार की समस्याओं पर लागू किया जाता है, जिनके लिए फ़िल्टरिंग और स्मूथिंग के कार्य लागू होते हैं। उदाहरण पार्ट-ऑफ-स्पीच टैगिंग है, जहां अदृश्य राज्य शब्दों के देखे गए अनुक्रम के अनुरूप अंतर्निहित पार्ट-ऑफ-स्पीच टैगिंग का प्रतिनिधित्व करते हैं। इस मामले में, रुचि का क्या है, भाषण के कुछ हिस्सों का पूरा क्रम, न कि केवल शब्द के लिए भाषण का हिस्सा, जैसा कि फ़िल्टरिंग या स्मूथिंग गणना करेगा।
इस कार्य के लिए सभी संभावित राज्य अनुक्रमों में अधिकतम खोजने की आवश्यकता है, और Viterbi एल्गोरिथ्म द्वारा कुशलतापूर्वक हल किया जा सकता है।
सांख्यिकीय महत्व
उपरोक्त कुछ समस्याओं के लिए, सांख्यिकीय महत्व के बारे में पूछना भी दिलचस्प हो सकता है। क्या संभावना है कि कुछ अशक्त वितरण से तैयार किए गए अनुक्रम में एचएमएम संभावना होगी (फॉरवर्ड एल्गोरिथम के मामले में) या अधिकतम राज्य अनुक्रम संभावना (विटरबी एल्गोरिथम के मामले में) कम से कम विशेष के रूप में बड़ी होगी आउटपुट अनुक्रम?[8] जब किसी विशेष आउटपुट अनुक्रम के लिए परिकल्पना की प्रासंगिकता का मूल्यांकन करने के लिए एचएमएम का उपयोग किया जाता है, तो सांख्यिकीय महत्व आउटपुट अनुक्रम के लिए परिकल्पना को अस्वीकार करने में विफल होने से जुड़ी झूठी सकारात्मक दर को इंगित करता है।
सीखना
एचएमएम में पैरामीटर सीखने का कार्य आउटपुट अनुक्रम या ऐसे अनुक्रमों का सेट, राज्य संक्रमण और उत्सर्जन संभावनाओं का सबसे अच्छा सेट खोजना है। कार्य सामान्यतः आउटपुट अनुक्रमों के सेट को देखते हुए एचएमएमके मापदंडों के अधिकतम संभावना अनुमान को प्राप्त करने के लिए होता है। इस समस्या को ठीक से हल करने के लिए कोई ट्रैक्टेबल एल्गोरिदम नहीं जाना जाता है, लेकिन बॉम-वेल्च एल्गोरिदम या बाल्दी-चाउविन एल्गोरिदम का उपयोग करके स्थानीय अधिकतम संभावना कुशलतापूर्वक प्राप्त की जा सकती है। बॉम-वेल्च एल्गोरिथम अपेक्षा-अधिकतमकरण एल्गोरिथम का विशेष मामला है।
यदि एचएमएम का उपयोग समय श्रृंखला भविष्यवाणी के लिए किया जाता है, तो मार्कोव चेन मोंटे कार्लो (एमसीएमसी) नमूनाकरण जैसे अधिक परिष्कृत बायेसियन अनुमान पद्धति सटीकता और स्थिरता दोनों के मामले में एकल अधिकतम संभावना प्रारूप खोजने के लिए अनुकूल साबित होती है।[9] चूंकि MCMC महत्वपूर्ण कम्प्यूटेशनल बोझ लगाता है, ऐसे मामलों में जहां कम्प्यूटेशनल स्केलेबिलिटी भी ब्याज की है, कोई वैकल्पिक रूप से बायेसियन अनुमान के लिए वैरिएबल सन्निकटन का सहारा ले सकता है, उदा।[10] वास्तव में, अनुमानित परिवर्तनशील अनुमान अपेक्षा-अधिकतमकरण की तुलना में कम्प्यूटेशनल दक्षता प्रदान करता है, जबकि सटीक MCMC-प्रकार बायेसियन अनुमान से थोड़ा ही कम सटीकता प्रोफ़ाइल प्रदान करता है।
अनुप्रयोग
एचएमएम को कई क्षेत्रों में लागू किया जा सकता है जहां लक्ष्य डेटा अनुक्रम को पुनर्प्राप्त करना है जो तुरंत देखने योग्य नहीं है (लेकिन अनुक्रम पर निर्भर अन्य डेटा हैं)। अनुप्रयोगों में सम्मिलित हैं:
- कम्प्यूटेशनल वित्त[11][12]
- एकल-अणु प्रयोग | एकल-अणु गतिज विश्लेषण[13]
- तंत्रिका विज्ञान[14]
- क्रिप्ट एनालिसिस
- वाक् पहचान, महोदय मै सहित[15]
- भाषा संकलन
- पार्ट-ऑफ-स्पीच टैगिंग
- स्कैनिंग समाधान में दस्तावेज़ जुदाई
- मशीन अनुवाद
- आंशिक डिस्चार्ज
- जीन भविष्यवाणी
- हस्तलिपि अभिज्ञान[16]
- अनुक्रम संरेखण | जैव अनुक्रमों का संरेखण
- समय श्रृंखला
- गतिविधि पहचान
- प्रोटीन की तह[17]
- अनुक्रम वर्गीकरण[18]
- मेटामॉर्फिक वायरस का पता लगाना[19]
- अनुक्रम मूल भाव[20]
- डीएनए संकरण कैनेटीक्स[21][22]
- क्रोमेटिन राज्य की खोज[23]
- परिवहन पूर्वानुमान[24]
- सौर विकिरण परिवर्तनशीलता [25][26][27]
इतिहास
1960 के दशक के उत्तरार्ध में लियोनार्ड ई. बॉम और अन्य लेखकों द्वारा सांख्यिकीय पत्रों की श्रृंखला में अदृश्य मार्कोव प्रारूप का वर्णन किया गया था।[28][29][30][31][32] एचएमएम के पहले अनुप्रयोगों में से भाषण पहचान था, जो 1970 के दशक के मध्य में शुरू हुआ था।[33][34][35][36] 1980 के दशक के उत्तरार्ध में, HMMs को जैविक अनुक्रमों के विश्लेषण के लिए लागू किया जाने लगा,[37] विशेष रूप से डीएनए। तब से, वे जैव सूचना विज्ञान के क्षेत्र में सर्वव्यापी हो गए हैं।[38]
एक्सटेंशन
ऊपर विचार किए गए अदृश्य मार्कोव प्रारूप में, अदृश्य चर का राज्य स्थान असतत है, जबकि अवलोकन स्वयं असतत हो सकते हैं (सामान्यतः स्पष्ट वितरण से उत्पन्न) या निरंतर (सामान्यतः गॉसियन वितरण से)। अदृश्य मार्कोव प्रारूप को निरंतर राज्य रिक्त स्थान की अनुमति देने के लिए भी सामान्यीकृत किया जा सकता है। ऐसे मॉडलों के उदाहरण वे हैं जहां अदृश्य चर पर मार्कोव प्रक्रिया रैखिक गतिशील प्रणाली है, जिसमें संबंधित चर के मध्य रैखिक संबंध है और जहां सभी अदृश्यऔर देखे गए चर गॉसियन वितरण का पालन करते हैं। सरल मामलों में, जैसे कि रैखिक गतिशील प्रणाली का अभी उल्लेख किया गया है, सटीक अनुमान ट्रैक्टेबल है (इस मामले में, कलमन फिल्टर का उपयोग करके); हालांकि, सामान्यतः , निरंतर अव्यक्त चर के साथ एचएमएम में सटीक अनुमान संभव नहीं है, और अनुमानित विधियों का उपयोग किया जाना चाहिए, जैसे विस्तारित कलमन फ़िल्टर या कण फ़िल्टर।
अदृश्यमार्कोव प्रारूप जनरेटिव प्रारूप हैं, जिसमें अवलोकनों और अदृश्यराज्यों का संयुक्त वितरण, या समान रूप से अदृश्यराज्यों के पूर्व वितरण (संक्रमण संभावनाएं) और दिए गए राज्यों (उत्सर्जन संभावनाएं) के सशर्त वितरण को प्रारूप किया गया है। उपरोक्त एल्गोरिदम स्पष्ट रूप से संक्रमण संभावनाओं पर समान वितरण (निरंतर) पूर्व वितरण मानते हैं। हालाँकि, अन्य प्रकार के पूर्व वितरणों के साथ अदृश्यमार्कोव प्रारूप बनाना भी संभव है। स्पष्ट उम्मीदवार, संक्रमण संभावनाओं के स्पष्ट वितरण को देखते हुए, डिरिचलेट वितरण है, जो श्रेणीबद्ध वितरण का संयुग्मित पूर्व वितरण है। आमतौर पर, सममित डिरिचलेट वितरण चुना जाता है, जो अज्ञानता को दर्शाता है कि किन राज्यों में दूसरों की तुलना में स्वाभाविक रूप से अधिक संभावना है। इस वितरण का एकल पैरामीटर (एकाग्रता पैरामीटर कहा जाता है) परिणामी संक्रमण आव्यूह के सापेक्ष घनत्व या विरलता को नियंत्रित करता है। 1 का विकल्प समान वितरण देता है। 1 से अधिक मान सघन आव्यूह उत्पन्न करते हैं, जिसमें राज्यों के जोड़े के मध्य संक्रमण की संभावनाएं लगभग बराबर होने की संभावना है। 1 से कम मान विरल आव्यूह में परिणामित होते हैं, जिसमें प्रत्येक दिए गए स्रोत राज्य के लिए, केवल कुछ ही गंतव्य राज्यों में गैर-नगण्य संक्रमण संभावनाएँ होती हैं। दो-स्तरीय पूर्व डिरिचलेट वितरण का उपयोग करना भी संभव है, जिसमें डिरिचलेट वितरण (ऊपरी वितरण) दूसरे डिरिचलेट वितरण (कम वितरण) के मापदंडों को नियंत्रित करता है, जो बदले में संक्रमण की संभावनाओं को नियंत्रित करता है। ऊपरी वितरण राज्यों के समग्र वितरण को नियंत्रित करता है, यह निर्धारित करता है कि प्रत्येक राज्य के होने की कितनी संभावना है; इसका सघनता पैरामीटर राज्यों के घनत्व या विरलता को निर्धारित करता है। इस प्रकार के दो-स्तरीय पूर्व वितरण, जहां दोनों एकाग्रता पैरामीटर विरल वितरण का उत्पादन करने के लिए सेट किए गए हैं, उदाहरण के लिए अनपेक्षित लर्निंग पार्ट-ऑफ-स्पीच टैगिंग में उपयोगी हो सकते हैं, जहां भाषण के कुछ हिस्से दूसरों की तुलना में बहुत अधिक होते हैं; सीखने के एल्गोरिदम जो समान पूर्व वितरण मानते हैं, सामान्यतः इस कार्य पर खराब प्रदर्शन करते हैं। इस प्रकार के प्रारूप के पैरामीटर, गैर-समान पूर्व वितरण के साथ, गिब्स नमूनाकरण या अपेक्षा-अधिकतमकरण एल्गोरिदम के विस्तारित संस्करणों का उपयोग करके सीखा जा सकता है।
डिरिचलेट वितरण पुजारियों के साथ पहले वर्णित अदृश्यमार्कोव प्रारूप का विस्तार डिरिचलेट वितरण के स्थान पर डिरिचलेट प्रक्रिया का उपयोग करता है। इस प्रकार का प्रारूप अज्ञात और संभावित रूप से अनंत राज्यों की अनुमति देता है। डिरिचलेट वितरण के दो स्तरों के साथ पहले वर्णित प्रारूप के समान दो-स्तरीय डिरिचलेट प्रक्रिया का उपयोग करना आम है। इस प्रकार के प्रारूप को पदानुक्रमित डिरिचलेट प्रक्रिया हिडन मार्कोव मॉडल, या संक्षेप में एचडीपी-एचएमएम कहा जाता है। इसे मूल रूप से इनफिनिट हिडन मार्कोव प्रारूप के नाम से वर्णित किया गया था[39] और आगे पदानुक्रमित डिरिचलेट प्रक्रियाओं में औपचारिक रूप दिया गया।[40] अलग प्रकार का विस्तार मानक एचएमएम के जनरेटिव प्रारूप के स्थान पर भेदभावपूर्ण प्रारूप का उपयोग करता है। इस प्रकार का प्रारूप सीधे तौर पर संयुक्त वितरण को मॉडलिंग करने के अतिरिक्त अदृश्यराज्यों के सशर्त वितरण का प्रारूप करता है। इस प्रारूप का उदाहरण तथाकथित अधिकतम एन्ट्रॉपी मार्कोव प्रारूप (एमईएमएम) है, जो संभार तन्त्र परावर्तन (जिसे अधिकतम एंट्रॉपी संभाव्यता वितरण प्रारूप के रूप में भी जाना जाता है) का उपयोग करके राज्यों के सशर्त वितरण का प्रारूप करता है। इस प्रकार के प्रारूप का लाभ यह है कि प्रेक्षणों की मनमानी विशेषताओं (यानी कार्यों) को प्रारूप किया जा सकता है, जिससे समस्या के डोमेन-विशिष्ट ज्ञान को प्रारूप में इंजेक्ट किया जा सकता है। इस प्रकार के प्रारूप अदृश्यराज्य और उससे जुड़े अवलोकन के मध्य प्रत्यक्ष निर्भरता के मॉडलिंग तक सीमित नहीं हैं; बल्कि, आस-पास के अवलोकनों की विशेषताएं, संबंधित अवलोकनों और आस-पास के अवलोकनों के संयोजन, या वास्तव में किसी अदृश्यराज्य से किसी भी दूरी पर मनमाने ढंग से अवलोकनों को अदृश्यराज्य के मूल्य को निर्धारित करने के लिए उपयोग की जाने वाली प्रक्रिया में सम्मिलित किया जा सकता है। इसके अलावा, इन सुविधाओं को दूसरे से सांख्यिकीय रूप से स्वतंत्र होने की कोई आवश्यकता नहीं है, जैसा कि मामला होगा यदि ऐसी सुविधाओं का उपयोग जनरेटिव प्रारूप में किया गया हो। अंत में, सरल संक्रमण संभावनाओं के अतिरिक्त आसन्न अदृश्यराज्यों के जोड़े पर मनमाने ढंग से सुविधाओं का उपयोग किया जा सकता है। ऐसे मॉडलों के नुकसान हैं: (1) अदृश्यराज्यों पर रखे जा सकने वाले पूर्व वितरण के प्रकार गंभीर रूप से सीमित हैं; (2) मनमाना अवलोकन देखने की संभावना का अनुमान लगाना संभव नहीं है। यह दूसरी सीमा प्रायः व्यवहार में कोई समस्या नहीं होती है, क्योंकि एचएमएमके कई सामान्य उपयोगों के लिए ऐसी पूर्वानुमानित संभावनाओं की आवश्यकता नहीं होती है।
पहले वर्णित भेदभावपूर्ण प्रारूप का प्रकार रैखिक-श्रृंखला सशर्त यादृच्छिक क्षेत्र है। यह MEMM और इसी प्रकार के प्रारूप के निर्देशित ग्राफिकल प्रारूप के अतिरिक्त अप्रत्यक्ष ग्राफिकल प्रारूप (उर्फ मार्कोव यादृच्छिक क्षेत्र) का उपयोग करता है। इस प्रकार के प्रारूप का लाभ यह है कि यह एमईएमएम की तथाकथित लेबल बायस समस्या से पीड़ित नहीं है, और इस प्रकार अधिक सटीक भविष्यवाणियां कर सकता है। नुकसान यह है कि MEMM की तुलना में प्रशिक्षण धीमा हो सकता है।
फिर भी अन्य संस्करण फैक्टोरियल हिडन मार्कोव प्रारूप है, जो एकल अवलोकन को सेट के संबंधित अदृश्यचर पर वातानुकूलित करने की अनुमति देता है। एकल मार्कोव श्रृंखला के अतिरिक्त स्वतंत्र मार्कोव श्रृंखला। यह एचएमएम के बराबर है, साथ में राज्य (यह मानते हुए कि वहाँ हैं प्रत्येक श्रृंखला के लिए राज्य), और इसलिए, ऐसे प्रारूप में सीखना मुश्किल है: लंबाई के अनुक्रम के लिए , सरल Viterbi एल्गोरिथम में जटिलता है . सटीक समाधान खोजने के लिए, जंक्शन ट्री एल्गोरिथम का उपयोग किया जा सकता है, लेकिन इसका परिणाम होता है जटिलता। व्यवहार में, अनुमानित तकनीकों, जैसे परिवर्तनशील दृष्टिकोण, का उपयोग किया जा सकता है।[41] उपरोक्त सभी मॉडलों को अदृश्यराज्यों के मध्य अधिक दूर की निर्भरता की अनुमति देने के लिए बढ़ाया जा सकता है, उदा। किसी दिए गए राज्य को पिछले राज्य के अतिरिक्त पिछले दो या तीन राज्यों पर निर्भर होने की अनुमति देना; यानी तीन या चार आसन्न राज्यों (या सामान्यतः ) के सेट को सम्मिलित करने के लिए संक्रमण की संभावनाओं को बढ़ाया जाता है आसन्न राज्य)। ऐसे मॉडलों का नुकसान यह है कि उनके प्रशिक्षण के लिए डायनेमिक-प्रोग्रामिंग एल्गोरिदम में है चलने का समय, के लिए आसन्न राज्य और कुल अवलोकन (यानी लंबाई- मार्कोव श्रृंखला)।
और हालिया विस्तार ट्रिपल मार्कोव प्रारूप है,[42] जिसमें कुछ डेटा विशिष्टताओं को प्रारूप करने के लिए सहायक अंतर्निहित प्रक्रिया जोड़ी जाती है। इस प्रारूप के कई रूप प्रस्तावित किए गए हैं। साक्ष्य के सिद्धांत और ट्रिपल मार्कोव प्रारूप के मध्य स्थापित दिलचस्प लिंक का भी उल्लेख करना चाहिए[43] और जो मार्कोवियन संदर्भ में डेटा को फ्यूज करने की अनुमति देता है[44] और गैर-स्थिर डेटा को प्रारूप करने के लिए।[45][46] ध्यान दें कि हाल के साहित्य में वैकल्पिक मल्टी-स्ट्रीम डेटा फ़्यूज़न रणनीतियों को भी प्रस्तावित किया गया है, उदा।[47] अंत में, 2012 में अदृश्यमार्कोव प्रारूप के माध्यम से गैर-स्थिर डेटा मॉडलिंग की समस्या को हल करने के लिए अलग तर्क सुझाया गया था।[48] इसमें छोटे आवर्ती तंत्रिका नेटवर्क (आरएनएन) को नियोजित करना सम्मिलित है, विशेष रूप से जलाशय नेटवर्क,[49] देखे गए डेटा में लौकिक गतिकी के विकास को पकड़ने के लिए। उच्च-आयामी वेक्टर के रूप में एन्कोडेड यह जानकारी एचएमएम राज्य संक्रमण संभावनाओं के कंडीशनिंग चर के रूप में उपयोग की जाती है। इस प्रकार के सेटअप के तहत, हम अंततः गैर-स्टेशनरी एचएमएम प्राप्त करते हैं, जिसकी संक्रमण संभावनाएँ समय के साथ इस प्रकार से विकसित होती हैं, जो डेटा से ही अनुमानित होती हैं, जैसा कि लौकिक विकास के कुछ अवास्तविक तदर्थ प्रारूप के विपरीत है।
अनुदैर्ध्य डेटा के संदर्भ में उपयुक्त प्रारूप को गुप्त मार्कोव प्रारूप नाम दिया गया है।[50] इस प्रारूप के मूल संस्करण को अलग-अलग सहसंयोजकों, यादृच्छिक प्रभावों और बहुस्तरीय डेटा जैसे अधिक जटिल डेटा संरचनाओं को प्रारूप करने के लिए विस्तारित किया गया है। प्रारूप मान्यताओं और उनके व्यावहारिक उपयोग पर विशेष ध्यान देने के साथ गुप्त मार्कोव प्रारूप का पूरा अवलोकन प्रदान किया गया है[51]
यह भी देखें
- एंड्री मार्कोव
- बॉम-वेल्च एल्गोरिथम
- बायेसियन अनुमान
- बायेसियन प्रोग्रामिंग
- रिचर्ड जेम्स बॉयज़
- सशर्त यादृच्छिक क्षेत्र
- अनुमान सिद्धांत
- प्रोटीन सीक्वेंस सर्च के लिए HHpred / HHsearch फ्री सर्वर और सॉफ्टवेयर
- HMMER, प्रोटीन अनुक्रम विश्लेषण के लिए एक मुक्त छिपा हुआ मार्कोव मॉडल प्रोग्राम
- छिपा हुआ बर्नौली मॉडल
- छिपा हुआ अर्ध-मार्कोव मॉडल
- पदानुक्रमित छिपा हुआ मार्कोव मॉडल
- स्तरित छुपा मार्कोव मॉडल
- अनुक्रमिक गतिशील प्रणाली
- स्टोकेस्टिक संदर्भ-मुक्त व्याकरण
- समय श्रृंखला विश्लेषण
- चर-क्रम मार्कोव मॉडल
- विटरबी एल्गोरिथम
संदर्भ
- ↑ "Google Scholar".
- ↑ Thad Starner, Alex Pentland. Real-Time American Sign Language Visual Recognition From Video Using Hidden Markov Models. Master's Thesis, MIT, Feb 1995, Program in Media Arts
- ↑ B. Pardo and W. Birmingham. Modeling Form for On-line Following of Musical Performances Archived 2012-02-06 at the Wayback Machine. AAAI-05 Proc., July 2005.
- ↑ Satish L, Gururaj BI (April 2003). "Use of hidden Markov models for partial discharge pattern classification". IEEE Transactions on Dielectrics and Electrical Insulation.
- ↑ Li, N; Stephens, M (December 2003). "मॉडलिंग लिंकेज असमानता और एकल-न्यूक्लियोटाइड बहुरूपता डेटा का उपयोग करके पुनर्संयोजन हॉटस्पॉट की पहचान करना।". Genetics. 165 (4): 2213–33. doi:10.1093/genetics/165.4.2213. PMC 1462870. PMID 14704198.
- ↑ Ernst, Jason; Kellis, Manolis (March 2012). "ChromHMM: automating chromatin-state discovery and characterization". Nature Methods. 9 (3): 215–216. doi:10.1038/nmeth.1906. PMC 3577932. PMID 22373907.
- ↑ Lawrence R. Rabiner (February 1989). "छिपे हुए मार्कोव मॉडल पर एक ट्यूटोरियल और वाक् पहचान में चयनित अनुप्रयोग" (PDF). Proceedings of the IEEE. 77 (2): 257–286. CiteSeerX 10.1.1.381.3454. doi:10.1109/5.18626. S2CID 13618539. [1]
- ↑ Newberg, L. (2009). "छिपे हुए मार्कोव मॉडल और छिपे हुए बोल्ट्जमैन मॉडल के त्रुटि आंकड़े". BMC Bioinformatics. 10: 212. doi:10.1186/1471-2105-10-212. PMC 2722652. PMID 19589158.
- ↑ Sipos, I. Róbert. Parallel stratified MCMC sampling of AR-HMMs for stochastic time series prediction. In: Proceedings, 4th Stochastic Modeling Techniques and Data Analysis International Conference with Demographics Workshop (SMTDA2016), pp. 295-306. Valletta, 2016. PDF
- ↑ Chatzis, Sotirios P.; Kosmopoulos, Dimitrios I. (2011). "छात्र-टी मिश्रणों का उपयोग करते हुए छिपे हुए मार्कोव मॉडल के लिए एक विविधतापूर्ण बायेसियन पद्धति" (PDF). Pattern Recognition. 44 (2): 295–306. Bibcode:2011PatRe..44..295C. CiteSeerX 10.1.1.629.6275. doi:10.1016/j.patcog.2010.09.001.
- ↑ Sipos, I. Róbert; Ceffer, Attila; Levendovszky, János (2016). "एआर-एचएमएम के साथ विरल पोर्टफोलियो का समानांतर अनुकूलन". Computational Economics. 49 (4): 563–578. doi:10.1007/s10614-016-9579-y. S2CID 61882456.
- ↑ Petropoulos, Anastasios; Chatzis, Sotirios P.; Xanthopoulos, Stylianos (2016). "स्टूडेंट के छिपे हुए मार्कोव मॉडल पर आधारित एक नई कॉर्पोरेट क्रेडिट रेटिंग प्रणाली". Expert Systems with Applications. 53: 87–105. doi:10.1016/j.eswa.2016.01.015.
- ↑ NICOLAI, CHRISTOPHER (2013). "क्यूब सॉफ्टवेयर के साथ आयन चैनल कैनेटीक्स को हल करना". Biophysical Reviews and Letters. 8 (3n04): 191–211. doi:10.1142/S1793048013300053.
- ↑ Higgins, Cameron; Vidaurre, Diego; Kolling, Nils; Liu, Yunzhe; Behrens, Tim; Woolrich, Mark (2022). "Spatiotemporally Resolved Multivariate Pattern Analysis for M/EEG". Human Brain Mapping. 43 (10): 3062–3085. doi:10.1002/hbm.25835. PMC 9188977. PMID 35302683.
- ↑ Domingos, Pedro (2015). The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World (in English). Basic Books. p. 37. ISBN 9780465061921.
- ↑ Kundu, Amlan, Yang He, and Paramvir Bahl. "Recognition of handwritten word: first and second order hidden Markov model based approach[dead link]." Pattern recognition 22.3 (1989): 283-297.
- ↑ Stigler, J.; Ziegler, F.; Gieseke, A.; Gebhardt, J. C. M.; Rief, M. (2011). "सिंगल कैलमोडुलिन अणुओं का जटिल फोल्डिंग नेटवर्क". Science. 334 (6055): 512–516. Bibcode:2011Sci...334..512S. doi:10.1126/science.1207598. PMID 22034433. S2CID 5502662.
- ↑ Blasiak, S.; Rangwala, H. (2011). "अनुक्रम वर्गीकरण के लिए एक छिपा हुआ मार्कोव मॉडल संस्करण". IJCAI Proceedings-International Joint Conference on Artificial Intelligence. 22: 1192.
- ↑ Wong, W.; Stamp, M. (2006). "मेटामॉर्फिक इंजन के लिए शिकार". Journal in Computer Virology. 2 (3): 211–229. doi:10.1007/s11416-006-0028-7. S2CID 8116065.
- ↑ Wong, K. -C.; Chan, T. -M.; Peng, C.; Li, Y.; Zhang, Z. (2013). "विश्वास प्रसार का उपयोग करते हुए डीएनए रूपांकन व्याख्या". Nucleic Acids Research. 41 (16): e153. doi:10.1093/nar/gkt574. PMC 3763557. PMID 23814189.
- ↑ Shah, Shalin; Dubey, Abhishek K.; Reif, John (2019-05-17). "टेम्पोरल डीएनए बारकोड के साथ बेहतर ऑप्टिकल मल्टीप्लेक्सिंग". ACS Synthetic Biology. 8 (5): 1100–1111. doi:10.1021/acssynbio.9b00010. PMID 30951289. S2CID 96448257.
- ↑ Shah, Shalin; Dubey, Abhishek K.; Reif, John (2019-04-10). "एकल-अणु फ़िंगरप्रिंटिंग के लिए प्रोग्रामिंग टेम्पोरल डीएनए बारकोड". Nano Letters. 19 (4): 2668–2673. Bibcode:2019NanoL..19.2668S. doi:10.1021/acs.nanolett.9b00590. ISSN 1530-6984. PMID 30896178. S2CID 84841635.
- ↑ "ChromHMM: Chromatin state discovery and characterization". compbio.mit.edu. Retrieved 2018-08-01.
- ↑ El Zarwi, Feraz (May 2011). "Modeling and Forecasting the Evolution of Preferences over Time: A Hidden Markov Model of Travel Behavior". arXiv:1707.09133 [stat.AP].
- ↑ Morf, H. (Feb 1998). "स्टोचैस्टिक दो-राज्य सौर विकिरण मॉडल (STSIM)". Solar Energy. 62 (2): 101–112. Bibcode:1998SoEn...62..101M. doi:10.1016/S0038-092X(98)00004-8.
- ↑ Munkhammar, J.; Widén, J. (Aug 2018). "क्लियर-स्काई इंडेक्स के लिए एक मार्कोव-श्रृंखला संभाव्यता वितरण मिश्रण दृष्टिकोण". Solar Energy. 170: 174–183. Bibcode:2018SoEn..170..174M. doi:10.1016/j.solener.2018.05.055. S2CID 125867684.
- ↑ Munkhammar, J.; Widén, J. (Oct 2018). "क्लियर-स्काई इंडेक्स का एक एन-स्टेट मार्कोव-चेन मिश्रण वितरण मॉडल". Solar Energy. 173: 487–495. Bibcode:2018SoEn..173..487M. doi:10.1016/j.solener.2018.07.056. S2CID 125538244.
- ↑ Baum, L. E.; Petrie, T. (1966). "परिमित राज्य मार्कोव श्रृंखलाओं के संभाव्य कार्यों के लिए सांख्यिकीय निष्कर्ष". The Annals of Mathematical Statistics. 37 (6): 1554–1563. doi:10.1214/aoms/1177699147.
- ↑ Baum, L. E.; Eagon, J. A. (1967). "मार्कोव प्रक्रियाओं के संभाव्य कार्यों और पारिस्थितिकी के लिए एक मॉडल के लिए सांख्यिकीय अनुमान के लिए अनुप्रयोगों के साथ एक असमानता". Bulletin of the American Mathematical Society. 73 (3): 360. doi:10.1090/S0002-9904-1967-11751-8. Zbl 0157.11101.
- ↑ Baum, L. E.; Sell, G. R. (1968). "मैनिफोल्ड्स पर कार्यों के लिए विकास परिवर्तन". Pacific Journal of Mathematics. 27 (2): 211–227. doi:10.2140/pjm.1968.27.211. Retrieved 28 November 2011.
- ↑ Baum, L. E.; Petrie, T.; Soules, G.; Weiss, N. (1970). "मार्कोव जंजीरों के संभाव्य कार्यों के सांख्यिकीय विश्लेषण में होने वाली अधिकतमकरण तकनीक". The Annals of Mathematical Statistics. 41 (1): 164–171. doi:10.1214/aoms/1177697196. JSTOR 2239727. MR 0287613. Zbl 0188.49603.
- ↑ Baum, L.E. (1972). "एक मार्कोव प्रक्रिया के संभाव्य कार्यों के सांख्यिकीय अनुमान में एक असमानता और संबद्ध अधिकतमकरण तकनीक". Inequalities. 3: 1–8.
- ↑ Baker, J. (1975). "The DRAGON system—An overview". IEEE Transactions on Acoustics, Speech, and Signal Processing. 23: 24–29. doi:10.1109/TASSP.1975.1162650.
- ↑ Jelinek, F.; Bahl, L.; Mercer, R. (1975). "निरंतर भाषण की पहचान के लिए भाषाई सांख्यिकीय डिकोडर का डिज़ाइन". IEEE Transactions on Information Theory. 21 (3): 250. doi:10.1109/TIT.1975.1055384.
- ↑ Xuedong Huang; M. Jack; Y. Ariki (1990). वाक् पहचान के लिए छिपे हुए मार्कोव मॉडल. Edinburgh University Press. ISBN 978-0-7486-0162-2.
- ↑ Xuedong Huang; Alex Acero; Hsiao-Wuen Hon (2001). बोली जाने वाली भाषा प्रसंस्करण. Prentice Hall. ISBN 978-0-13-022616-7.
- ↑ M. Bishop and E. Thompson (1986). "डीएनए अनुक्रमों की अधिकतम संभावना संरेखण". Journal of Molecular Biology. 190 (2): 159–165. doi:10.1016/0022-2836(86)90289-5. PMID 3641921. (subscription required)
- ↑ Durbin, Richard M.; Eddy, Sean R.; Krogh, Anders; Mitchison, Graeme (1998). Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids (1st ed.). Cambridge, New York: Cambridge University Press. ISBN 0-521-62971-3. OCLC 593254083.
- ↑ Beal, Matthew J., Zoubin Ghahramani, and Carl Edward Rasmussen. "The infinite hidden Markov model." Advances in neural information processing systems 14 (2002): 577-584.
- ↑ Teh, Yee Whye, et al. "Hierarchical dirichlet processes." Journal of the American Statistical Association 101.476 (2006).
- ↑ Ghahramani, Zoubin; Jordan, Michael I. (1997). "फैक्टोरियल हिडन मार्कोव मॉडल". Machine Learning. 29 (2/3): 245–273. doi:10.1023/A:1007425814087.
- ↑ Pieczynski, Wojciech (2002). "Chaı̂nes de Markov Triplet". Comptes Rendus Mathématique. 335 (3): 275–278. doi:10.1016/S1631-073X(02)02462-7.
- ↑ Pieczynski, Wojciech (2007). "मल्टीसेंसर ट्रिपल मार्कोव चेन और साक्ष्य का सिद्धांत". International Journal of Approximate Reasoning. 45: 1–16. doi:10.1016/j.ijar.2006.05.001.
- ↑ Boudaren et al. Archived 2014-03-11 at the Wayback Machine, M. Y. Boudaren, E. Monfrini, W. Pieczynski, and A. Aissani, Dempster-Shafer fusion of multisensor signals in nonstationary Markovian context, EURASIP Journal on Advances in Signal Processing, No. 134, 2012.
- ↑ Lanchantin et al., P. Lanchantin and W. Pieczynski, Unsupervised restoration of hidden non stationary Markov chain using evidential priors, IEEE Transactions on Signal Processing, Vol. 53, No. 8, pp. 3091-3098, 2005.
- ↑ Boudaren et al., M. Y. Boudaren, E. Monfrini, and W. Pieczynski, Unsupervised segmentation of random discrete data hidden with switching noise distributions, IEEE Signal Processing Letters, Vol. 19, No. 10, pp. 619-622, October 2012.
- ↑ Sotirios P. Chatzis, Dimitrios Kosmopoulos, "Visual Workflow Recognition Using a Variational Bayesian Treatment of Multistream Fused Hidden Markov Models," IEEE Transactions on Circuits and Systems for Video Technology, vol. 22, no. 7, pp. 1076-1086, July 2012.
- ↑ Chatzis, Sotirios P.; Demiris, Yiannis (2012). "एक जलाशय-संचालित गैर-स्थिर छिपा हुआ मार्कोव मॉडल". Pattern Recognition. 45 (11): 3985–3996. Bibcode:2012PatRe..45.3985C. doi:10.1016/j.patcog.2012.04.018. hdl:10044/1/12611.
- ↑ M. Lukosevicius, H. Jaeger (2009) Reservoir computing approaches to recurrent neural network training, Computer Science Review 3: 127–149.
- ↑ Wiggins, L. M. (1973). Panel Analysis: Latent Probability Models for Attitude and Behaviour Processes. Amsterdam: Elsevier.
- ↑ Bartolucci, F.; Farcomeni, A.; Pennoni, F. (2013). अनुदैर्ध्य डेटा के लिए अव्यक्त मार्कोव मॉडल. Boca Raton: Chapman and Hall/CRC. ISBN 978-14-3981-708-7.
बाहरी संबंध
अवधारणाएं
- Teif, V. B.; Rippe, K. (2010). "क्रोमैटिन में प्रोटीन-डीएनए बंधन के लिए सांख्यिकीय-यांत्रिक जाली मॉडल". J. Phys.: Condens. Matter. 22 (41): 414105. arXiv:1004.5514. Bibcode:2010JPCM...22O4105T. doi:10.1088/0953-8984/22/41/414105. PMID 21386588. S2CID 103345.
- अदृश्यमार्कोव प्रारूप का खुलासा परिचय मार्क स्टैम्प, सैन जोस स्टेट यूनिवर्सिटी द्वारा।
- अपेक्षा-अधिकतमकरण के साथ एचएमएमकी फिटिंग - पूर्ण व्युत्पत्ति
- HMMs पर चरण-दर-चरण ट्यूटोरियल Archived 2017-08-13 at the Wayback Machine (लीड्स विश्वविद्यालय)
- अदृश्यमार्कोव प्रारूप (बुनियादी गणित का उपयोग करके प्रदर्शनी)
- अदृश्यमार्कोव प्रारूप (नारद वारकागोडा द्वारा)
- अदृश्यमार्कोव मॉडल: बुनियादी सिद्धांत और अनुप्रयोग भाग 1, /hmmtutorialpart2.pdf भाग 2 (वी. पेट्रुशिन द्वारा)
- जेसन आइजनर द्वारा स्प्रेडशीट पर व्याख्यान, वीडियो और इंटरैक्टिव स्प्रेडशीट
श्रेणी:अदृश्यमार्कोव मॉडल श्रेणी:मार्कोव मॉडल श्रेणी:जैव सूचना विज्ञान श्रेणी:लेख उदाहरण के साथ पायथन (प्रोग्रामिंग भाषा) कोड