अनुक्रमिक पैटर्न खनन: Difference between revisions

Latest revision as of 10:16, 14 December 2022

अनुक्रमिक पैटर्न खनन डेटा खनन का एक मुख्य विषय है, जो डेटा उदाहरणों के बीच सांख्यिकीय रूप से प्रासंगिक पैटर्न खोजने से संबंधित होता है, जहां मूल्यांकन को अनुक्रम में वितरित किया जाता है। ^[1] सामान्य रूप से यह माना जाता है कि मूल्यांकन असतत होता हैं, और इस प्रकार समय श्रृंखला खनन निकटता से संबंधित है, लेकिन सामान्य रूप से इसको एक अलग गतिविधि माना जाता है। तथा अनुक्रमिक पैटर्न खनन संरचित डेटा खनन का एक विशेष स्थिति होती है।

इस क्षेत्र में कई प्रमुख पारंपरिक कम्प्यूटेशनल समस्याओं का समाधान किया गया है। इनमें अनुक्रम की जानकारी के लिए कुशल डेटाबेस और सूचियाँ बनाना, बार-बार होने वाले पैटर्न को निकालना, समानता के लिए अनुक्रमों की तुलना करना और लापता अनुक्रम सदस्यों को पुनर्प्राप्त करना सम्मिलित होता है। सामान्य रूप से अनुक्रम खनन की समस्याओं को श्रृंखला खनन के रूप में वर्गीकृत किया जा सकता है जो सामान्य रूप से श्रृंखला प्रसंस्करण कलन विधि और आइटमसेट खनन पर आधारित होता है, जो संगठन नियम सीखने पर आधारित होता है। स्थानीय प्रक्रिया प्रारूप ^[2] अनुक्रमिक पैटर्न खनन को अधिक जटिल पैटर्न तक विस्तारित करते हैं। जिसमें अनुक्रमिक क्रम निर्माण केअतिरिक्त (अनन्य) विकल्प, लूप और समवर्ती निर्माण सम्मिलित हो सकते हैं।

श्रृंखला खनन

श्रृंखला खनन सामान्य रूप से अनुक्रम में दिखाई देने वाली वस्तुओं के लिए सीमित वर्णमाला से संबंधित होता है, लेकिन अनुक्रम स्वयं सामान्य रूप से बहुत लंबा हो सकता है। वे एक वर्णमाला के उदाहरण हो सकते हैं, जो ASCII वर्ण समुच्चय में प्राकृतिक भाषा पाठ में उपयोग किए जाते हैं, न्यूक्लियोटाइड आधार 'A', 'G', 'C और 'T', DNA अनुक्रमों में या प्रोटीन अनुक्रमों के लिए अमीनो अम्ल जीव विज्ञान के अनुप्रयोगों में स्ट्रिंग्स में वर्णमाला की व्यवस्था के विश्लेषण का उपयोग जीन और प्रोटीन अनुक्रमों की जांच करने के लिए उनके गुणों को निर्धारित करने के लिए किया जा सकता है। DNA या प्रोटीन के अक्षरों के क्रम को जानना अपने आप में अंतिम लक्ष्य नहीं होता है। लेकिन प्रमुख कार्य इसकी संरचना और जैविक कार्य के संदर्भ में अनुक्रम को समझना होता है। यह सामान्य रूप से पहले प्रत्येक अनुक्रम के अन्दर अलग-अलग क्षेत्रों या संरचनात्मक इकाइयों की पहचान करके और पुनः प्रत्येक संरचनात्मक इकाई को कार्य निर्दिष्ट करके प्राप्त किया जाता है। कई परिस्थितियों में इसके लिए पहले अध्ययन किए गए अनुक्रमों के साथ दिए गए अनुक्रम की तुलना करने की आवश्यकता होती है। जो श्रृंखला में सम्मिलन (आनुवांशिकी), विलोपन और उत्परिवर्तन होने पर श्रृंखला के बीच तुलना जटिल हो जाती है।

जैव सूचना विज्ञान अनुक्रम तुलना के लिए प्रमुख कलनविधि का एक सर्वेक्षण और वर्गीकरण अबूएलहोडा और घनम 2010 द्वारा प्रस्तुत किया गया है, जिसमें निम्न सम्मिलित होते हैं।^[3]

बार-बार होने वाली समस्याएं: जो एकल अनुक्रमों पर संचालन के साथ काम करता है और सटीक श्रृंखला खोज कलनविधि या अनुमानित श्रृंखला मिलान विधियों पर आधारित हो सकता है, जो बिखरी हुई निश्चित लंबाई और अधिकतम लंबाई और अग्रानुक्रम को दोहराता है, तथा अद्वितीय अनुगामी और लापता (अन-वर्तनी) अनुगामी को खोजता है।
संरेखण की समस्याएं: जो पहले एक या एक से अधिक अनुक्रमों को संरेखित करके तार के बीच तुलना से निपटता है। तथा लोकप्रिय विधियों के उदाहरणों में डेटाबेस में एकाधिक अनुक्रमों के साथ एकल अनुक्रम की तुलना करने के लिए विस्फोट और एकाधिक संरेखण के लिए ClustalW सम्मिलित होता हैं। संरेखण कलनविधि या तो सटीक या अनुमानित तरीकों पर आधारित हो सकते हैं, और इसे वैश्विक संरेखण, अर्ध-वैश्विक संरेखण और स्थानीय संरेखण के रूप में भी वर्गीकृत किया जा सकता है। अनुक्रम संरेखण देखें।

आइटमसेट खनन

अनुक्रम खनन में कुछ समस्याएं बार-बार आने वाले आइटमसेट और उनके दिखाई देने वाले क्रम की खोज करने के लिए स्वयं को उधार देती हैं, उदाहरण के लिए कोई यदि कोई ग्राहक कार खरीदता है, तो वह 1 सप्ताह के अन्दर बीमा खरीद सकता है। यह इन नियमों की मांग कर रहा है। या भण्डार की कीमतों के संदर्भ में, यदि नोकिया और एरिक्सन के ऊपर यह तो संभावना होती है, कि मोटोरोला और सैमसंग 2 दिनों के अन्दर परंपरागत रूप से बड़े लेनदेन में अधिकांश होने वाली वस्तुओं के बीच नियमितताओं की खोज के लिए विपणन अनुप्रयोगों में आइटमसेट खनन का उपयोग किया जाता है। उदाहरण के लिए एक उच्चमार्केट में ग्राहक खरीदारी टोकरी के लेन-देन का विश्लेषण करके, एक नियम बना सकता है, जो पढ़ता है कि यदि कोई ग्राहक एक साथ प्याज और आलू खरीदता है, तो वह उसी लेनदेन में हैमबर्गर खाद्य भी खरीद सकता है।

आइटम सेट खनन के लिए प्रमुख कलनविधि का एक सर्वेक्षण और वर्गीकरण हान एट अल द्वारा 2007 मे प्रस्तुत किया गया है।^[4]

निरन्तर आइटमसेट खनन के लिए अनुक्रम डेटाबेस पर लागू होने वाली दो सामान्य तकनीकें प्रभावशाली प्रागनुभव कलनविधि और अधिक-हाल की FP-वृद्धि तकनीक प्रमुख होती हैं।

अनुप्रयोग

उत्पादों की एक बड़ी विविधता और उपयोगकर्ता के खरीद व्यवहार के साथ जिस चट्टान पर उत्पादों को प्रदर्शित किया जा रहा है, वह खुदरा वातावरण में सबसे महत्वपूर्ण संसाधनों में से एक है। खुदरा विक्रेता न केवल अपना लाभ बढ़ा सकते हैं, बल्कि चट्टान आवंटन स्थान और उत्पादों के प्रदर्शन के उचित प्रबंधन से लागत को भी कम कर सकते हैं। तथा इस समस्या को हल करने के लिए, जॉर्ज और बीनू ने 2013 मे पहले से ही निर्धारित स्पैन कलनविधि का उपयोग करके माइन उपयोगकर्ता ख़रीदने के पैटर्न के लिए एक दृष्टिकोण प्रस्तावित किया है और माइन्ड क्रय पैटर्न के क्रम के आधार पर उत्पादों को अलमारियों पर रखा गया है।^[5]

एल्गोरिदम

सामान्य रूप से निम्नलिखित उपयोग किए जाने वाले कलन विधि में सम्मिलित हैं।

जीएसपी कलन विधि
समतुल्यता वर्गों (SPADE) का उपयोग करके अनुक्रमिक पैटर्न कि खोज
फ्रीस्पैन
प्रीफिक्सस्पैन
एमएपीरेस^[6]
Seq2Pat (बाधा-आधारित अनुक्रमिक पैटर्न खनन के लिए)^[7]^[8]

यह भी देखें

संदर्भ

↑ Mabroukeh, N. R.; Ezeife, C. I. (2010). "अनुक्रमिक पैटर्न खनन एल्गोरिदम की एक वर्गीकरण". ACM Computing Surveys. 43: 1–41. CiteSeerX 10.1.1.332.4745. doi:10.1145/1824795.1824798. S2CID 207180619.
↑ Tax, N.; Sidorova, N.; Haakma, R.; van der Aalst, Wil M. P. (2016). "खनन स्थानीय प्रक्रिया मॉडल". Journal of Innovation in Digital Ecosystems. 3 (2): 183–196. arXiv:1606.06066. doi:10.1016/j.jides.2016.11.001. S2CID 10872379.
↑ Abouelhoda, M.; Ghanem, M. (2010). "String Mining in Bioinformatics". In Gaber, M. M. (ed.). वैज्ञानिक डेटा खनन और ज्ञान खोज. Springer. doi:10.1007/978-3-642-02788-8_9. ISBN 978-3-642-02787-1.
↑ Han, J.; Cheng, H.; Xin, D.; Yan, X. (2007). "फ़्रीक्वेंसी पैटर्न माइनिंग: वर्तमान स्थिति और भविष्य की दिशाएँ". Data Mining and Knowledge Discovery. 15 (1): 55–86. doi:10.1007/s10618-006-0059-1.
↑ George, A.; Binu, D. (2013). "PrefixSpan एल्गोरिथम का उपयोग करके सुपरमार्केट में उत्पाद प्लेसमेंट के लिए एक दृष्टिकोण". Journal of King Saud University-Computer and Information Sciences. 25 (1): 77–87. doi:10.1016/j.jksuci.2012.07.001.
↑ Ahmad, Ishtiaq; Qazi, Wajahat M.; Khurshid, Ahmed; Ahmad, Munir; Hoessli, Daniel C.; Khawaja, Iffat; Choudhary, M. Iqbal; Shakoori, Abdul R.; Nasir-ud-Din (1 May 2008). "MAPRes: पोस्ट-ट्रांसलेशनल संशोधनों के लिए लक्षित अमीनो एसिड के आसपास पसंदीदा अमीनो एसिड अवशेषों के बीच खनन संघ पैटर्न". Proteomics. 8 (10): 1954–1958. doi:10.1002/pmic.200700657. PMID 18491291. S2CID 22362167.
↑ Hosseininasab A, van Hoeve WJ, Cire AA (2019). "निर्णय आरेखों के साथ बाधा-आधारित अनुक्रमिक पैटर्न खनन". Proceedings of the AAAI Conference on Artificial Intelligence. 33: 1495–1502. arXiv:1811.06086. doi:10.1609/aaai.v33i01.33011495. S2CID 53427299.
↑ "Seq2Pat: अनुक्रम-से-पैटर्न जनरेशन लाइब्रेरी". GitHub. 9 April 2022.

इस पेज में लापता आंतरिक लिंक की सूची

एसोसिएशन नियम सीखना
म्यूटेशन
जीवविज्ञान
समारोह (जीव विज्ञान)
पैटर्न खरीदना

बाहरी संबंध

SPMF includes open-source implementations of GSP, PrefixSpan, SPADE, SPAM and many others.

[1] Mabroukeh, N. R.; Ezeife, C. I. (2010). "अनुक्रमिक पैटर्न खनन एल्गोरिदम की एक वर्गीकरण". ACM Computing Surveys. 43: 1–41. CiteSeerX 10.1.1.332.4745. doi:10.1145/1824795.1824798. S2CID 207180619.

[2] Tax, N.; Sidorova, N.; Haakma, R.; van der Aalst, Wil M. P. (2016). "खनन स्थानीय प्रक्रिया मॉडल". Journal of Innovation in Digital Ecosystems. 3 (2): 183–196. arXiv:1606.06066. doi:10.1016/j.jides.2016.11.001. S2CID 10872379.

[3] Abouelhoda, M.; Ghanem, M. (2010). "String Mining in Bioinformatics". In Gaber, M. M. (ed.). वैज्ञानिक डेटा खनन और ज्ञान खोज. Springer. doi:10.1007/978-3-642-02788-8_9. ISBN 978-3-642-02787-1.

[4] Han, J.; Cheng, H.; Xin, D.; Yan, X. (2007). "फ़्रीक्वेंसी पैटर्न माइनिंग: वर्तमान स्थिति और भविष्य की दिशाएँ". Data Mining and Knowledge Discovery. 15 (1): 55–86. doi:10.1007/s10618-006-0059-1.

[5] George, A.; Binu, D. (2013). "PrefixSpan एल्गोरिथम का उपयोग करके सुपरमार्केट में उत्पाद प्लेसमेंट के लिए एक दृष्टिकोण". Journal of King Saud University-Computer and Information Sciences. 25 (1): 77–87. doi:10.1016/j.jksuci.2012.07.001.

[6] Ahmad, Ishtiaq; Qazi, Wajahat M.; Khurshid, Ahmed; Ahmad, Munir; Hoessli, Daniel C.; Khawaja, Iffat; Choudhary, M. Iqbal; Shakoori, Abdul R.; Nasir-ud-Din (1 May 2008). "MAPRes: पोस्ट-ट्रांसलेशनल संशोधनों के लिए लक्षित अमीनो एसिड के आसपास पसंदीदा अमीनो एसिड अवशेषों के बीच खनन संघ पैटर्न". Proteomics. 8 (10): 1954–1958. doi:10.1002/pmic.200700657. PMID 18491291. S2CID 22362167.

[hosseininasab2019-7] Hosseininasab A, van Hoeve WJ, Cire AA (2019). "निर्णय आरेखों के साथ बाधा-आधारित अनुक्रमिक पैटर्न खनन". Proceedings of the AAAI Conference on Artificial Intelligence. 33: 1495–1502. arXiv:1811.06086. doi:10.1609/aaai.v33i01.33011495. S2CID 53427299.

[8] "Seq2Pat: अनुक्रम-से-पैटर्न जनरेशन लाइब्रेरी". GitHub. 9 April 2022.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

@@ Line 1: / Line 1: @@
-अनुक्रमिक पैटर्न माइनिंग [[डेटा माइनिंग]] का एक विषय है जो डेटा उदाहरणों के बीच सांख्यिकीय रूप से प्रासंगिक पैटर्न खोजने से संबंधित है जहां मान अनुक्रम में वितरित किए जाते हैं।<ref>{{Cite journal | last1 = Mabroukeh | first1 = N. R. | last2 = Ezeife | first2 = C. I. | doi = 10.1145/1824795.1824798 | title = अनुक्रमिक पैटर्न खनन एल्गोरिदम की एक वर्गीकरण| journal = ACM Computing Surveys | volume = 43 | pages = 1–41 | year = 2010 | citeseerx = 10.1.1.332.4745 | s2cid = 207180619 }}</ref> आमतौर पर यह माना जाता है कि मूल्य असतत हैं, और इस प्रकार [[समय श्रृंखला]] खनन निकटता से संबंधित है, लेकिन आमतौर पर इसे एक अलग गतिविधि माना जाता है। अनुक्रमिक पैटर्न खनन [[संरचित डेटा खनन]] का एक विशेष मामला है।
+'''''अनुक्रमिक पैटर्न खनन'''''  [[डेटा माइनिंग|डेटा खनन]] का एक मुख्य विषय है, जो डेटा उदाहरणों के बीच सांख्यिकीय रूप से प्रासंगिक पैटर्न खोजने से संबंधित होता है, जहां मूल्यांकन को अनुक्रम में वितरित किया जाता है। <ref>{{Cite journal | last1 = Mabroukeh | first1 = N. R. | last2 = Ezeife | first2 = C. I. | doi = 10.1145/1824795.1824798 | title = अनुक्रमिक पैटर्न खनन एल्गोरिदम की एक वर्गीकरण| journal = ACM Computing Surveys | volume = 43 | pages = 1–41 | year = 2010 | citeseerx = 10.1.1.332.4745 | s2cid = 207180619 }}</ref> सामान्य रूप से यह माना जाता है कि मूल्यांकन असतत होता हैं, और इस प्रकार [[समय श्रृंखला]] खनन निकटता से संबंधित है, लेकिन सामान्य रूप से इसको एक अलग गतिविधि माना जाता है। तथा अनुक्रमिक पैटर्न खनन [[संरचित डेटा खनन]] का एक विशेष स्थिति होती है।
-इस क्षेत्र में कई प्रमुख पारंपरिक कम्प्यूटेशनल समस्याओं का समाधान किया गया है। इनमें अनुक्रम जानकारी के लिए कुशल डेटाबेस और इंडेक्स बनाना, बार-बार होने वाले पैटर्न को निकालना, समानता के लिए अनुक्रमों की तुलना करना और लापता अनुक्रम सदस्यों को पुनर्प्राप्त करना शामिल है। सामान्य तौर पर, अनुक्रम खनन की समस्याओं को स्ट्रिंग खनन के रूप में वर्गीकृत किया जा सकता है जो आमतौर पर [[स्ट्रिंग (कंप्यूटर विज्ञान)]] और आइटमसेट खनन पर आधारित होता है जो आमतौर पर संघ नियम सीखने पर आधारित होता है। स्थानीय प्रक्रिया मॉडल <ref>{{Cite journal | last1 = Tax| first1 = N. | last2 = Sidorova | first2 = N. | last3 = Haakma | first3 = R. | last4 = van der Aalst | first4 = Wil M. P. | doi = 10.1016/j.jides.2016.11.001 | title = खनन स्थानीय प्रक्रिया मॉडल| journal = Journal of Innovation in Digital Ecosystems | volume = 3 |issue=2 | pages = 183–196 | year = 2016 | arxiv = 1606.06066 | s2cid = 10872379 }}</ref> अधिक जटिल पैटर्न के लिए अनुक्रमिक पैटर्न खनन का विस्तार करें जिसमें अनुक्रमिक ऑर्डरिंग निर्माण के अतिरिक्त (अनन्य) विकल्प, लूप और समवर्ती निर्माण शामिल हो सकते हैं।
+इस क्षेत्र में कई प्रमुख पारंपरिक कम्प्यूटेशनल समस्याओं का समाधान किया गया है। इनमें अनुक्रम की जानकारी के लिए कुशल डेटाबेस और सूचियाँ बनाना, बार-बार होने वाले पैटर्न को निकालना, समानता के लिए अनुक्रमों की तुलना करना और लापता अनुक्रम सदस्यों को पुनर्प्राप्त करना सम्मिलित होता है। सामान्य रूप से अनुक्रम खनन की समस्याओं को श्रृंखला खनन के रूप में वर्गीकृत किया जा सकता है जो सामान्य रूप से [[स्ट्रिंग (कंप्यूटर विज्ञान)|श्रृंखला]] प्रसंस्करण कलन विधि और आइटमसेट खनन पर आधारित होता है, जो संगठन नियम सीखने पर आधारित होता है। स्थानीय प्रक्रिया प्रारूप <ref>{{Cite journal | last1 = Tax| first1 = N. | last2 = Sidorova | first2 = N. | last3 = Haakma | first3 = R. | last4 = van der Aalst | first4 = Wil M. P. | doi = 10.1016/j.jides.2016.11.001 | title = खनन स्थानीय प्रक्रिया मॉडल| journal = Journal of Innovation in Digital Ecosystems | volume = 3 |issue=2 | pages = 183–196 | year = 2016 | arxiv = 1606.06066 | s2cid = 10872379 }}</ref> अनुक्रमिक पैटर्न खनन को अधिक जटिल पैटर्न तक विस्तारित करते हैं। जिसमें अनुक्रमिक क्रम निर्माण केअतिरिक्त (अनन्य) विकल्प, लूप और समवर्ती निर्माण सम्मिलित हो सकते हैं।
-== स्ट्रिंग माइनिंग ==
+== श्रृंखला खनन ==
-स्ट्रिंग माइनिंग आमतौर पर अनु[[क्रम]] में दिखाई देने वाली वस्तुओं के लिए सीमित [[वर्णमाला]] से संबंधित है, लेकिन अनुक्रम स्वयं आमतौर पर बहुत लंबा हो सकता है। एक वर्णमाला के उदाहरण वे हो सकते हैं जो [[ASCII]] वर्ण सेट में प्राकृतिक भाषा पाठ, [[न्यूक्लियोटाइड]] बेस 'ए', 'जी', 'सी' और 'टी' [[[[डीएनए]] अनुक्रम]]ों में, या [[प्रोटीन]] अनुक्रमों के लिए [[अमीनो अम्ल]] में उपयोग किए जाते हैं। जीव विज्ञान अनुप्रयोगों में स्ट्रिंग्स में वर्णमाला की व्यवस्था के विश्लेषण का उपयोग [[जीन]] और [[प्रोटीन अनुक्रम]]ों की जांच करने के लिए उनके गुणों को निर्धारित करने के लिए किया जा सकता है। डीएनए या प्रोटीन के अक्षरों के क्रम को जानना अपने आप में अंतिम लक्ष्य नहीं है। बल्कि, प्रमुख कार्य इसकी संरचना और कार्य (जीव विज्ञान) के संदर्भ में अनुक्रम को समझना है। यह आमतौर पर पहले प्रत्येक अनुक्रम के भीतर अलग-अलग क्षेत्रों या संरचनात्मक इकाइयों की पहचान करके और फिर प्रत्येक संरचनात्मक इकाई को एक कार्य निर्दिष्ट करके प्राप्त किया जाता है। कई मामलों में इसके लिए पहले अध्ययन किए गए अनुक्रमों के साथ दिए गए अनुक्रम की तुलना करने की आवश्यकता होती है। एक स्ट्रिंग में [[सम्मिलन (आनुवांशिकी)]], [[विलोपन (आनुवांशिकी)]] और उत्परिवर्तन होने पर तार के बीच तुलना जटिल हो जाती है।
+श्रृंखला खनन सामान्य रूप से [[क्रम|अनुक्रम]] में दिखाई देने वाली वस्तुओं के लिए सीमित [[वर्णमाला]] से संबंधित होता है, लेकिन अनुक्रम स्वयं सामान्य रूप से बहुत लंबा हो सकता है। वे एक वर्णमाला के उदाहरण हो सकते हैं, जो [[ASCII]] वर्ण समुच्चय में प्राकृतिक भाषा पाठ में उपयोग किए जाते हैं, [[न्यूक्लियोटाइड]] आधार 'A', 'G', 'C और 'T', [[डीएनए|DNA]] अनुक्रमों में या [[प्रोटीन]] अनुक्रमों के लिए [[अमीनो अम्ल]] जीव विज्ञान के अनुप्रयोगों में स्ट्रिंग्स में वर्णमाला की व्यवस्था के विश्लेषण का उपयोग [[जीन]] और [[प्रोटीन अनुक्रम|प्रोटीन अनुक्रमों]] की जांच करने के लिए उनके गुणों को निर्धारित करने के लिए किया जा सकता है। DNA या प्रोटीन के अक्षरों के क्रम को जानना अपने आप में अंतिम लक्ष्य नहीं होता है। लेकिन प्रमुख कार्य इसकी संरचना और जैविक कार्य के संदर्भ में अनुक्रम को समझना होता है। यह सामान्य रूप से पहले प्रत्येक अनुक्रम के अन्दर अलग-अलग क्षेत्रों या संरचनात्मक इकाइयों की पहचान करके और पुनः प्रत्येक संरचनात्मक इकाई को कार्य निर्दिष्ट करके प्राप्त किया जाता है। कई परिस्थितियों में इसके लिए पहले अध्ययन किए गए अनुक्रमों के साथ दिए गए अनुक्रम की तुलना करने की आवश्यकता होती है। जो श्रृंखला में [[सम्मिलन (आनुवांशिकी)]], [[विलोपन (आनुवांशिकी)|विलोपन]] और उत्परिवर्तन होने पर श्रृंखला के बीच तुलना जटिल हो जाती है।
-बायोइन्फॉर्मेटिक्स के लिए अनुक्रम तुलना के लिए प्रमुख एल्गोरिदम का एक सर्वेक्षण और टैक्सोनॉमी अबूएलहोडा और घानेम (2010) द्वारा प्रस्तुत किया गया है, जिसमें शामिल हैं:<ref>{{cite book |first1=M. |last1=Abouelhoda |first2=M. |last2=Ghanem |chapter=String Mining in Bioinformatics |editor-first=M. M. |editor-last=Gaber |title=वैज्ञानिक डेटा खनन और ज्ञान खोज|publisher=Springer |year=2010 |isbn=978-3-642-02787-1 |doi=10.1007/978-3-642-02788-8_9 }}</ref>
+जैव सूचना विज्ञान अनुक्रम तुलना के लिए प्रमुख कलनविधि का एक सर्वेक्षण और वर्गीकरण अबूएलहोडा और घनम 2010 द्वारा प्रस्तुत किया गया है, जिसमें निम्न सम्मिलित होते हैं।<ref>{{cite book |first1=M. |last1=Abouelhoda |first2=M. |last2=Ghanem |chapter=String Mining in Bioinformatics |editor-first=M. M. |editor-last=Gaber |title=वैज्ञानिक डेटा खनन और ज्ञान खोज|publisher=Springer |year=2010 |isbn=978-3-642-02787-1 |doi=10.1007/978-3-642-02788-8_9 }}</ref>
-* दोहराव से संबंधित समस्याएं: जो एकल अनुक्रमों पर संचालन से निपटती हैं और [[स्ट्रिंग खोज एल्गोरिथ्म]] या [[अनुमानित स्ट्रिंग मिलान]] विधियों पर आधारित हो सकती हैं, जो बिखरी हुई निश्चित लंबाई और अधिकतम लंबाई को दोहराती हैं, अग्रानुक्रम दोहराती हैं, और अद्वितीय अनुगामी और लापता (अन-वर्तनी) का पता लगाती हैं। ) अनुवर्ती।
+* '''बार-बार होने वाली समस्याएं:''' जो एकल अनुक्रमों पर संचालन के साथ काम करता है और सटीक [[स्ट्रिंग खोज एल्गोरिथ्म|श्रृंखला खोज कलनविधि]] या [[अनुमानित स्ट्रिंग मिलान|अनुमानित]] [[स्ट्रिंग खोज एल्गोरिथ्म|श्रृंखला]] मिलान विधियों पर आधारित हो सकता है, जो बिखरी हुई निश्चित लंबाई और अधिकतम लंबाई और अग्रानुक्रम को दोहराता है, तथा अद्वितीय अनुगामी और लापता (अन-वर्तनी) अनुगामी को खोजता है।
-* संरेखण समस्याएं: जो पहले एक या अधिक अनुक्रमों को संरेखित करके तारों के बीच तुलना से निपटती हैं; लोकप्रिय विधियों के उदाहरणों में डेटाबेस में एकाधिक अनुक्रमों के साथ एकल अनुक्रम की तुलना करने के लिए [[BLAST]] और एकाधिक संरेखण के लिए [[ClustalW]] शामिल हैं। संरेखण एल्गोरिदम या तो सटीक या अनुमानित तरीकों पर आधारित हो सकते हैं, और इसे वैश्विक संरेखण, अर्ध-वैश्विक संरेखण और स्थानीय संरेखण के रूप में भी वर्गीकृत किया जा सकता है। [[अनुक्रम संरेखण]] देखें।
+* '''संरेखण की समस्याएं:''' जो पहले एक या एक से अधिक अनुक्रमों को संरेखित करके तार के बीच तुलना से निपटता है। तथा लोकप्रिय विधियों के उदाहरणों में डेटाबेस में एकाधिक अनुक्रमों के साथ एकल अनुक्रम की तुलना करने के लिए [[BLAST|विस्फोट]] और एकाधिक संरेखण के लिए [[ClustalW]] सम्मिलित होता हैं। संरेखण कलनविधि या तो सटीक या अनुमानित तरीकों पर आधारित हो सकते हैं, और इसे वैश्विक संरेखण, अर्ध-वैश्विक संरेखण और स्थानीय संरेखण के रूप में भी वर्गीकृत किया जा सकता है। [[अनुक्रम संरेखण]] देखें।
-== आइटमसेट माइनिंग ==
+== आइटमसेट खनन ==
-सीक्वेंस माइनिंग में कुछ समस्याएं बार-बार आइटमसेट और उनके दिखाई देने वाले क्रम की खोज करने के लिए खुद को उधार देती हैं, उदाहरण के लिए, यदि कोई {ग्राहक कार खरीदता है}, तो वह 1 सप्ताह के भीतर {बीमा खरीद} सकता है, या स्टॉक की कीमतों के संदर्भ में, यदि {नोकिया अप और एरिक्सन अप}, तो यह संभावना है कि {मोटोरोला अप और सैमसंग अप} 2 दिनों के भीतर। परंपरागत रूप से, बड़े लेनदेन में अक्सर होने वाली वस्तुओं के बीच नियमितताओं की खोज के लिए विपणन अनुप्रयोगों में आइटमसेट खनन का उपयोग किया जाता है। उदाहरण के लिए, एक सुपरमार्केट में ग्राहक खरीदारी टोकरी के लेन-देन का विश्लेषण करके, एक नियम तैयार किया जा सकता है जो पढ़ता है कि यदि कोई ग्राहक एक साथ प्याज और आलू खरीदता है, तो वह उसी लेनदेन में हैमबर्गर मांस भी खरीद सकता है।
+अनुक्रम खनन में कुछ समस्याएं बार-बार आने वाले आइटमसेट और उनके दिखाई देने वाले क्रम की खोज करने के लिए स्वयं को उधार देती हैं, उदाहरण के लिए कोई यदि कोई ग्राहक कार खरीदता है, तो वह 1 सप्ताह के अन्दर बीमा खरीद सकता है। यह इन नियमों की मांग कर रहा है। या भण्डार की कीमतों के संदर्भ में, यदि नोकिया और एरिक्सन के ऊपर यह तो संभावना होती है, कि मोटोरोला और सैमसंग 2 दिनों के अन्दर परंपरागत रूप से बड़े लेनदेन में अधिकांश होने वाली वस्तुओं के बीच नियमितताओं की खोज के लिए विपणन अनुप्रयोगों में आइटमसेट खनन का उपयोग किया जाता है। उदाहरण के लिए एक उच्चमार्केट में ग्राहक खरीदारी टोकरी के लेन-देन का विश्लेषण करके, एक नियम बना सकता है, जो पढ़ता है कि यदि कोई ग्राहक एक साथ प्याज और आलू खरीदता है, तो वह उसी लेनदेन में हैमबर्गर खाद्य भी खरीद सकता है।
-आइटम सेट खनन के लिए प्रमुख एल्गोरिदम का एक सर्वेक्षण और वर्गीकरण हान एट अल द्वारा प्रस्तुत किया गया है। (2007)।<ref>{{cite journal |first1=J. |last1=Han |first2=H. |last2=Cheng |first3=D. |last3=Xin |first4=X. |last4=Yan |title=फ़्रीक्वेंसी पैटर्न माइनिंग: वर्तमान स्थिति और भविष्य की दिशाएँ|journal=Data Mining and Knowledge Discovery |year=2007 |volume=15 |issue=1 |pages=55–86 |doi=10.1007/s10618-006-0059-1 |doi-access=free }}</ref>
+आइटम सेट खनन के लिए प्रमुख कलनविधि का एक सर्वेक्षण और वर्गीकरण हान एट अल द्वारा 2007 मे प्रस्तुत किया गया है।<ref>{{cite journal |first1=J. |last1=Han |first2=H. |last2=Cheng |first3=D. |last3=Xin |first4=X. |last4=Yan |title=फ़्रीक्वेंसी पैटर्न माइनिंग: वर्तमान स्थिति और भविष्य की दिशाएँ|journal=Data Mining and Knowledge Discovery |year=2007 |volume=15 |issue=1 |pages=55–86 |doi=10.1007/s10618-006-0059-1 |doi-access=free }}</ref>
-एसोसिएशन रूल लर्निंग माइनिंग के लिए सीक्वेंस डेटाबेस पर लागू होने वाली दो सामान्य तकनीकें हैं प्रभावशाली [[एप्रीओरी एल्गोरिदम]] और हाल ही में एसोसिएशन रूल लर्निंग #FP-ग्रोथ एल्गोरिथम | FP-ग्रोथ तकनीक।
+निरन्तर आइटमसेट खनन के लिए अनुक्रम डेटाबेस पर लागू होने वाली दो सामान्य तकनीकें प्रभावशाली [[एप्रीओरी एल्गोरिदम|प्रागनुभव कलनविधि]] और अधिक-हाल की FP-वृद्धि तकनीक प्रमुख होती हैं।
 == अनुप्रयोग ==
-उत्पादों की एक बड़ी विविधता और उपयोगकर्ता के खरीद व्यवहार के साथ, जिस शेल्फ पर उत्पादों को प्रदर्शित किया जा रहा है, वह खुदरा वातावरण में सबसे महत्वपूर्ण संसाधनों में से एक है। खुदरा विक्रेता न केवल अपना लाभ बढ़ा सकते हैं, बल्कि शेल्फ स्पेस आवंटन और उत्पादों के प्रदर्शन के उचित प्रबंधन से लागत भी कम कर सकते हैं। इस समस्या को हल करने के लिए, जॉर्ज और बीनू (2013) ने PrefixSpan एल्गोरिथम का उपयोग करके माइन यूज़र ख़रीदने के पैटर्न के लिए एक दृष्टिकोण प्रस्तावित किया है और माइन्ड क्रय पैटर्न के क्रम के आधार पर उत्पादों को अलमारियों पर रखा है।<ref>{{cite journal |first1=A. |last1=George |first2=D. |last2=Binu |title=PrefixSpan एल्गोरिथम का उपयोग करके सुपरमार्केट में उत्पाद प्लेसमेंट के लिए एक दृष्टिकोण|journal=Journal of King Saud University-Computer and Information Sciences |volume=25 |issue=1 |year=2013 |pages=77–87 |doi=10.1016/j.jksuci.2012.07.001 |doi-access=free }}</ref>
+उत्पादों की एक बड़ी विविधता और उपयोगकर्ता के खरीद व्यवहार के साथ जिस चट्टान पर उत्पादों को प्रदर्शित किया जा रहा है, वह खुदरा वातावरण में सबसे महत्वपूर्ण संसाधनों में से एक है। खुदरा विक्रेता न केवल अपना लाभ बढ़ा सकते हैं, बल्कि चट्टान आवंटन स्थान और उत्पादों के प्रदर्शन के उचित प्रबंधन से लागत को भी कम कर सकते हैं। तथा इस समस्या को हल करने के लिए, जॉर्ज और बीनू ने 2013 मे पहले से ही निर्धारित स्पैन कलनविधि का उपयोग करके माइन उपयोगकर्ता ख़रीदने के पैटर्न के लिए एक दृष्टिकोण प्रस्तावित किया है और माइन्ड क्रय पैटर्न के क्रम के आधार पर उत्पादों को अलमारियों पर रखा गया है।<ref>{{cite journal |first1=A. |last1=George |first2=D. |last2=Binu |title=PrefixSpan एल्गोरिथम का उपयोग करके सुपरमार्केट में उत्पाद प्लेसमेंट के लिए एक दृष्टिकोण|journal=Journal of King Saud University-Computer and Information Sciences |volume=25 |issue=1 |year=2013 |pages=77–87 |doi=10.1016/j.jksuci.2012.07.001 |doi-access=free }}</ref>
 == एल्गोरिदम ==
-आमतौर पर इस्तेमाल किए जाने वाले एल्गोरिदम में शामिल हैं:
+सामान्य रूप से निम्नलिखित उपयोग किए जाने वाले कलन विधि में सम्मिलित हैं।
-* [[जीएसपी एल्गोरिदम]]
+* [[जीएसपी एल्गोरिदम|जीएसपी कलन विधि]]
-* समतुल्यता वर्गों (SPADE) का उपयोग करके अनुक्रमिक पैटर्न डिस्कवरी
+* समतुल्यता वर्गों (SPADE) का उपयोग करके अनुक्रमिक पैटर्न कि खोज
 * फ्रीस्पैन
 * प्रीफिक्सस्पैन
 * एमएपीरेस<ref>{{cite journal|last=Ahmad|first=Ishtiaq|author2=Qazi, Wajahat M. |author3=Khurshid, Ahmed |author4=Ahmad, Munir |author5=Hoessli, Daniel C. |author6=Khawaja, Iffat |author7=Choudhary, M. Iqbal |author8=Shakoori, Abdul R. |author9= Nasir-ud-Din  |title=MAPRes: पोस्ट-ट्रांसलेशनल संशोधनों के लिए लक्षित अमीनो एसिड के आसपास पसंदीदा अमीनो एसिड अवशेषों के बीच खनन संघ पैटर्न|journal=Proteomics|date=1 May 2008|volume=8|issue=10|pages=1954–1958|doi=10.1002/pmic.200700657|pmid=18491291|s2cid=22362167}}</ref>
 * Seq2Pat (बाधा-आधारित अनुक्रमिक पैटर्न खनन के लिए)<ref name="hosseininasab2019">{{cite journal | doi = 10.1609/aaai.v33i01.33011495 |vauthors=Hosseininasab A, van Hoeve WJ, Cire AA | year = 2019 | title = निर्णय आरेखों के साथ बाधा-आधारित अनुक्रमिक पैटर्न खनन| url = https://www.aaai.org/ojs/index.php/AAAI/article/view/3962 | journal = Proceedings of the AAAI Conference on Artificial Intelligence | volume = 33 | pages = 1495–1502 |arxiv=1811.06086 |s2cid=53427299 | doi-access = free }}</ref><ref>{{Cite web|url=https://github.com/fidelity/seq2pat|title = Seq2Pat: अनुक्रम-से-पैटर्न जनरेशन लाइब्रेरी|website = [[GitHub]]|date = 9 April 2022}}</ref>
 == यह भी देखें ==
-* {{annotated link|Collocation extraction}}
+* {{annotated link|कोलोकेशन एक्सट्रैक्शन}}
-* {{annotated link|Process mining}}
+* {{annotated link|प्रक्रिया खनन}}
-* {{annotated link|Sequence analysis}}
+* {{annotated link|अनुक्रम विश्लेषण}}
-* {{annotated link|Sequence analysis in social sciences}}
+* {{annotated link|सामाजिक विज्ञान में अनुक्रम विश्लेषण}}
-* {{annotated link|Sequence clustering}}
+* {{annotated link|अनुक्रम क्लस्टरिंग}}
-* {{annotated link|Sequence labeling}}
+* {{annotated link|अनुक्रम लेबलिंग}}
 ==संदर्भ==
 {{reflist|2}}
@@ Line 56: / Line 52: @@
 {{Strings |state=collapsed}}
-{{DEFAULTSORT:Sequential Pattern Mining}}[[Category:डाटा माइनिंग]]
+{{DEFAULTSORT:Sequential Pattern Mining}}
-[[Category:जैव सूचना विज्ञान]]
-[[Category:जैव सूचना विज्ञान एल्गोरिदम]]
-[[Category: Machine Translated Page]]
+[[Category:CS1 français-language sources (fr)]]
-[[Category:Created On 05/12/2022]]
+[[Category:CS1 maint]]
+[[Category:CS1 Ελληνικά-language sources (el)]]
+[[Category:Citation Style 1 templates|W]]
+[[Category:Collapse templates]]
+[[Category:Created On 05/12/2022|Sequential Pattern Mining]]
+[[Category:Machine Translated Page|Sequential Pattern Mining]]
+[[Category:Navigational boxes| ]]
+[[Category:Navigational boxes without horizontal lists]]
+[[Category:Pages with script errors|Sequential Pattern Mining]]
+[[Category:Sidebars with styles needing conversion]]
+[[Category:Template documentation pages|Documentation/doc]]
+[[Category:Templates based on the Citation/CS1 Lua module]]
+[[Category:Templates generating COinS|Cite web]]
+[[Category:Templates generating microformats]]
+[[Category:Templates that are not mobile friendly]]
+[[Category:Templates used by AutoWikiBrowser|Cite web]]
+[[Category:Templates using TemplateData]]
+[[Category:Wikipedia fully protected templates|Cite web]]
+[[Category:Wikipedia metatemplates]]
+[[Category:जैव सूचना विज्ञान|Sequential Pattern Mining]]
+[[Category:जैव सूचना विज्ञान एल्गोरिदम|Sequential Pattern Mining]]
+[[Category:डाटा माइनिंग|Sequential Pattern Mining]]

v t e Strings
String metric	Approximate string matching Bitap algorithm Damerau–Levenshtein distance Edit distance Gestalt Pattern Matching Hamming distance Jaro–Winkler distance Lee distance Levenshtein automaton Levenshtein distance Wagner–Fischer algorithm
String-searching algorithm	Apostolico–Giancarlo algorithm Boyer–Moore string-search algorithm Boyer–Moore–Horspool algorithm Knuth–Morris–Pratt algorithm Rabin–Karp algorithm
Multiple string searching	Aho–Corasick Commentz-Walter algorithm
Regular expression	Comparison of regular-expression engines Regular grammar Thompson's construction Nondeterministic finite automaton
Sequence alignment	Hirschberg's algorithm Needleman–Wunsch algorithm Smith–Waterman algorithm
Data structure	DAFSA Suffix array Suffix automaton Suffix tree Generalized suffix tree Rope Ternary search tree Trie
Other	Parsing Pattern matching Compressed pattern matching Longest common subsequence Longest common substring Sequential pattern mining Sorting

Anonymous

Search

अनुक्रमिक पैटर्न खनन: Difference between revisions

Namespaces

More

Page actions

Latest revision as of 10:16, 14 December 2022

Contents

श्रृंखला खनन

आइटमसेट खनन

अनुप्रयोग

एल्गोरिदम

यह भी देखें

संदर्भ

इस पेज में लापता आंतरिक लिंक की सूची

बाहरी संबंध

Navigation

Navigation

Wiki tools

Wiki tools

Anonymous

Search

अनुक्रमिक पैटर्न खनन: Difference between revisions

Latest revision as of 10:16, 14 December 2022

श्रृंखला खनन

आइटमसेट खनन

अनुप्रयोग

एल्गोरिदम

यह भी देखें

संदर्भ

इस पेज में लापता आंतरिक लिंक की सूची

बाहरी संबंध

Navigation

Wiki tools

Page tools

Other projects

Categories