अनुक्रमिक पैटर्न खनन: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
'''''अनुक्रमिक पैटर्न खनन''''' [[डेटा माइनिंग|डेटा खनन]] का एक मुख्य विषय है, जो डेटा उदाहरणों के बीच सांख्यिकीय रूप से प्रासंगिक पैटर्न खोजने से संबंधित होता है, जहां मूल्यांकन को अनुक्रम में वितरित किया जाता है। <ref>{{Cite journal | last1 = Mabroukeh | first1 = N. R. | last2 = Ezeife | first2 = C. I. | doi = 10.1145/1824795.1824798 | title = अनुक्रमिक पैटर्न खनन एल्गोरिदम की एक वर्गीकरण| journal = ACM Computing Surveys | volume = 43 | pages = 1–41 | year = 2010 | citeseerx = 10.1.1.332.4745 | s2cid = 207180619 }}</ref> सामान्य रूप से यह माना जाता है कि मूल्यांकन असतत होता हैं, और इस प्रकार [[समय श्रृंखला]] खनन निकटता से संबंधित है, लेकिन सामान्य रूप से इसको एक अलग गतिविधि माना जाता है। तथा अनुक्रमिक पैटर्न खनन [[संरचित डेटा खनन]] का एक विशेष स्थिति होती है। | '''''अनुक्रमिक पैटर्न खनन''''' [[डेटा माइनिंग|डेटा खनन]] का एक मुख्य विषय है, जो डेटा उदाहरणों के बीच सांख्यिकीय रूप से प्रासंगिक पैटर्न खोजने से संबंधित होता है, जहां मूल्यांकन को अनुक्रम में वितरित किया जाता है। <ref>{{Cite journal | last1 = Mabroukeh | first1 = N. R. | last2 = Ezeife | first2 = C. I. | doi = 10.1145/1824795.1824798 | title = अनुक्रमिक पैटर्न खनन एल्गोरिदम की एक वर्गीकरण| journal = ACM Computing Surveys | volume = 43 | pages = 1–41 | year = 2010 | citeseerx = 10.1.1.332.4745 | s2cid = 207180619 }}</ref> सामान्य रूप से यह माना जाता है कि मूल्यांकन असतत होता हैं, और इस प्रकार [[समय श्रृंखला]] खनन निकटता से संबंधित है, लेकिन सामान्य रूप से इसको एक अलग गतिविधि माना जाता है। तथा अनुक्रमिक पैटर्न खनन [[संरचित डेटा खनन]] का एक विशेष स्थिति होती है। | ||
इस क्षेत्र में कई प्रमुख पारंपरिक कम्प्यूटेशनल समस्याओं का समाधान किया गया है। इनमें अनुक्रम की जानकारी के लिए कुशल डेटाबेस और सूचियाँ बनाना, बार-बार होने वाले पैटर्न को निकालना, समानता के लिए अनुक्रमों की तुलना करना और लापता अनुक्रम सदस्यों को पुनर्प्राप्त करना सम्मिलित होता है। सामान्य रूप से अनुक्रम खनन की समस्याओं को श्रृंखला खनन के रूप में वर्गीकृत किया जा सकता है जो सामान्य रूप से [[स्ट्रिंग (कंप्यूटर विज्ञान)|श्रृंखला]] प्रसंस्करण कलन विधि और आइटमसेट खनन पर आधारित होता है, जो संगठन नियम सीखने पर आधारित होता है। स्थानीय प्रक्रिया प्रारूप <ref>{{Cite journal | last1 = Tax| first1 = N. | last2 = Sidorova | first2 = N. | last3 = Haakma | first3 = R. | last4 = van der Aalst | first4 = Wil M. P. | doi = 10.1016/j.jides.2016.11.001 | title = खनन स्थानीय प्रक्रिया मॉडल| journal = Journal of Innovation in Digital Ecosystems | volume = 3 |issue=2 | pages = 183–196 | year = 2016 | arxiv = 1606.06066 | s2cid = 10872379 }}</ref> अनुक्रमिक पैटर्न खनन को अधिक जटिल पैटर्न तक विस्तारित करते हैं। जिसमें अनुक्रमिक क्रम निर्माण केअतिरिक्त (अनन्य) विकल्प, लूप और समवर्ती निर्माण सम्मिलित | इस क्षेत्र में कई प्रमुख पारंपरिक कम्प्यूटेशनल समस्याओं का समाधान किया गया है। इनमें अनुक्रम की जानकारी के लिए कुशल डेटाबेस और सूचियाँ बनाना, बार-बार होने वाले पैटर्न को निकालना, समानता के लिए अनुक्रमों की तुलना करना और लापता अनुक्रम सदस्यों को पुनर्प्राप्त करना सम्मिलित होता है। सामान्य रूप से अनुक्रम खनन की समस्याओं को श्रृंखला खनन के रूप में वर्गीकृत किया जा सकता है जो सामान्य रूप से [[स्ट्रिंग (कंप्यूटर विज्ञान)|श्रृंखला]] प्रसंस्करण कलन विधि और आइटमसेट खनन पर आधारित होता है, जो संगठन नियम सीखने पर आधारित होता है। स्थानीय प्रक्रिया प्रारूप <ref>{{Cite journal | last1 = Tax| first1 = N. | last2 = Sidorova | first2 = N. | last3 = Haakma | first3 = R. | last4 = van der Aalst | first4 = Wil M. P. | doi = 10.1016/j.jides.2016.11.001 | title = खनन स्थानीय प्रक्रिया मॉडल| journal = Journal of Innovation in Digital Ecosystems | volume = 3 |issue=2 | pages = 183–196 | year = 2016 | arxiv = 1606.06066 | s2cid = 10872379 }}</ref> अनुक्रमिक पैटर्न खनन को अधिक जटिल पैटर्न तक विस्तारित करते हैं। जिसमें अनुक्रमिक क्रम निर्माण केअतिरिक्त (अनन्य) विकल्प, लूप और समवर्ती निर्माण सम्मिलित हो सकते हैं। | ||
== श्रृंखला खनन == | == श्रृंखला खनन == | ||
श्रृंखला खनन सामान्य रूप से [[क्रम|अनुक्रम]] में दिखाई देने वाली वस्तुओं के लिए सीमित [[वर्णमाला]] से संबंधित होता है, लेकिन अनुक्रम स्वयं सामान्य रूप से बहुत लंबा हो सकता है। वे एक वर्णमाला के उदाहरण हो सकते हैं, जो [[ASCII]] | श्रृंखला खनन सामान्य रूप से [[क्रम|अनुक्रम]] में दिखाई देने वाली वस्तुओं के लिए सीमित [[वर्णमाला]] से संबंधित होता है, लेकिन अनुक्रम स्वयं सामान्य रूप से बहुत लंबा हो सकता है। वे एक वर्णमाला के उदाहरण हो सकते हैं, जो [[ASCII]] वर्ण समुच्चय में प्राकृतिक भाषा पाठ में उपयोग किए जाते हैं, [[न्यूक्लियोटाइड]] आधार 'A', 'G', 'C और 'T', [[डीएनए|DNA]] अनुक्रमों में या [[प्रोटीन]] अनुक्रमों के लिए [[अमीनो अम्ल]] जीव विज्ञान के अनुप्रयोगों में स्ट्रिंग्स में वर्णमाला की व्यवस्था के विश्लेषण का उपयोग [[जीन]] और [[प्रोटीन अनुक्रम|प्रोटीन अनुक्रमों]] की जांच करने के लिए उनके गुणों को निर्धारित करने के लिए किया जा सकता है। DNA या प्रोटीन के अक्षरों के क्रम को जानना अपने आप में अंतिम लक्ष्य नहीं होता है। लेकिन प्रमुख कार्य इसकी संरचना और जैविक कार्य के संदर्भ में अनुक्रम को समझना होता है। यह सामान्य रूप से पहले प्रत्येक अनुक्रम के अन्दर अलग-अलग क्षेत्रों या संरचनात्मक इकाइयों की पहचान करके और पुनः प्रत्येक संरचनात्मक इकाई को कार्य निर्दिष्ट करके प्राप्त किया जाता है। कई परिस्थितियों में इसके लिए पहले अध्ययन किए गए अनुक्रमों के साथ दिए गए अनुक्रम की तुलना करने की आवश्यकता होती है। जो श्रृंखला में [[सम्मिलन (आनुवांशिकी)]], [[विलोपन (आनुवांशिकी)|विलोपन]] और उत्परिवर्तन होने पर श्रृंखला के बीच तुलना जटिल हो जाती है। | ||
जैव सूचना विज्ञान अनुक्रम तुलना के लिए प्रमुख कलनविधि का एक सर्वेक्षण और वर्गीकरण अबूएलहोडा और घनम 2010 द्वारा प्रस्तुत किया गया है, जिसमें निम्न सम्मिलित होते हैं।<ref>{{cite book |first1=M. |last1=Abouelhoda |first2=M. |last2=Ghanem |chapter=String Mining in Bioinformatics |editor-first=M. M. |editor-last=Gaber |title=वैज्ञानिक डेटा खनन और ज्ञान खोज|publisher=Springer |year=2010 |isbn=978-3-642-02787-1 |doi=10.1007/978-3-642-02788-8_9 }}</ref> | जैव सूचना विज्ञान अनुक्रम तुलना के लिए प्रमुख कलनविधि का एक सर्वेक्षण और वर्गीकरण अबूएलहोडा और घनम 2010 द्वारा प्रस्तुत किया गया है, जिसमें निम्न सम्मिलित होते हैं।<ref>{{cite book |first1=M. |last1=Abouelhoda |first2=M. |last2=Ghanem |chapter=String Mining in Bioinformatics |editor-first=M. M. |editor-last=Gaber |title=वैज्ञानिक डेटा खनन और ज्ञान खोज|publisher=Springer |year=2010 |isbn=978-3-642-02787-1 |doi=10.1007/978-3-642-02788-8_9 }}</ref> | ||
Line 15: | Line 15: | ||
आइटम सेट खनन के लिए प्रमुख कलनविधि का एक सर्वेक्षण और वर्गीकरण हान एट अल द्वारा 2007 मे प्रस्तुत किया गया है।<ref>{{cite journal |first1=J. |last1=Han |first2=H. |last2=Cheng |first3=D. |last3=Xin |first4=X. |last4=Yan |title=फ़्रीक्वेंसी पैटर्न माइनिंग: वर्तमान स्थिति और भविष्य की दिशाएँ|journal=Data Mining and Knowledge Discovery |year=2007 |volume=15 |issue=1 |pages=55–86 |doi=10.1007/s10618-006-0059-1 |doi-access=free }}</ref> | आइटम सेट खनन के लिए प्रमुख कलनविधि का एक सर्वेक्षण और वर्गीकरण हान एट अल द्वारा 2007 मे प्रस्तुत किया गया है।<ref>{{cite journal |first1=J. |last1=Han |first2=H. |last2=Cheng |first3=D. |last3=Xin |first4=X. |last4=Yan |title=फ़्रीक्वेंसी पैटर्न माइनिंग: वर्तमान स्थिति और भविष्य की दिशाएँ|journal=Data Mining and Knowledge Discovery |year=2007 |volume=15 |issue=1 |pages=55–86 |doi=10.1007/s10618-006-0059-1 |doi-access=free }}</ref> | ||
निरन्तर आइटमसेट खनन के लिए अनुक्रम डेटाबेस पर लागू होने वाली दो सामान्य तकनीकें प्रभावशाली [[एप्रीओरी एल्गोरिदम|प्रागनुभव कलनविधि]] और अधिक-हाल की | निरन्तर आइटमसेट खनन के लिए अनुक्रम डेटाबेस पर लागू होने वाली दो सामान्य तकनीकें प्रभावशाली [[एप्रीओरी एल्गोरिदम|प्रागनुभव कलनविधि]] और अधिक-हाल की FP-वृद्धि तकनीक प्रमुख होती हैं। | ||
== अनुप्रयोग == | == अनुप्रयोग == | ||
उत्पादों की एक बड़ी विविधता और उपयोगकर्ता के खरीद व्यवहार के साथ जिस चट्टान पर उत्पादों को प्रदर्शित किया जा रहा है, वह खुदरा वातावरण में सबसे महत्वपूर्ण संसाधनों में से एक है। खुदरा विक्रेता न केवल अपना लाभ बढ़ा सकते हैं, बल्कि चट्टान आवंटन स्थान और उत्पादों के प्रदर्शन के उचित प्रबंधन से लागत को भी कम कर सकते हैं। तथा इस समस्या को हल करने के लिए, जॉर्ज और बीनू ने 2013 मे | उत्पादों की एक बड़ी विविधता और उपयोगकर्ता के खरीद व्यवहार के साथ जिस चट्टान पर उत्पादों को प्रदर्शित किया जा रहा है, वह खुदरा वातावरण में सबसे महत्वपूर्ण संसाधनों में से एक है। खुदरा विक्रेता न केवल अपना लाभ बढ़ा सकते हैं, बल्कि चट्टान आवंटन स्थान और उत्पादों के प्रदर्शन के उचित प्रबंधन से लागत को भी कम कर सकते हैं। तथा इस समस्या को हल करने के लिए, जॉर्ज और बीनू ने 2013 मे पहले से ही निर्धारित स्पैन कलनविधि का उपयोग करके माइन उपयोगकर्ता ख़रीदने के पैटर्न के लिए एक दृष्टिकोण प्रस्तावित किया है और माइन्ड क्रय पैटर्न के क्रम के आधार पर उत्पादों को अलमारियों पर रखा गया है।<ref>{{cite journal |first1=A. |last1=George |first2=D. |last2=Binu |title=PrefixSpan एल्गोरिथम का उपयोग करके सुपरमार्केट में उत्पाद प्लेसमेंट के लिए एक दृष्टिकोण|journal=Journal of King Saud University-Computer and Information Sciences |volume=25 |issue=1 |year=2013 |pages=77–87 |doi=10.1016/j.jksuci.2012.07.001 |doi-access=free }}</ref> | ||
== एल्गोरिदम == | == एल्गोरिदम == | ||
सामान्य रूप से निम्नलिखित उपयोग किए जाने वाले कलन विधि में सम्मिलित हैं। | |||
* [[जीएसपी एल्गोरिदम]] | * [[जीएसपी एल्गोरिदम|जीएसपी कलन विधि]] | ||
* समतुल्यता वर्गों (SPADE) का उपयोग करके अनुक्रमिक पैटर्न | * समतुल्यता वर्गों (SPADE) का उपयोग करके अनुक्रमिक पैटर्न कि खोज | ||
* फ्रीस्पैन | * फ्रीस्पैन | ||
* प्रीफिक्सस्पैन | * प्रीफिक्सस्पैन | ||
* एमएपीरेस<ref>{{cite journal|last=Ahmad|first=Ishtiaq|author2=Qazi, Wajahat M. |author3=Khurshid, Ahmed |author4=Ahmad, Munir |author5=Hoessli, Daniel C. |author6=Khawaja, Iffat |author7=Choudhary, M. Iqbal |author8=Shakoori, Abdul R. |author9= Nasir-ud-Din |title=MAPRes: पोस्ट-ट्रांसलेशनल संशोधनों के लिए लक्षित अमीनो एसिड के आसपास पसंदीदा अमीनो एसिड अवशेषों के बीच खनन संघ पैटर्न|journal=Proteomics|date=1 May 2008|volume=8|issue=10|pages=1954–1958|doi=10.1002/pmic.200700657|pmid=18491291|s2cid=22362167}}</ref> | * एमएपीरेस<ref>{{cite journal|last=Ahmad|first=Ishtiaq|author2=Qazi, Wajahat M. |author3=Khurshid, Ahmed |author4=Ahmad, Munir |author5=Hoessli, Daniel C. |author6=Khawaja, Iffat |author7=Choudhary, M. Iqbal |author8=Shakoori, Abdul R. |author9= Nasir-ud-Din |title=MAPRes: पोस्ट-ट्रांसलेशनल संशोधनों के लिए लक्षित अमीनो एसिड के आसपास पसंदीदा अमीनो एसिड अवशेषों के बीच खनन संघ पैटर्न|journal=Proteomics|date=1 May 2008|volume=8|issue=10|pages=1954–1958|doi=10.1002/pmic.200700657|pmid=18491291|s2cid=22362167}}</ref> | ||
* Seq2Pat (बाधा-आधारित अनुक्रमिक पैटर्न खनन के लिए)<ref name="hosseininasab2019">{{cite journal | doi = 10.1609/aaai.v33i01.33011495 |vauthors=Hosseininasab A, van Hoeve WJ, Cire AA | year = 2019 | title = निर्णय आरेखों के साथ बाधा-आधारित अनुक्रमिक पैटर्न खनन| url = https://www.aaai.org/ojs/index.php/AAAI/article/view/3962 | journal = Proceedings of the AAAI Conference on Artificial Intelligence | volume = 33 | pages = 1495–1502 |arxiv=1811.06086 |s2cid=53427299 | doi-access = free }}</ref><ref>{{Cite web|url=https://github.com/fidelity/seq2pat|title = Seq2Pat: अनुक्रम-से-पैटर्न जनरेशन लाइब्रेरी|website = [[GitHub]]|date = 9 April 2022}}</ref> | * Seq2Pat (बाधा-आधारित अनुक्रमिक पैटर्न खनन के लिए)<ref name="hosseininasab2019">{{cite journal | doi = 10.1609/aaai.v33i01.33011495 |vauthors=Hosseininasab A, van Hoeve WJ, Cire AA | year = 2019 | title = निर्णय आरेखों के साथ बाधा-आधारित अनुक्रमिक पैटर्न खनन| url = https://www.aaai.org/ojs/index.php/AAAI/article/view/3962 | journal = Proceedings of the AAAI Conference on Artificial Intelligence | volume = 33 | pages = 1495–1502 |arxiv=1811.06086 |s2cid=53427299 | doi-access = free }}</ref><ref>{{Cite web|url=https://github.com/fidelity/seq2pat|title = Seq2Pat: अनुक्रम-से-पैटर्न जनरेशन लाइब्रेरी|website = [[GitHub]]|date = 9 April 2022}}</ref> | ||
== यह भी देखें == | == यह भी देखें == | ||
* {{annotated link| | * {{annotated link|कोलोकेशन एक्सट्रैक्शन}} | ||
* {{annotated link| | * {{annotated link|प्रक्रिया खनन}} | ||
* {{annotated link| | * {{annotated link|अनुक्रम विश्लेषण}} | ||
* {{annotated link| | * {{annotated link|सामाजिक विज्ञान में अनुक्रम विश्लेषण}} | ||
* {{annotated link| | * {{annotated link|अनुक्रम क्लस्टरिंग}} | ||
* {{annotated link| | * {{annotated link|अनुक्रम लेबलिंग}} | ||
==संदर्भ== | ==संदर्भ== | ||
{{reflist|2}} | {{reflist|2}} |
Revision as of 15:39, 10 December 2022
अनुक्रमिक पैटर्न खनन डेटा खनन का एक मुख्य विषय है, जो डेटा उदाहरणों के बीच सांख्यिकीय रूप से प्रासंगिक पैटर्न खोजने से संबंधित होता है, जहां मूल्यांकन को अनुक्रम में वितरित किया जाता है। [1] सामान्य रूप से यह माना जाता है कि मूल्यांकन असतत होता हैं, और इस प्रकार समय श्रृंखला खनन निकटता से संबंधित है, लेकिन सामान्य रूप से इसको एक अलग गतिविधि माना जाता है। तथा अनुक्रमिक पैटर्न खनन संरचित डेटा खनन का एक विशेष स्थिति होती है।
इस क्षेत्र में कई प्रमुख पारंपरिक कम्प्यूटेशनल समस्याओं का समाधान किया गया है। इनमें अनुक्रम की जानकारी के लिए कुशल डेटाबेस और सूचियाँ बनाना, बार-बार होने वाले पैटर्न को निकालना, समानता के लिए अनुक्रमों की तुलना करना और लापता अनुक्रम सदस्यों को पुनर्प्राप्त करना सम्मिलित होता है। सामान्य रूप से अनुक्रम खनन की समस्याओं को श्रृंखला खनन के रूप में वर्गीकृत किया जा सकता है जो सामान्य रूप से श्रृंखला प्रसंस्करण कलन विधि और आइटमसेट खनन पर आधारित होता है, जो संगठन नियम सीखने पर आधारित होता है। स्थानीय प्रक्रिया प्रारूप [2] अनुक्रमिक पैटर्न खनन को अधिक जटिल पैटर्न तक विस्तारित करते हैं। जिसमें अनुक्रमिक क्रम निर्माण केअतिरिक्त (अनन्य) विकल्प, लूप और समवर्ती निर्माण सम्मिलित हो सकते हैं।
श्रृंखला खनन
श्रृंखला खनन सामान्य रूप से अनुक्रम में दिखाई देने वाली वस्तुओं के लिए सीमित वर्णमाला से संबंधित होता है, लेकिन अनुक्रम स्वयं सामान्य रूप से बहुत लंबा हो सकता है। वे एक वर्णमाला के उदाहरण हो सकते हैं, जो ASCII वर्ण समुच्चय में प्राकृतिक भाषा पाठ में उपयोग किए जाते हैं, न्यूक्लियोटाइड आधार 'A', 'G', 'C और 'T', DNA अनुक्रमों में या प्रोटीन अनुक्रमों के लिए अमीनो अम्ल जीव विज्ञान के अनुप्रयोगों में स्ट्रिंग्स में वर्णमाला की व्यवस्था के विश्लेषण का उपयोग जीन और प्रोटीन अनुक्रमों की जांच करने के लिए उनके गुणों को निर्धारित करने के लिए किया जा सकता है। DNA या प्रोटीन के अक्षरों के क्रम को जानना अपने आप में अंतिम लक्ष्य नहीं होता है। लेकिन प्रमुख कार्य इसकी संरचना और जैविक कार्य के संदर्भ में अनुक्रम को समझना होता है। यह सामान्य रूप से पहले प्रत्येक अनुक्रम के अन्दर अलग-अलग क्षेत्रों या संरचनात्मक इकाइयों की पहचान करके और पुनः प्रत्येक संरचनात्मक इकाई को कार्य निर्दिष्ट करके प्राप्त किया जाता है। कई परिस्थितियों में इसके लिए पहले अध्ययन किए गए अनुक्रमों के साथ दिए गए अनुक्रम की तुलना करने की आवश्यकता होती है। जो श्रृंखला में सम्मिलन (आनुवांशिकी), विलोपन और उत्परिवर्तन होने पर श्रृंखला के बीच तुलना जटिल हो जाती है।
जैव सूचना विज्ञान अनुक्रम तुलना के लिए प्रमुख कलनविधि का एक सर्वेक्षण और वर्गीकरण अबूएलहोडा और घनम 2010 द्वारा प्रस्तुत किया गया है, जिसमें निम्न सम्मिलित होते हैं।[3]
- बार-बार होने वाली समस्याएं: जो एकल अनुक्रमों पर संचालन के साथ काम करता है और सटीक श्रृंखला खोज कलनविधि या अनुमानित श्रृंखला मिलान विधियों पर आधारित हो सकता है, जो बिखरी हुई निश्चित लंबाई और अधिकतम लंबाई और अग्रानुक्रम को दोहराता है, तथा अद्वितीय अनुगामी और लापता (अन-वर्तनी) अनुगामी को खोजता है।
- संरेखण की समस्याएं: जो पहले एक या एक से अधिक अनुक्रमों को संरेखित करके तार के बीच तुलना से निपटता है। तथा लोकप्रिय विधियों के उदाहरणों में डेटाबेस में एकाधिक अनुक्रमों के साथ एकल अनुक्रम की तुलना करने के लिए विस्फोट और एकाधिक संरेखण के लिए ClustalW सम्मिलित होता हैं। संरेखण कलनविधि या तो सटीक या अनुमानित तरीकों पर आधारित हो सकते हैं, और इसे वैश्विक संरेखण, अर्ध-वैश्विक संरेखण और स्थानीय संरेखण के रूप में भी वर्गीकृत किया जा सकता है। अनुक्रम संरेखण देखें।
आइटमसेट खनन
अनुक्रम खनन में कुछ समस्याएं बार-बार आने वाले आइटमसेट और उनके दिखाई देने वाले क्रम की खोज करने के लिए स्वयं को उधार देती हैं, उदाहरण के लिए कोई यदि कोई ग्राहक कार खरीदता है, तो वह 1 सप्ताह के अन्दर बीमा खरीद सकता है। यह इन नियमों की मांग कर रहा है। या भण्डार की कीमतों के संदर्भ में, यदि नोकिया और एरिक्सन के ऊपर यह तो संभावना होती है, कि मोटोरोला और सैमसंग 2 दिनों के अन्दर परंपरागत रूप से बड़े लेनदेन में अधिकांश होने वाली वस्तुओं के बीच नियमितताओं की खोज के लिए विपणन अनुप्रयोगों में आइटमसेट खनन का उपयोग किया जाता है। उदाहरण के लिए एक उच्चमार्केट में ग्राहक खरीदारी टोकरी के लेन-देन का विश्लेषण करके, एक नियम बना सकता है, जो पढ़ता है कि यदि कोई ग्राहक एक साथ प्याज और आलू खरीदता है, तो वह उसी लेनदेन में हैमबर्गर खाद्य भी खरीद सकता है।
आइटम सेट खनन के लिए प्रमुख कलनविधि का एक सर्वेक्षण और वर्गीकरण हान एट अल द्वारा 2007 मे प्रस्तुत किया गया है।[4]
निरन्तर आइटमसेट खनन के लिए अनुक्रम डेटाबेस पर लागू होने वाली दो सामान्य तकनीकें प्रभावशाली प्रागनुभव कलनविधि और अधिक-हाल की FP-वृद्धि तकनीक प्रमुख होती हैं।
अनुप्रयोग
उत्पादों की एक बड़ी विविधता और उपयोगकर्ता के खरीद व्यवहार के साथ जिस चट्टान पर उत्पादों को प्रदर्शित किया जा रहा है, वह खुदरा वातावरण में सबसे महत्वपूर्ण संसाधनों में से एक है। खुदरा विक्रेता न केवल अपना लाभ बढ़ा सकते हैं, बल्कि चट्टान आवंटन स्थान और उत्पादों के प्रदर्शन के उचित प्रबंधन से लागत को भी कम कर सकते हैं। तथा इस समस्या को हल करने के लिए, जॉर्ज और बीनू ने 2013 मे पहले से ही निर्धारित स्पैन कलनविधि का उपयोग करके माइन उपयोगकर्ता ख़रीदने के पैटर्न के लिए एक दृष्टिकोण प्रस्तावित किया है और माइन्ड क्रय पैटर्न के क्रम के आधार पर उत्पादों को अलमारियों पर रखा गया है।[5]
एल्गोरिदम
सामान्य रूप से निम्नलिखित उपयोग किए जाने वाले कलन विधि में सम्मिलित हैं।
- जीएसपी कलन विधि
- समतुल्यता वर्गों (SPADE) का उपयोग करके अनुक्रमिक पैटर्न कि खोज
- फ्रीस्पैन
- प्रीफिक्सस्पैन
- एमएपीरेस[6]
- Seq2Pat (बाधा-आधारित अनुक्रमिक पैटर्न खनन के लिए)[7][8]
यह भी देखें
- कोलोकेशन एक्सट्रैक्शन
- प्रक्रिया खनन
- अनुक्रम विश्लेषण
- सामाजिक विज्ञान में अनुक्रम विश्लेषण
- अनुक्रम क्लस्टरिंग
- अनुक्रम लेबलिंग
संदर्भ
- ↑ Mabroukeh, N. R.; Ezeife, C. I. (2010). "अनुक्रमिक पैटर्न खनन एल्गोरिदम की एक वर्गीकरण". ACM Computing Surveys. 43: 1–41. CiteSeerX 10.1.1.332.4745. doi:10.1145/1824795.1824798. S2CID 207180619.
- ↑ Tax, N.; Sidorova, N.; Haakma, R.; van der Aalst, Wil M. P. (2016). "खनन स्थानीय प्रक्रिया मॉडल". Journal of Innovation in Digital Ecosystems. 3 (2): 183–196. arXiv:1606.06066. doi:10.1016/j.jides.2016.11.001. S2CID 10872379.
- ↑ Abouelhoda, M.; Ghanem, M. (2010). "String Mining in Bioinformatics". In Gaber, M. M. (ed.). वैज्ञानिक डेटा खनन और ज्ञान खोज. Springer. doi:10.1007/978-3-642-02788-8_9. ISBN 978-3-642-02787-1.
- ↑ Han, J.; Cheng, H.; Xin, D.; Yan, X. (2007). "फ़्रीक्वेंसी पैटर्न माइनिंग: वर्तमान स्थिति और भविष्य की दिशाएँ". Data Mining and Knowledge Discovery. 15 (1): 55–86. doi:10.1007/s10618-006-0059-1.
- ↑ George, A.; Binu, D. (2013). "PrefixSpan एल्गोरिथम का उपयोग करके सुपरमार्केट में उत्पाद प्लेसमेंट के लिए एक दृष्टिकोण". Journal of King Saud University-Computer and Information Sciences. 25 (1): 77–87. doi:10.1016/j.jksuci.2012.07.001.
- ↑ Ahmad, Ishtiaq; Qazi, Wajahat M.; Khurshid, Ahmed; Ahmad, Munir; Hoessli, Daniel C.; Khawaja, Iffat; Choudhary, M. Iqbal; Shakoori, Abdul R.; Nasir-ud-Din (1 May 2008). "MAPRes: पोस्ट-ट्रांसलेशनल संशोधनों के लिए लक्षित अमीनो एसिड के आसपास पसंदीदा अमीनो एसिड अवशेषों के बीच खनन संघ पैटर्न". Proteomics. 8 (10): 1954–1958. doi:10.1002/pmic.200700657. PMID 18491291. S2CID 22362167.
- ↑ Hosseininasab A, van Hoeve WJ, Cire AA (2019). "निर्णय आरेखों के साथ बाधा-आधारित अनुक्रमिक पैटर्न खनन". Proceedings of the AAAI Conference on Artificial Intelligence. 33: 1495–1502. arXiv:1811.06086. doi:10.1609/aaai.v33i01.33011495. S2CID 53427299.
- ↑ "Seq2Pat: अनुक्रम-से-पैटर्न जनरेशन लाइब्रेरी". GitHub. 9 April 2022.
इस पेज में लापता आंतरिक लिंक की सूची
- एसोसिएशन नियम सीखना
- म्यूटेशन
- जीवविज्ञान
- समारोह (जीव विज्ञान)
- पैटर्न खरीदना
बाहरी संबंध
- SPMF includes open-source implementations of GSP, PrefixSpan, SPADE, SPAM and many others.