समानांतर निर्देशांक

From Vigyanwiki
Revision as of 21:09, 10 July 2023 by alpha>Indicwiki (Created page with "{{short description|Chart displaying multivariate data}} right|400px|समानांतर निर्देशांक File:Ggobi-flea2....")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Ggobiनहीं।

समानांतर निर्देशांक बहुभिन्नरूपी डेटा|उच्च-आयामी डेटासेट को देखने और उनका विश्लेषण करने का एक सामान्य तरीका है।

एन-आयामी अंतरिक्ष में बिंदु (ज्यामिति) का एक सेट दिखाने के लिए, एन-आयामी अंतरिक्ष में, एक पृष्ठभूमि तैयार की जाती है जिसमें एन समानांतर (ज्यामिति) रेखाएं होती हैं, जो आमतौर पर ऊर्ध्वाधर और समान दूरी पर होती हैं। एन-आयामी अंतरिक्ष में एक बिंदु को समानांतर अक्षों पर शीर्ष (ज्यामिति) के साथ एक पॉलीलाइन के रूप में दर्शाया जाता है; i-वें अक्ष पर शीर्ष की स्थिति बिंदु के i-वें निर्देशांक से मेल खाती है।

यह विज़ुअलाइज़ेशन समय श्रृंखला विज़ुअलाइज़ेशन से निकटता से संबंधित है, सिवाय इसके कि यह डेटा पर लागू होता है जहां अक्ष समय में बिंदुओं के अनुरूप नहीं होते हैं, और इसलिए प्राकृतिक क्रम नहीं होता है। इसलिए, विभिन्न अक्ष व्यवस्थाएँ रुचिकर हो सकती हैं।

इतिहास

अक्सर कहा जाता है कि समानांतर निर्देशांक का आविष्कार 1885 में फिलबर्ट मौरिस डी'ओकाग्ने ने किया था,[1] लेकिन भले ही किताब के शीर्षक में कोर्डोनीज़ पैरेलल्स शब्द दिखाई देते हैं, लेकिन इस काम का उसी नाम की विज़ुअलाइज़ेशन तकनीकों से कोई लेना-देना नहीं है; पुस्तक केवल समन्वय परिवर्तन की एक विधि का वर्णन करती है। लेकिन 1885 से पहले भी, समानांतर निर्देशांक का उपयोग किया जाता था, उदाहरण के लिए हेनरी गैनेट के जनरल सारांश में, राज्यों की रैंक दिखाते हुए, अनुपात द्वारा, 1880,[2] या उसके बाद 1898 में हेनरी गैनेट की प्रत्येक जनगणना में जनसंख्या में राज्यों और क्षेत्रों की रैंक, 1790-1890 में। उन्हें 87 साल बाद अल्फ्रेड इनसेलबर्ग द्वारा फिर से लोकप्रिय बनाया गया।[3] 1985 में और 1977 से व्यवस्थित रूप से एक समन्वय प्रणाली के रूप में विकसित किया गया। कुछ महत्वपूर्ण अनुप्रयोग हवाई यातायात नियंत्रण (1987-3 यूएसए पेटेंट), डेटा खनन (यूएसए पेटेंट), कंप्यूटर दृष्टि (यूएसए पेटेंट), अनुकूलन के लिए ट्रैफिक टकराव बचाव प्रणाली में हैं। प्रक्रिया नियंत्रण, हाल ही में घुसपैठ का पता लगाने वाली प्रणाली और अन्य जगहों पर।

उच्च आयाम

xy कार्टेशियन समन्वय प्रणाली के साथ समतल पर, समानांतर निर्देशांक में अधिक आयाम जोड़ने (अक्सर संक्षिप्त रूप से ||-कोर्ड्स या पीसीपी) में अधिक अक्षों को जोड़ना शामिल होता है। समानांतर निर्देशांक का मूल्य यह है कि उच्च आयामों में कुछ ज्यामितीय गुण आसानी से देखे जाने वाले 2डी पैटर्न में बदल जाते हैं। उदाहरण के लिए, एन-स्पेस में एक रेखा पर बिंदुओं का एक सेट समानांतर निर्देशांक में पॉलीलाइन के एक सेट में बदल जाता है, जो सभी n − 1 बिंदुओं पर प्रतिच्छेद करते हैं। n = 2 के लिए यह एक बिंदु-रेखा द्वैत उत्पन्न करता है जो बताता है कि समानांतर निर्देशांक की गणितीय नींव यूक्लिडियन अंतरिक्ष स्थान के बजाय प्रक्षेप्य स्थान में क्यों विकसित की जाती है। रेखाओं का एक जोड़ा एक अद्वितीय बिंदु पर प्रतिच्छेद करता है जिसमें दो निर्देशांक होते हैं और इसलिए, एक अद्वितीय रेखा के अनुरूप हो सकता है जिसे दो मापदंडों (या दो बिंदुओं) द्वारा भी निर्दिष्ट किया जाता है। इसके विपरीत, एक वक्र को निर्दिष्ट करने के लिए दो से अधिक बिंदुओं की आवश्यकता होती है और वक्रों की एक जोड़ी में एक अद्वितीय चौराहा नहीं हो सकता है। इसलिए रेखाओं के बजाय समानांतर निर्देशांक में वक्रों का उपयोग करने से, प्रक्षेप्य ज्यामिति के अन्य सभी गुणों और (हाइपर) विमानों, वक्रों, कई चिकनी (हाइपर) सतहों के अनुरूप ज्ञात अच्छे उच्च-आयामी पैटर्न के साथ बिंदु रेखा द्वैत खो जाता है। , निकटता, उत्तलता और हाल ही में गैर-अभिविन्यास।[4] लक्ष्य एन-आयामी संबंधों को 2डी पैटर्न में मैप करना है। इसलिए, समानांतर निर्देशांक एक बिंदु-से-बिंदु मैपिंग नहीं है, बल्कि 2डी सबसेट मैपिंग का एक एनडी सबसेट है, इससे जानकारी का कोई नुकसान नहीं होता है। ध्यान दें: nD में एक बिंदु को भी 2D में एक बिंदु में मैप नहीं किया जाता है, बल्कि एक बहुभुज रेखा में मैप किया जाता है - 2D का एक सबसेट।

सांख्यिकीय विचार

समानांतर निर्देशांक के लिए प्रतिनिधि नमूना.

जब सांख्यिकीय डेटा विज़ुअलाइज़ेशन के लिए उपयोग किया जाता है तो तीन महत्वपूर्ण विचार होते हैं: क्रम, रोटेशन और अक्षों की स्केलिंग।

सुविधाओं को खोजने के लिए अक्षों का क्रम महत्वपूर्ण है, और विशिष्ट डेटा विश्लेषण में कई पुन: क्रम की कोशिश करने की आवश्यकता होगी। कुछ लेखक ऑर्डरिंग हेरिस्टिक्स लेकर आए हैं जो रोशन करने वाले ऑर्डर तैयार कर सकते हैं।[5] अक्षों का घूर्णन समानांतर निर्देशांकों में एक अनुवाद है और यदि रेखाएँ समानांतर अक्षों के बाहर प्रतिच्छेद करती हैं तो इसे घूर्णन द्वारा उनके बीच अनुवादित किया जा सकता है। इसका सबसे सरल उदाहरण अक्ष को 180 डिग्री तक घुमाना है।[6]

स्केलिंग आवश्यक है क्योंकि कथानक चर के लगातार जोड़े के प्रक्षेप (रैखिक संयोजन) पर आधारित है।[6] इसलिए, चर सामान्य पैमाने पर होने चाहिए, और डेटा तैयारी प्रक्रिया के हिस्से के रूप में विचार करने के लिए कई स्केलिंग विधियां हैं जो अधिक जानकारीपूर्ण दृश्य प्रकट कर सकती हैं।

स्प्लिंस के साथ एक सहज समानांतर समन्वय प्लॉट प्राप्त किया जाता है।[7] चिकने कथानक में, प्रत्येक अवलोकन को एक पैरामीट्रिक रेखा (या वक्र) में मैप किया जाता है, जो चिकनी, अक्षों पर निरंतर और प्रत्येक समानांतर अक्ष पर ऑर्थोगोनल होती है। यह डिज़ाइन प्रत्येक डेटा विशेषता के लिए परिमाणीकरण स्तर पर जोर देता है।[6]


पढ़ना

इन्सेलबर्ग (Inselberg 1997) ने समानांतर निर्देशांक के संबंधपरक पैटर्न को दृष्टिगत रूप से पढ़ने के तरीके की पूरी समीक्षा की।[8] जब दो समानांतर अक्षों के बीच अधिकांश रेखाएं कुछ हद तक एक-दूसरे के समानांतर होती हैं, तो यह इन दोनों आयामों के बीच एक सकारात्मक संबंध का सुझाव देती है। जब रेखाएं एक प्रकार के एक्स-आकार के सुपरपोजिशन में क्रॉस करती हैं, तो यह एक नकारात्मक संबंध है। जब रेखाएं बेतरतीब ढंग से कटती हैं या समानांतर होती हैं, तो यह दर्शाता है कि कोई विशेष संबंध नहीं है।

सीमाएँ

समानांतर निर्देशांक में, प्रत्येक अक्ष में अधिकतम दो पड़ोसी अक्ष हो सकते हैं (एक बाईं ओर, और एक दाईं ओर)। डी-आयामी डेटा सेट के लिए, एक समय में अधिकतम डी-1 संबंध दिखाए जा सकते हैं। समय श्रृंखला दृश्य में, एक प्राकृतिक पूर्ववर्ती और उत्तराधिकारी मौजूद होता है; इसलिए इस विशेष मामले में, एक पसंदीदा व्यवस्था मौजूद है। हालाँकि, जब अक्षों का कोई अद्वितीय क्रम नहीं होता है, तो एक अच्छी अक्ष व्यवस्था खोजने के लिए अनुमान और प्रयोग की आवश्यकता होती है। अधिक जटिल संबंधों का पता लगाने के लिए, अक्षों को पुन: व्यवस्थित किया जाना चाहिए।

अक्षों को 3-आयामी स्थान में व्यवस्थित करने से (हालाँकि, अभी भी समानांतर में, कील बिस्तर में कीलों की तरह), एक अक्ष में केंद्रीय विशेषता के चारों ओर एक सर्कल में दो से अधिक पड़ोसी हो सकते हैं, और व्यवस्था की समस्या आसान हो जाती है (उदाहरण के लिए) न्यूनतम फैले हुए पेड़ का उपयोग करना)।[9] इस विज़ुअलाइज़ेशन का एक प्रोटोटाइप डेटा माइनिंग सॉफ़्टवेयर ELKI के विस्तार के रूप में उपलब्ध है। हालाँकि, रैखिक क्रम की तुलना में विज़ुअलाइज़ेशन की व्याख्या करना और उसके साथ बातचीत करना कठिन है।

सॉफ्टवेयर

जबकि समानांतर निर्देशांक के बारे में बड़ी संख्या में कागजात हैं, डेटाबेस को समानांतर निर्देशांक ग्राफिक्स में परिवर्तित करने के लिए केवल कुछ उल्लेखनीय सॉफ़्टवेयर सार्वजनिक रूप से उपलब्ध हैं।[10] उल्लेखनीय सॉफ़्टवेयर हैं ELKI, GGobi, Mondrian डेटा विश्लेषण, ऑरेंज (सॉफ़्टवेयर) और ROOT। पुस्तकालयों में Protovis.js शामिल हैं, D3.js बुनियादी उदाहरण प्रदान करता है। D3.Parcoords.js (एक D3-आधारित लाइब्रेरी) जो विशेष रूप से समानांतर निर्देशांक ग्राफ़िक निर्माण के लिए समर्पित है, भी प्रकाशित किया गया है। पायथन (प्रोग्रामिंग भाषा) डेटा संरचना और विश्लेषण लाइब्रेरी पांडास (सॉफ्टवेयर) प्लॉटिंग लाइब्रेरी matplotlib का उपयोग करके समानांतर निर्देशांक प्लॉटिंग को कार्यान्वित करता है।[11]


बहुभिन्नरूपी डेटा के लिए अन्य विज़ुअलाइज़ेशन

संदर्भ

  1. d'Ocagne, Maurice (1885). Coordonnées parallèles et axiales : Méthode de transformation géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèles. Paris: Gauthier-Villars.
  2. Gannett, Henry. "General Summary Showing the Rank of States by Ratios 1880". {{cite journal}}: Cite journal requires |journal= (help)
  3. Inselberg, Alfred (1985). "समानांतर निर्देशांक वाला विमान". Visual Computer. 1 (4): 69–91. doi:10.1007/BF01898350. S2CID 15933827.
  4. Inselberg, Alfred (2009). Parallel Coordinates: VISUAL Multidimensional Geometry and its Applications. Springer. ISBN 978-0387215075.
  5. Yang, Jing; Peng, Wei; Ward, Matthew O.; Rundensteiner, Elke A. (2003). "उच्च आयामी डेटासेट की खोज के लिए इंटरएक्टिव पदानुक्रमित आयाम ऑर्डरिंग रिक्ति और फ़िल्टरिंग" (PDF). IEEE Symposium on Information Visualization (INFOVIS 2003): 3–4.
  6. 6.0 6.1 6.2 Moustafa, Rida; Wegman, Edward J. (2006). "Multivariate continuous data – Parallel Coordinates". In Unwin, A.; Theus, M.; Hofmann, H. (eds.). Graphics of Large Datasets: Visualizing a Million. Springer. pp. 143–156. ISBN 978-0387329062.
  7. Moustafa, Rida; Wegman, Edward J. (2002). "समानांतर समन्वय भूखंडों के कुछ सामान्यीकरण पर" (PDF). Seeing a Million, A Data Visualization Workshop, Rain Am Lech (Nr.), Germany. Archived from the original (PDF) on 2013-12-24.
  8. Inselberg, A. (1997), "Multidimensional detective", Information Visualization, 1997. Proceedings., IEEE Symposium on, pp. 100–107, doi:10.1109/INFVIS.1997.636793, ISBN 0-8186-8189-6, S2CID 1823293
  9. Elke Achtert, Hans-Peter Kriegel, Erich Schubert, Arthur Zimek (2013). "Interactive Data Mining with 3D-Parallel-Coordinate-Trees". Proceedings of the ACM International Conference on Management of Data (SIGMOD). New York City, NY: 1009–1012. doi:10.1145/2463676.2463696. ISBN 9781450320375. S2CID 14850709.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  10. Kosara, Robert (2010). "समानांतर निर्देशांक".
  11. Parallel Coordinates in Pandas


अग्रिम पठन

  • Heinrich, Julian and Weiskopf, Daniel (2013) State of the Art of Parallel Coordinates, Eurographics 2013 - State of the Art Reports, pp. 95–116
  • Moustafa, Rida (2011) Parallel coordinate and parallel coordinate density plots, Wiley Interdisciplinary Reviews: Computational Statistics, Vol 3(2), pp. 134–148.
  • Weidele, Daniel Karl I. (2019) Conditional Parallel Coordinates, IEEE Visualization Conference (VIS) 2019, pp. 221–225


बाहरी संबंध