बाइनरी डेटा
बाइनरी डेटा वह डेटा है जिसकी इकाई केवल दो संभावित अवस्थाओं को ग्रहण कर सकती है। इन्हें अधिकांशतः बाइनरी अंक प्रणाली और बूलियन बीजगणित के अनुसार 0 और 1 के रूप में लेबल किया आंकड़े है।
बाइनरी डेटा कई अलग-अलग विधि और वैज्ञानिक क्षेत्रों में होता है, जहां इसे कंप्यूटर विज्ञान में बिट (बाइनरी डिजिट) सहित विभिन्न नामों से पुकारा जा सकता है, गणितीय तर्क और संबंधित डोमेन में सत्य मान और सांख्यिकी में बाइनरी चर है ।
गणितीय और संयोजक नींव
असतत चर जो केवल एक स्थिति ले सकता है उसमें शून्य जानकारी होती है, और 2 1 के बाद अगली प्राकृतिक संख्या है। यही कारण है कि बिट, केवल दो संभावित मानों वाला एक चर सूचना की एक मानक प्राथमिक इकाई है।
n बिट्स के संग्रह में 2n अवस्थाएँ हो सकती हैं: विवरण के लिए बाइनरी संख्या देखें। असतत चरों के संग्रह के स्थिति की संख्या चरों की संख्या पर घातीय कार्य पर निर्भर करती है, और केवल प्रत्येक चर के स्थिति की संख्या पर शक्ति नियम के रूप में दस बिट में तीन दशमलव अंकों (1000) से अधिक (1024) अवस्थाएँ होती हैं। 10k बिट्स सूचना (एक संख्या या कुछ और) का प्रतिनिधित्व करने के लिए पर्याप्त से अधिक हैं जिसकी लिए 3k दशमलव अंक की आवश्यकता होती है इसलिए त्रैमासिक अंक प्रणाली, 4, 5, 6, 7, 8, 9, नेपर... स्थिति के साथ असतत चर में निहित जानकारी को कभी भी दो, तीन, या चार गुना अधिक बिट्स आवंटित करके बदला जा सकता है। इसलिए, 2 के अतिरिक्त किसी अन्य छोटी संख्या का उपयोग लाभ प्रदान नहीं करता है।
इसके अतिरिक्त , बूलियन बीजगणित बिट्स के संग्रह के लिए सुविधाजनक गणितीय संरचना प्रदान करता है, जिसमें प्रस्तावित चर के संग्रह का शब्दार्थ है। कंप्यूटर विज्ञान में बूलियन बीजगणित संचालन को बिटवाइज़ संचालन के रूप में जाना जाता है। बूलियन कार्य का सैद्धांतिक रूप से अच्छी तरह से अध्ययन किया जाता है और आसानी से प्रयुक्त किया जा सकता है, या तो कंप्यूटर प्रोग्राम के साथ या डिजिटल इलेक्ट्रॉनिक्स में तथाकथित लॉजिक गेट द्वारा यह विभिन्न डेटा का प्रतिनिधित्व करने के लिए बिट्स के उपयोग में योगदान देता है, यहां तक कि मूल रूप से बाइनरी नहीं है।
सांख्यिकी में
आँकड़ों में, बाइनरी डेटा सांख्यिकीय डेटा प्रकार होता है जिसमें स्पष्ट डेटा होता है जो A और B, या सिर और पूंछ जैसे दो संभावित मान ले सकता है। इसे द्विभाजित डेटा भी कहा जाता है, और पुराना शब्द क्वांटल डेटा है।[1] दो मान को अधिकांशतः सामान्य रूप से सफलता और असफलता के रूप में संदर्भित किया जाता है।[1] श्रेणीबद्ध डेटा के रूप के रूप में, बाइनरी डेटा नाममात्र डेटा है, जिसका अर्थ है कि मान गुणात्मक गुण हैं और संख्यात्मक रूप से तुलना नहीं की जा सकती। चूँकि, मानों को अधिकांशतः 1 या 0 के रूप में दर्शाया जाता है, जो एकल परीक्षण में सफलताओं की संख्या की गणना के अनुरूप होता है: 1 (सफलता) या 0 (विफलता); देखना § गणना.
अधिकांशतः , बाइनरी डेटा का उपयोग दो वैचारिक रूप से विपरीत मानों में से का प्रतिनिधित्व करने के लिए किया जाता है, जैसे:
- एक प्रयोग के परिणाम (सफलता या असफलता)
- हाँ-नहीं प्रश्न का उत्तर (हाँ या नहीं)
- कुछ विशेषता की उपस्थिति या अनुपस्थिति (उपस्थित है या उपस्थित नहीं है)
- किसी प्रस्ताव की सच्चाई या झूठ (सही या गलत, सही या गलत)
चूँकि, इसका उपयोग उन डेटा के लिए भी किया जा सकता है, जिन्हें केवल दो संभावित मान माना जाता है, तथापि वे वैचारिक रूप से विरोध न करते हों या अवधारणात्मक रूप से अंतरिक्ष में सभी संभावित मानका प्रतिनिधित्व करते हों। उदाहरण के लिए, संयुक्त राज्य अमेरिका, अर्थात रिपब्लिकन पार्टी (संयुक्त राज्य) या डेमोक्रेटिक पार्टी (संयुक्त राज्य) में चुनावों में मतदाताओं की पार्टी की पसंद का प्रतिनिधित्व करने के लिए अधिकांशतः बाइनरी डेटा का उपयोग किया जाता है। इस स्थिति में, कोई अंतर्निहित कारण नहीं है कि क्यों केवल दो राजनीतिक दल का अस्तित्व होना चाहिए, और वास्तव में, अन्य पार्टियां अमेरिका में उपस्थित हैं, किंतु वे इतने छोटे हैं कि उन्हें सामान्यतः अनदेखा कर दिया जाता है। विश्लेषण उद्देश्यों के लिए द्विआधारी चर के रूप में मॉडलिंग निरंतर डेटा (या 2 से अधिक श्रेणियों का श्रेणीबद्ध डेटा) को विवेककरण (एक द्विभाजन बनाना) कहा जाता है। सभी विवेक की तरह, इसमें विवेक की त्रुटि सम्मिलित है, किंतु लक्ष्य त्रुटि के अतिरिक्त कुछ मान वान सीखना है: इसे विकट के रूप में मानना: हाथ में उद्देश्य के लिए नगण्य, किंतु यह याद रखना कि इसे सामान्य रूप से नगण्य नहीं माना जा सकता है।
द्विआधारी चर
एक द्विआधारी चर द्विआधारी प्रकार का यादृच्छिक चर है, जिसका अर्थ है दो संभावित मान। स्वतंत्र और समान रूप से वितरित यादृच्छिक चर (i.i.d.) बाइनरी चर बर्नौली वितरण का पालन करते हैं, किंतु सामान्य बाइनरी डेटा में i.i.d से आने की आवश्यकता नहीं होती है। चर आई.आई.डी. की कुल संख्या द्विआधारी चर (समतुल्य रूप से, 1 या 0 के रूप में कोडित i.i.d. द्विआधारी चर के योग) द्विपद वितरण का पालन करते हैं, किंतु जब द्विआधारी चर i.i.d नहीं होते हैं, तो वितरण को द्विपद होने की आवश्यकता नहीं होती है।
गिनती
श्रेणीबद्ध डेटा की तरह, बाइनरी डेटा को प्रत्येक संभावित मान के लिए निर्देशांक लिखकर और होने वाले मान के लिए 1 की गिनती करके, और न होने वाले मान के लिए 0 की गणना करके डेटा की सरणी डेटा संरचना में परिवर्तित किया जा सकता है।[2] उदाहरण के लिए, यदि मान A और B हैं, तो डेटा समूह A, A, B को (1, 0), (1, 0), (0, 1) के रूप में गिनती में दर्शाया जा सकता है। बार गणना में परिवर्तित हो जाने पर, बाइनरी डेटा को समूहीकृत डेटा और जोड़े गए गणना में सम्मिलित किया जा सकता है। उदाहरण के लिए, यदि समुच्चय A, A, B को समूहीकृत किया जाता है, तो कुल संख्याएँ (2, 1): 2 A's और 1 B (3 परीक्षणों में से) हैं।
चूंकि केवल दो संभावित मान हैं, इसे मान को सफलता और दूसरे को विफलता के रूप में मानते हुए, सफलता के मान को 1 के रूप में और विफलता को 0 के रूप में कोडित करके एकल गणना (एक स्केलर मान) के लिए सरल बनाया जा सकता है (केवल का उपयोग करके) सफलता मान के लिए समन्वय, विफलता मान के लिए समन्वय नहीं)। उदाहरण के लिए, यदि मान A को सफलता माना जाता है (और इस प्रकार B को विफलता माना जाता है), तो डेटा समूह A, A, B को 1, 1, 0 के रूप में दर्शाया जाएगा। जब इसे समूहीकृत किया जाता है, तो मान जोड़े जाते हैं, जबकि संख्या परीक्षण का सामान्यतः निहित ट्रैक किया जाता है। उदाहरण के लिए, A, A, B को 1 + 1 + 0 = 2 सफलताओं के रूप में समूहीकृत किया जाएगा (इनमें से परीक्षण) दूसरी तरफ जाकर, डेटा को गिनें बाइनरी डेटा है, जिसमें दो वर्ग 0 (विफलता) या 1 (सफलता) हैं।
आई.आई.डी. द्विआधारी चर एक द्विपद वितरण का पालन करते हैं, परीक्षणों की कुल संख्या (समूहीकृत डेटा में अंक) के साथ।
प्रतिगमन
अनुमानित परिणामों पर प्रतिगमन विश्लेषण जो द्विआधारी चर हैं, द्विआधारी प्रतिगमन के रूप में जाना जाता है; जब बाइनरी डेटा को गणना डेटा में परिवर्तित किया जाता है और i.i.d के रूप में मॉडलिंग की जाती है। चर (इसलिए उनका द्विपद वितरण है), द्विपद प्रतिगमन का उपयोग किया जा सकता है। बाइनरी डेटा के लिए सबसे आम प्रतिगमन विधियाँ संभार तन्त्र परावर्तन , प्रोबिट प्रतिगमन या संबंधित प्रकार के द्विआधारी विकल्प मॉडल हैं।
इसी तरह आई.आई.डी. दो से अधिक श्रेणियों वाले श्रेणीबद्ध चर को बहुराष्ट्रीय प्रतिगमन के साथ प्रतिरूपित किया जा सकता है। गैर-आई.आई.डी. बाइनरी डेटा को अधिक जटिल वितरणों द्वारा प्रतिरूपित किया जा सकता है, जैसे कि बीटा-द्विपद वितरण (एक यौगिक वितरण)। वैकल्पिक रूप से संबंध को सामान्यीकृत रैखिक मॉडल, जैसे अर्ध-संभावना और अर्ध-समानता मॉडल से विधियों का उपयोग करके आउटपुट चर के वितरण को स्पष्ट रूप से मॉडल करने की आवश्यकता के बिना मॉडल किया जा सकता है; देखना अतिफैलाव § द्विपद.
कंप्यूटर विज्ञान में
आधुनिक कंप्यूटर में, बाइनरी डेटा किसी भी डेटा को उच्च स्तर पर व्याख्या करने या किसी अन्य रूप में डेटा रूपांतरण के अतिरिक्त बाइनरी रूप में प्रदर्शित करने के लिए संदर्भित करता है। निम्नतम स्तर पर, बिट्स को स्थिरता उपकरण जैसे फ्लिप-फ्लॉप (इलेक्ट्रॉनिक्स) फ्लिप-फ्लॉप में संग्रहित किया जाता है। जबकि अधिकांश बाइनरी डेटा का प्रतीकात्मक अर्थ होता है (परवाह नहीं करने के अतिरिक्त ) सभी बाइनरी डेटा संख्यात्मक नहीं होते हैं। कुछ बाइनरी डेटा इंस्ट्रक्शन (कंप्यूटर साइंस) से मेल खाते हैं, जैसे कि प्रोसेसर रजिस्टर के डेटा को नियंत्रण ईकाई द्वारा डिकोड किया जाता है, जो कि लाने-डिकोड-निष्पादित चक्र के साथ होता है। प्रदर्शन कारणों से कंप्यूटर संभवतःही कभी अलग-अलग बिट्स को संशोधित करते हैं। इसके अतिरिक्त , डेटा निश्चित संख्या में बिट्स के समूहों में डेटा संरचना संरेखण है, सामान्यतः 1 बाइट (8 बिट) इसलिए, कंप्यूटर में बाइनरी डेटा वास्तव में बाइट्स के अनुक्रम होते हैं। उच्च स्तर पर, 32-बिट प्रणाली के लिए 1 शब्द (कंप्यूटर आर्किटेक्चर) (4 बाइट्स) के समूहों में और 64-बिट प्रणाली के लिए 2 शब्दों में डेटा उपयोग किया जाता है।
निर्देश (कंप्यूटर विज्ञान) और सूचना प्रौद्योगिकी क्षेत्र में, बाइनरी डेटा शब्द अधिकांशतः टेक्स्ट-आधारित डेटा के विपरीत होता है, जो किसी भी प्रकार के डेटा का संदर्भ देता है जिसे टेक्स्ट के रूप में व्याख्या नहीं किया जा सकता है। पाठ बनाम बाइनरी भेद कभी-कभी फ़ाइल की सिमेंटिक पदार्थ को संदर्भित कर सकता है (उदाहरण के लिए लिखित दस्तावेज़ बनाम डिजिटल छवि)। चूँकि, यह अधिकांशतः विशेष रूप से संदर्भित करता है कि फ़ाइल के अलग-अलग बाइट टेक्स्ट के रूप में व्याख्या करने योग्य हैं (अक्षरों को सांकेतिक अक्षरों में बदलना देखें) या व्याख्या नहीं की जा सकती है। जब यह अंतिम अर्थ अभिप्रेत है तो अधिक विशिष्ट शब्द बाइनरी प्रारूप और पाठ (यूएल) प्रारूप कभी-कभी उपयोग किए जाते हैं। सिमेंटिकली टेक्स्टुअल डेटा को बाइनरी प्रारूप में प्रदर्शित किया जा सकता है (उदाहरण के लिए जब कंप्रेस किया जाता है या कुछ प्रारूप में जो विभिन्न प्रकार के प्रारूप कोड को मिश्रित करते हैं, जैसा कि माइक्रोसॉफ्ट वर्ड द्वारा उपयोग किए जाने वाले डॉक्टर (कंप्यूटिंग) में होता है); इसके विपरीत, छवि डेटा को कभी-कभी पाठ्य प्रारूप में दर्शाया जाता है (उदाहरण के लिए एक्स विंडो प्रणाली में उपयोग किया जाने वाला एक्स पिक्समैप छवि प्रारूप)।
1 और 0 और कुछ नहीं किंतु केवल दो अलग-अलग वोल्टेज स्तर हैं। आप कंप्यूटर को उच्च वोल्टेज के लिए 1 और निम्न वोल्टेज के लिए 0 समझा सकते हैं। दो वोल्टेज स्तरों को संचयन करने के कई अलग-अलग विधि हैं। यदि आपने फ़्लॉपी देखा है, तो आपको चुंबकीय टेप मिलेगा जिसमें फेरोमैग्नेटिक पदार्थ का लेप होता है, यह प्रकार का पैरामैग्नेटिक पदार्थ होता है, जिसमें पदार्थ के माध्यम से धाराओं को हटाने के बाद भी अवशेष चुंबकीय क्षेत्र देने के लिए विशेष दिशा में डोमेन संरेखित होते हैं या चुंबकीय क्षेत्र चुंबकीय टेप में डेटा लोड करने के समय, डोमेन के सहेजे गए अभिविन्यास को कॉल करने के लिए चुंबकीय क्षेत्र को दिशा में पारित किया जाता है और चुंबकीय क्षेत्र को दूसरी दिशा में पारित किया जाता है, तो डोमेन का सहेजा गया अभिविन्यास 0 होता है। इस तरह , सामान्यतः , 1 और 0 डेटा संग्रहीत होते हैं।[3]
राओं को हटाने के बाद भी अवशेष चुंबकीय क्षेत्र देने के लिचुंबकीय क्षेत्र को दिशा में पारित किया जाता है और चुंबकीय क्षेत्र को दूसरी दिशा में पारित किया जाता है, तो डोमेन का
यह भी देखें
- बिट सरणी
- बरनौली वितरण
- बूलियन डेटा प्रकार
- स्मृति
- सुस्पष्ट डेटा
- गुणात्मक तथ्य
संदर्भ
- ↑ 1.0 1.1 Collett 2002, p. 1.
- ↑ Agresti, Alan (2012). "1.2.2 Multinomial Distribution". श्रेणीबद्ध डेटा विश्लेषण (3rd ed.). Wiley. p. 6. ISBN 978-0470463635.
- ↑ Gul, Najam (2022-08-18). "How do different types of Data get stored in form of 0 and 1?". Curiosity Tea (in English). Retrieved 2023-01-05.
- Collett, David (2002). Modelling Binary Data (Second ed.). CRC Press. ISBN 9781420057386.