बाइनरी डेटा

From Vigyanwiki

बाइनरी डेटा वह डेटा है जिसकी इकाई केवल दो संभावित अवस्थाओं को ग्रहण कर सकती है। इन्हें अधिकांशतः बाइनरी अंक प्रणाली और बूलियन बीजगणित के अनुसार 0 और 1 के रूप में लेबल किया आंकड़े है।

बाइनरी डेटा कई अलग-अलग विधि और वैज्ञानिक क्षेत्रों में होता है, जहां इसे कंप्यूटर विज्ञान में बिट (बाइनरी डिजिट) सहित विभिन्न नामों से पुकारा जा सकता है, गणितीय तर्क और संबंधित डोमेन में सत्य मान और सांख्यिकी में बाइनरी चर है ।

गणितीय और संयोजक नींव

असतत चर जो केवल एक स्थिति ले सकता है उसमें शून्य जानकारी होती है, और 2 1 के बाद अगली प्राकृतिक संख्या है। यही कारण है कि बिट, केवल दो संभावित मानों वाला एक चर सूचना की एक मानक प्राथमिक इकाई है।

n बिट्स के संग्रह में 2n अवस्थाएँ हो सकती हैं: विवरण के लिए बाइनरी संख्या देखें। असतत चरों के संग्रह के स्थिति की संख्या चरों की संख्या पर घातीय कार्य पर निर्भर करती है, और केवल प्रत्येक चर के स्थिति की संख्या पर शक्ति नियम के रूप में दस बिट में तीन दशमलव अंकों (1000) से अधिक (1024) अवस्थाएँ होती हैं। 10k बिट्स सूचना (एक संख्या या कुछ और) का प्रतिनिधित्व करने के लिए पर्याप्त से अधिक हैं जिसकी लिए 3k दशमलव अंक की आवश्यकता होती है इसलिए त्रैमासिक अंक प्रणाली, 4, 5, 6, 7, 8, 9, नेपर... स्थिति के साथ असतत चर में निहित जानकारी को कभी भी दो, तीन, या चार गुना अधिक बिट्स आवंटित करके बदला जा सकता है। इसलिए, 2 के अतिरिक्त किसी अन्य छोटी संख्या का उपयोग लाभ प्रदान नहीं करता है।

एक हास आरेख: निर्देशित ग्राफ के रूप में बूलियन बीजगणित का प्रतिनिधित्व

इसके अतिरिक्त , बूलियन बीजगणित बिट्स के संग्रह के लिए सुविधाजनक गणितीय संरचना प्रदान करता है, जिसमें प्रस्तावित चर के संग्रह का शब्दार्थ है। कंप्यूटर विज्ञान में बूलियन बीजगणित संचालन को बिटवाइज़ संचालन के रूप में जाना जाता है। बूलियन कार्य का सैद्धांतिक रूप से अच्छी तरह से अध्ययन किया जाता है और आसानी से प्रयुक्त किया जा सकता है, या तो कंप्यूटर प्रोग्राम के साथ या डिजिटल इलेक्ट्रॉनिक्स में तथाकथित लॉजिक गेट द्वारा यह विभिन्न डेटा का प्रतिनिधित्व करने के लिए बिट्स के उपयोग में योगदान देता है, यहां तक ​​​​कि मूल रूप से बाइनरी नहीं है।

सांख्यिकी में

आँकड़ों में, बाइनरी डेटा सांख्यिकीय डेटा प्रकार होता है जिसमें स्पष्ट डेटा होता है जो A और B, या सिर और पूंछ जैसे दो संभावित मान ले सकता है। इसे द्विभाजित डेटा भी कहा जाता है, और पुराना शब्द क्वांटल डेटा है।[1] दो मान को अधिकांशतः सामान्य रूप से सफलता और असफलता के रूप में संदर्भित किया जाता है।[1] श्रेणीबद्ध डेटा के रूप के रूप में, बाइनरी डेटा नाममात्र डेटा है, जिसका अर्थ है कि मान गुणात्मक गुण हैं और संख्यात्मक रूप से तुलना नहीं की जा सकती। चूँकि, मानों को अधिकांशतः 1 या 0 के रूप में दर्शाया जाता है, जो एकल परीक्षण में सफलताओं की संख्या की गणना के अनुरूप होता है: 1 (सफलता) या 0 (विफलता); देखना § गणना.

अधिकांशतः , बाइनरी डेटा का उपयोग दो वैचारिक रूप से विपरीत मानों में से का प्रतिनिधित्व करने के लिए किया जाता है, जैसे:

  • एक प्रयोग के परिणाम (सफलता या असफलता)
  • हाँ-नहीं प्रश्न का उत्तर (हाँ या नहीं)
  • कुछ विशेषता की उपस्थिति या अनुपस्थिति (उपस्थित है या उपस्थित नहीं है)
  • किसी प्रस्ताव की सच्चाई या झूठ (सही या गलत, सही या गलत)

चूँकि, इसका उपयोग उन डेटा के लिए भी किया जा सकता है, जिन्हें केवल दो संभावित मान माना जाता है, तथापि वे वैचारिक रूप से विरोध न करते हों या अवधारणात्मक रूप से अंतरिक्ष में सभी संभावित मानका प्रतिनिधित्व करते हों। उदाहरण के लिए, संयुक्त राज्य अमेरिका, अर्थात रिपब्लिकन पार्टी (संयुक्त राज्य) या डेमोक्रेटिक पार्टी (संयुक्त राज्य) में चुनावों में मतदाताओं की पार्टी की पसंद का प्रतिनिधित्व करने के लिए अधिकांशतः बाइनरी डेटा का उपयोग किया जाता है। इस स्थिति में, कोई अंतर्निहित कारण नहीं है कि क्यों केवल दो राजनीतिक दल का अस्तित्व होना चाहिए, और वास्तव में, अन्य पार्टियां अमेरिका में उपस्थित हैं, किंतु वे इतने छोटे हैं कि उन्हें सामान्यतः अनदेखा कर दिया जाता है। विश्लेषण उद्देश्यों के लिए द्विआधारी चर के रूप में मॉडलिंग निरंतर डेटा (या 2 से अधिक श्रेणियों का श्रेणीबद्ध डेटा) को विवेककरण (एक द्विभाजन बनाना) कहा जाता है। सभी विवेक की तरह, इसमें विवेक की त्रुटि सम्मिलित है, किंतु लक्ष्य त्रुटि के अतिरिक्त कुछ मान वान सीखना है: इसे विकट के रूप में मानना: हाथ में उद्देश्य के लिए नगण्य, किंतु यह याद रखना कि इसे सामान्य रूप से नगण्य नहीं माना जा सकता है।

द्विआधारी चर

एक द्विआधारी चर द्विआधारी प्रकार का यादृच्छिक चर है, जिसका अर्थ है दो संभावित मान। स्वतंत्र और समान रूप से वितरित यादृच्छिक चर (i.i.d.) बाइनरी चर बर्नौली वितरण का पालन करते हैं, किंतु सामान्य बाइनरी डेटा में i.i.d से आने की आवश्यकता नहीं होती है। चर आई.आई.डी. की कुल संख्या द्विआधारी चर (समतुल्य रूप से, 1 या 0 के रूप में कोडित i.i.d. द्विआधारी चर के योग) द्विपद वितरण का पालन करते हैं, किंतु जब द्विआधारी चर i.i.d नहीं होते हैं, तो वितरण को द्विपद होने की आवश्यकता नहीं होती है।

गिनती

श्रेणीबद्ध डेटा की तरह, बाइनरी डेटा को प्रत्येक संभावित मान के लिए निर्देशांक लिखकर और होने वाले मान के लिए 1 की गिनती करके, और न होने वाले मान के लिए 0 की गणना करके डेटा की सरणी डेटा संरचना में परिवर्तित किया जा सकता है।[2] उदाहरण के लिए, यदि मान A और B हैं, तो डेटा समूह A, A, B को (1, 0), (1, 0), (0, 1) के रूप में गिनती में दर्शाया जा सकता है। बार गणना में परिवर्तित हो जाने पर, बाइनरी डेटा को समूहीकृत डेटा और जोड़े गए गणना में सम्मिलित किया जा सकता है। उदाहरण के लिए, यदि समुच्चय A, A, B को समूहीकृत किया जाता है, तो कुल संख्याएँ (2, 1): 2 A's और 1 B (3 परीक्षणों में से) हैं।

चूंकि केवल दो संभावित मान हैं, इसे मान को सफलता और दूसरे को विफलता के रूप में मानते हुए, सफलता के मान को 1 के रूप में और विफलता को 0 के रूप में कोडित करके एकल गणना (एक स्केलर मान) के लिए सरल बनाया जा सकता है (केवल का उपयोग करके) सफलता मान के लिए समन्वय, विफलता मान के लिए समन्वय नहीं)। उदाहरण के लिए, यदि मान A को सफलता माना जाता है (और इस प्रकार B को विफलता माना जाता है), तो डेटा समूह A, A, B को 1, 1, 0 के रूप में दर्शाया जाएगा। जब इसे समूहीकृत किया जाता है, तो मान जोड़े जाते हैं, जबकि संख्या परीक्षण का सामान्यतः निहित ट्रैक किया जाता है। उदाहरण के लिए, A, A, B को 1 + 1 + 0 = 2 सफलताओं के रूप में समूहीकृत किया जाएगा (इनमें से परीक्षण) दूसरी तरफ जाकर, डेटा को गिनें बाइनरी डेटा है, जिसमें दो वर्ग 0 (विफलता) या 1 (सफलता) हैं।

आई.आई.डी. द्विआधारी चर एक द्विपद वितरण का पालन करते हैं, परीक्षणों की कुल संख्या (समूहीकृत डेटा में अंक) के साथ।

प्रतिगमन

अनुमानित परिणामों पर प्रतिगमन विश्लेषण जो द्विआधारी चर हैं, द्विआधारी प्रतिगमन के रूप में जाना जाता है; जब बाइनरी डेटा को काउंट डेटा में परिवर्तित किया जाता है और i.i.d के रूप में मॉडलिंग की जाती है। चर (इसलिए उनका द्विपद वितरण है), द्विपद प्रतिगमन का उपयोग किया जा सकता है। बाइनरी डेटा के लिए सबसे आम प्रतिगमन विधियाँ संभार तन्त्र परावर्तन , प्रोबिट प्रतिगमन या संबंधित प्रकार के द्विआधारी विकल्प मॉडल हैं।

इसी तरह आई.आई.डी. दो से अधिक श्रेणियों वाले श्रेणीबद्ध चर को बहुराष्ट्रीय प्रतिगमन के साथ प्रतिरूपित किया जा सकता है। गैर-आई.आई.डी. बाइनरी डेटा को अधिक जटिल वितरणों द्वारा प्रतिरूपित किया जा सकता है, जैसे कि बीटा-द्विपद वितरण (एक यौगिक वितरण)। वैकल्पिक रूप से, रिश्ते को सामान्यीकृत रैखिक मॉडल, जैसे अर्ध-संभावना और अर्ध-समानता मॉडल से तकनीकों का उपयोग करके आउटपुट चर के वितरण को स्पष्ट रूप से मॉडल करने की आवश्यकता के बिना मॉडल किया जा सकता है; देखना Overdispersion § Binomial.

कंप्यूटर विज्ञान में

सामान्य 24-बिट कलर डेप्थ या ट्रू कलर (24-बिट) इमेज के विपरीत, क्यू आर संहिता की द्विआधारी छवि , प्रति पिक्सेल 1 बिट का प्रतिनिधित्व करती है।

आधुनिक कंप्यूटरों में, बाइनरी डेटा किसी भी डेटा को उच्च स्तर पर व्याख्या करने या किसी अन्य रूप में डेटा रूपांतरण के बजाय बाइनरी रूप में प्रदर्शित करने के लिए संदर्भित करता है। निम्नतम स्तर पर, बिट्स को bstability डिवाइस जैसे फ्लिप-फ्लॉप (इलेक्ट्रॉनिक्स) | फ्लिप-फ्लॉप में संग्रहित किया जाता है। जबकि अधिकांश बाइनरी डेटा का प्रतीकात्मक अर्थ होता है (परवाह नहीं करने के अतिरिक्त ) सभी बाइनरी डेटा संख्यात्मक नहीं होते हैं। कुछ बाइनरी डेटा इंस्ट्रक्शन (कंप्यूटर साइंस) से मेल खाते हैं, जैसे कि प्रोसेसर रजिस्टरों के डेटा को नियंत्रण यूनिट द्वारा डिकोड किया जाता है, जो कि लाने-डिकोड-निष्पादित चक्र के साथ होता है। प्रदर्शन कारणों से कंप्यूटर शायद ही कभी अलग-अलग बिट्स को संशोधित करते हैं। इसके बजाय, डेटा निश्चित संख्या में बिट्स के समूहों में डेटा संरचना संरेखण है, आमतौर पर 1 बाइट (8 बिट)। इसलिए, कंप्यूटर में बाइनरी डेटा वास्तव में बाइट्स के अनुक्रम होते हैं। उच्च स्तर पर, 32-बिट सिस्टम के लिए 1 शब्द (कंप्यूटर आर्किटेक्चर) (4 बाइट्स) के समूहों में और 64-बिट सिस्टम के लिए 2 शब्दों में डेटा एक्सेस किया जाता है।

निर्देश (कंप्यूटर विज्ञान) और सूचना प्रौद्योगिकी क्षेत्र में, बाइनरी डेटा शब्द अधिकांशतः टेक्स्ट-आधारित डेटा के विपरीत होता है, जो किसी भी प्रकार के डेटा का संदर्भ देता है जिसे टेक्स्ट के रूप में व्याख्या नहीं किया जा सकता है। पाठ बनाम बाइनरी भेद कभी-कभी फ़ाइल की सिमेंटिक सामग्री को संदर्भित कर सकता है (उदाहरण के लिए लिखित दस्तावेज़ बनाम डिजिटल छवि)। हालांकि, यह अधिकांशतः विशेष रूप से संदर्भित करता है कि फ़ाइल के अलग-अलग बाइट टेक्स्ट के रूप में व्याख्या करने योग्य हैं (अक्षरों को सांकेतिक अक्षरों में बदलना देखें) या व्याख्या नहीं की जा सकती है। जब यह अंतिम अर्थ अभिप्रेत है, तो अधिक विशिष्ट शब्द बाइनरी प्रारूप और पाठ (यूएल) प्रारूप कभी-कभी उपयोग किए जाते हैं। सिमेंटिकली टेक्स्टुअल डेटा को बाइनरी फॉर्मेट में प्रदर्शित किया जा सकता है (उदाहरण के लिए जब कंप्रेस किया जाता है या कुछ फॉर्मेट में जो विभिन्न प्रकार के फॉर्मेटिंग कोड को इंटरमिक्स करते हैं, जैसा कि माइक्रोसॉफ्ट वर्ड द्वारा उपयोग किए जाने वाले डॉक्टर (कंप्यूटिंग) में होता है); इसके विपरीत, छवि डेटा को कभी-कभी पाठ्य प्रारूप में दर्शाया जाता है (उदाहरण के लिए एक्स विंडो सिस्टम में उपयोग किया जाने वाला X PixMap छवि प्रारूप)।

1 और 0 और कुछ नहीं बल्कि सिर्फ दो अलग-अलग वोल्टेज स्तर हैं। आप कंप्यूटर को उच्च वोल्टेज के लिए 1 और निम्न वोल्टेज के लिए 0 समझा सकते हैं। दो वोल्टेज स्तरों को स्टोर करने के कई अलग-अलग तरीके हैं। यदि आपने फ़्लॉपी देखा है, तो आपको चुंबकीय टेप मिलेगा जिसमें फेरोमैग्नेटिक सामग्री का लेप होता है, यह प्रकार का पैरामैग्नेटिक पदार्थ होता है, जिसमें सामग्री के माध्यम से धाराओं को हटाने के बाद भी अवशेष चुंबकीय क्षेत्र देने के लिए विशेष दिशा में डोमेन संरेखित होते हैं या चुंबकीय क्षेत्र। चुंबकीय टेप में डेटा लोड करने के दौरान, डोमेन के सहेजे गए अभिविन्यास को कॉल करने के लिए चुंबकीय क्षेत्र को दिशा में पारित किया जाता है और चुंबकीय क्षेत्र को दूसरी दिशा में पारित किया जाता है, तो डोमेन का सहेजा गया अभिविन्यास 0 होता है। इस तरह , आम तौर पर, 1 और 0 डेटा संग्रहीत होते हैं।[3]


यह भी देखें

संदर्भ

  1. 1.0 1.1 Collett 2002, p. 1.
  2. Agresti, Alan (2012). "1.2.2 Multinomial Distribution". श्रेणीबद्ध डेटा विश्लेषण (3rd ed.). Wiley. p. 6. ISBN 978-0470463635.
  3. Gul, Najam (2022-08-18). "How do different types of Data get stored in form of 0 and 1?". Curiosity Tea (in English). Retrieved 2023-01-05.
  • Collett, David (2002). Modelling Binary Data (Second ed.). CRC Press. ISBN 9781420057386.