बाइनरी डेटा
This article needs additional citations for verification. (April 2019) (Learn how and when to remove this template message) |
बाइनरी डेटा वह डेटा है जिसकी इकाई केवल दो संभावित अवस्थाओं को ग्रहण कर सकती है। इन्हें अक्सर बाइनरी अंक प्रणाली और बूलियन बीजगणित के अनुसार 0 और 1 के रूप में लेबल किया आंकड़े है।
बाइनरी डेटा कई अलग-अलग तकनीकी और वैज्ञानिक क्षेत्रों में होता है, जहां इसे कंप्यूटर विज्ञान में अंश (बाइनरी डिजिट), गणितीय तर्क और संबंधित डोमेन में सत्य मूल्य और #इन सहित विभिन्न नामों से पुकारा जा सकता है। आँकड़ों में आँकड़े।
गणितीय और संयोजक नींव
एक परिमित सेट चर जो केवल एक राज्य ले सकता है में शून्य सूचनात्मक एन्ट्रॉपी होता है, और 2 1 के बाद अगली प्राकृतिक संख्या है। यही कारण है कि बिट, केवल दो संभावित मानों वाला एक चर, सूचना की एक मानक प्राथमिक इकाई है।
का एक संग्रह n बिट्स हो सकते हैं 2n बताता है: विवरण के लिए बाइनरी संख्या देखें। असतत चरों के संग्रह के राज्यों की संख्या चरों की संख्या पर घातीय कार्य पर निर्भर करती है, और केवल प्रत्येक चर के राज्यों की संख्या पर एक शक्ति कानून के रूप में। दस बिट्स अधिक हैं (1024) तीन दशमलव अंकों की तुलना में बताता है (1000). 10k बिट्स एक सूचना (एक संख्या या कुछ और) का प्रतिनिधित्व करने के लिए पर्याप्त से अधिक हैं जिसकी आवश्यकता है 3k दशमलव अंक, इसलिए त्रैमासिक अंक प्रणाली, 4, 5, 6, 7, 8, 9, Neper... राज्यों के साथ असतत चर में निहित जानकारी को कभी भी दो, तीन, या चार गुना अधिक बिट्स आवंटित करके बदला जा सकता है। इसलिए, 2 के अलावा किसी अन्य छोटी संख्या का उपयोग लाभ प्रदान नहीं करता है।
इसके अलावा, बूलियन बीजगणित बिट्स के संग्रह के लिए एक सुविधाजनक गणितीय संरचना प्रदान करता है, जिसमें प्रस्तावित चर के संग्रह का शब्दार्थ है। कंप्यूटर विज्ञान में बूलियन बीजगणित संचालन को बिटवाइज़ संचालन के रूप में जाना जाता है। बूलियन समारोह का सैद्धांतिक रूप से अच्छी तरह से अध्ययन किया जाता है और आसानी से लागू किया जा सकता है, या तो कंप्यूटर प्रोग्राम के साथ या डिजिटल इलेक्ट्रॉनिक्स में तथाकथित लॉजिक गेट्स द्वारा। यह विभिन्न डेटा का प्रतिनिधित्व करने के लिए बिट्स के उपयोग में योगदान देता है, यहां तक कि मूल रूप से बाइनरी नहीं।
सांख्यिकी में
आँकड़ों में, बाइनरी डेटा एक सांख्यिकीय डेटा प्रकार होता है जिसमें स्पष्ट डेटा होता है जो ए और बी, या सिर और पूंछ जैसे दो संभावित मान ले सकता है। इसे द्विभाजित डेटा भी कहा जाता है, और एक पुराना शब्द क्वांटल डेटा है।[1] दो मूल्यों को अक्सर सामान्य रूप से सफलता और असफलता के रूप में संदर्भित किया जाता है।[1] श्रेणीबद्ध डेटा के एक रूप के रूप में, बाइनरी डेटा नाममात्र डेटा है, जिसका अर्थ है कि मान गुणात्मक गुण हैं और संख्यात्मक रूप से तुलना नहीं की जा सकती। हालाँकि, मानों को अक्सर 1 या 0 के रूप में दर्शाया जाता है, जो एकल परीक्षण में सफलताओं की संख्या की गणना के अनुरूप होता है: 1 (सफलता) या 0 (विफलता); देखना § Counting.
अक्सर, बाइनरी डेटा का उपयोग दो वैचारिक रूप से विपरीत मानों में से एक का प्रतिनिधित्व करने के लिए किया जाता है, जैसे:
- एक प्रयोग के परिणाम (सफलता या असफलता)
- हाँ-नहीं प्रश्न का उत्तर (हाँ या नहीं)
- कुछ विशेषता की उपस्थिति या अनुपस्थिति (मौजूद है या मौजूद नहीं है)
- किसी प्रस्ताव की सच्चाई या झूठ (सही या गलत, सही या गलत)
हालाँकि, इसका उपयोग उन डेटा के लिए भी किया जा सकता है, जिन्हें केवल दो संभावित मान माना जाता है, भले ही वे वैचारिक रूप से विरोध न करते हों या अवधारणात्मक रूप से अंतरिक्ष में सभी संभावित मूल्यों का प्रतिनिधित्व करते हों। उदाहरण के लिए, संयुक्त राज्य अमेरिका, यानी रिपब्लिकन पार्टी (संयुक्त राज्य) या डेमोक्रेटिक पार्टी (संयुक्त राज्य) में चुनावों में मतदाताओं की पार्टी की पसंद का प्रतिनिधित्व करने के लिए अक्सर बाइनरी डेटा का उपयोग किया जाता है। इस मामले में, कोई अंतर्निहित कारण नहीं है कि क्यों केवल दो राजनीतिक दलों का अस्तित्व होना चाहिए, और वास्तव में, अन्य पार्टियां अमेरिका में मौजूद हैं, लेकिन वे इतने छोटे हैं कि उन्हें आम तौर पर अनदेखा कर दिया जाता है। विश्लेषण उद्देश्यों के लिए द्विआधारी चर के रूप में मॉडलिंग निरंतर डेटा (या 2 से अधिक श्रेणियों का श्रेणीबद्ध डेटा) को विवेकीकरण (एक द्विभाजन बनाना) कहा जाता है। सभी विवेक की तरह, इसमें विवेक की त्रुटि शामिल है, लेकिन लक्ष्य त्रुटि के बावजूद कुछ मूल्यवान सीखना है: इसे विकट के रूप में मानना: हाथ में उद्देश्य के लिए नगण्य, लेकिन यह याद रखना कि इसे सामान्य रूप से नगण्य नहीं माना जा सकता है।
द्विआधारी चर
एक द्विआधारी चर द्विआधारी प्रकार का एक यादृच्छिक चर है, जिसका अर्थ है दो संभावित मान। स्वतंत्र और समान रूप से वितरित यादृच्छिक चर (i.i.d.) बाइनरी चर बर्नौली वितरण का पालन करते हैं, लेकिन सामान्य बाइनरी डेटा में i.i.d से आने की आवश्यकता नहीं होती है। चर। आई.आई.डी. की कुल संख्या द्विआधारी चर (समतुल्य रूप से, 1 या 0 के रूप में कोडित i.i.d. द्विआधारी चर के योग) एक द्विपद वितरण का पालन करते हैं, लेकिन जब द्विआधारी चर i.i.d नहीं होते हैं, तो वितरण को द्विपद होने की आवश्यकता नहीं होती है।
गिनती
श्रेणीबद्ध डेटा की तरह, बाइनरी डेटा को प्रत्येक संभावित मान के लिए एक निर्देशांक लिखकर, और होने वाले मान के लिए 1 की गिनती करके, और न होने वाले मान के लिए 0 की गणना करके डेटा की एक सरणी डेटा संरचना में परिवर्तित किया जा सकता है।[2] उदाहरण के लिए, यदि मान A और B हैं, तो डेटा सेट A, A, B को (1, 0), (1, 0), (0, 1) के रूप में गिनती में दर्शाया जा सकता है। एक बार गणना में परिवर्तित हो जाने पर, बाइनरी डेटा को समूहीकृत डेटा और जोड़े गए काउंट्स में शामिल किया जा सकता है। उदाहरण के लिए, यदि समुच्चय A, A, B को समूहीकृत किया जाता है, तो कुल संख्याएँ (2, 1): 2 A's और 1 B (3 परीक्षणों में से) हैं।
चूंकि केवल दो संभावित मान हैं, इसे एक मान को सफलता और दूसरे को विफलता के रूप में मानते हुए, सफलता के मान को 1 के रूप में और विफलता को 0 के रूप में कोडित करके एकल गणना (एक स्केलर मान) के लिए सरल बनाया जा सकता है (केवल का उपयोग करके) सफलता मूल्य के लिए समन्वय, विफलता मूल्य के लिए समन्वय नहीं)। उदाहरण के लिए, यदि मान A को सफलता माना जाता है (और इस प्रकार B को विफलता माना जाता है), तो डेटा सेट A, A, B को 1, 1, 0 के रूप में दर्शाया जाएगा। जब इसे समूहीकृत किया जाता है, तो मान जोड़े जाते हैं, जबकि संख्या परीक्षण का आम तौर पर निहित ट्रैक किया जाता है। उदाहरण के लिए, A, A, B को 1 + 1 + 0 = 2 सफलताओं के रूप में समूहीकृत किया जाएगा (इनमें से परीक्षण)। दूसरी तरफ जाकर, डेटा को गिनें बाइनरी डेटा है, जिसमें दो वर्ग 0 (विफलता) या 1 (सफलता) हैं।
आई.आई.डी. द्विआधारी चर एक द्विपद वितरण का पालन करते हैं, साथ परीक्षणों की कुल संख्या (समूहित डेटा में अंक)।
प्रतिगमन
अनुमानित परिणामों पर प्रतिगमन विश्लेषण जो द्विआधारी चर हैं, द्विआधारी प्रतिगमन के रूप में जाना जाता है; जब बाइनरी डेटा को काउंट डेटा में परिवर्तित किया जाता है और i.i.d के रूप में मॉडलिंग की जाती है। चर (इसलिए उनका द्विपद वितरण है), द्विपद प्रतिगमन का उपयोग किया जा सकता है। बाइनरी डेटा के लिए सबसे आम प्रतिगमन विधियाँ संभार तन्त्र परावर्तन , प्रोबिट प्रतिगमन या संबंधित प्रकार के द्विआधारी विकल्प मॉडल हैं।
इसी तरह आई.आई.डी. दो से अधिक श्रेणियों वाले श्रेणीबद्ध चर को एक बहुराष्ट्रीय प्रतिगमन के साथ प्रतिरूपित किया जा सकता है। गैर-आई.आई.डी. बाइनरी डेटा को अधिक जटिल वितरणों द्वारा प्रतिरूपित किया जा सकता है, जैसे कि बीटा-द्विपद वितरण (एक यौगिक वितरण)। वैकल्पिक रूप से, रिश्ते को सामान्यीकृत रैखिक मॉडल, जैसे अर्ध-संभावना और अर्ध-समानता मॉडल से तकनीकों का उपयोग करके आउटपुट चर के वितरण को स्पष्ट रूप से मॉडल करने की आवश्यकता के बिना मॉडल किया जा सकता है; देखना Overdispersion § Binomial.
कंप्यूटर विज्ञान में
आधुनिक कंप्यूटरों में, बाइनरी डेटा किसी भी डेटा को उच्च स्तर पर व्याख्या करने या किसी अन्य रूप में डेटा रूपांतरण के बजाय बाइनरी रूप में प्रदर्शित करने के लिए संदर्भित करता है। निम्नतम स्तर पर, बिट्स को एक bstability डिवाइस जैसे फ्लिप-फ्लॉप (इलेक्ट्रॉनिक्स) | फ्लिप-फ्लॉप में संग्रहित किया जाता है। जबकि अधिकांश बाइनरी डेटा का प्रतीकात्मक अर्थ होता है (परवाह नहीं करने के अलावा) सभी बाइनरी डेटा संख्यात्मक नहीं होते हैं। कुछ बाइनरी डेटा इंस्ट्रक्शन (कंप्यूटर साइंस) से मेल खाते हैं, जैसे कि प्रोसेसर रजिस्टरों के डेटा को नियंत्रण यूनिट द्वारा डिकोड किया जाता है, जो कि लाने-डिकोड-निष्पादित चक्र के साथ होता है। प्रदर्शन कारणों से कंप्यूटर शायद ही कभी अलग-अलग बिट्स को संशोधित करते हैं। इसके बजाय, डेटा निश्चित संख्या में बिट्स के समूहों में डेटा संरचना संरेखण है, आमतौर पर 1 बाइट (8 बिट)। इसलिए, कंप्यूटर में बाइनरी डेटा वास्तव में बाइट्स के अनुक्रम होते हैं। उच्च स्तर पर, 32-बिट सिस्टम के लिए 1 शब्द (कंप्यूटर आर्किटेक्चर) (4 बाइट्स) के समूहों में और 64-बिट सिस्टम के लिए 2 शब्दों में डेटा एक्सेस किया जाता है।
निर्देश (कंप्यूटर विज्ञान) और सूचना प्रौद्योगिकी क्षेत्र में, बाइनरी डेटा शब्द अक्सर टेक्स्ट-आधारित डेटा के विपरीत होता है, जो किसी भी प्रकार के डेटा का संदर्भ देता है जिसे टेक्स्ट के रूप में व्याख्या नहीं किया जा सकता है। पाठ बनाम बाइनरी भेद कभी-कभी फ़ाइल की सिमेंटिक सामग्री को संदर्भित कर सकता है (उदाहरण के लिए एक लिखित दस्तावेज़ बनाम एक डिजिटल छवि)। हालांकि, यह अक्सर विशेष रूप से संदर्भित करता है कि फ़ाइल के अलग-अलग बाइट टेक्स्ट के रूप में व्याख्या करने योग्य हैं (अक्षरों को सांकेतिक अक्षरों में बदलना देखें) या व्याख्या नहीं की जा सकती है। जब यह अंतिम अर्थ अभिप्रेत है, तो अधिक विशिष्ट शब्द बाइनरी प्रारूप और पाठ (यूएल) प्रारूप कभी-कभी उपयोग किए जाते हैं। सिमेंटिकली टेक्स्टुअल डेटा को बाइनरी फॉर्मेट में प्रदर्शित किया जा सकता है (उदाहरण के लिए जब कंप्रेस किया जाता है या कुछ फॉर्मेट में जो विभिन्न प्रकार के फॉर्मेटिंग कोड को इंटरमिक्स करते हैं, जैसा कि माइक्रोसॉफ्ट वर्ड द्वारा उपयोग किए जाने वाले डॉक्टर (कंप्यूटिंग) में होता है); इसके विपरीत, छवि डेटा को कभी-कभी पाठ्य प्रारूप में दर्शाया जाता है (उदाहरण के लिए एक्स विंडो सिस्टम में उपयोग किया जाने वाला X PixMap छवि प्रारूप)।
1 और 0 और कुछ नहीं बल्कि सिर्फ दो अलग-अलग वोल्टेज स्तर हैं। आप कंप्यूटर को उच्च वोल्टेज के लिए 1 और निम्न वोल्टेज के लिए 0 समझा सकते हैं। दो वोल्टेज स्तरों को स्टोर करने के कई अलग-अलग तरीके हैं। यदि आपने फ़्लॉपी देखा है, तो आपको एक चुंबकीय टेप मिलेगा जिसमें फेरोमैग्नेटिक सामग्री का लेप होता है, यह एक प्रकार का पैरामैग्नेटिक पदार्थ होता है, जिसमें सामग्री के माध्यम से धाराओं को हटाने के बाद भी अवशेष चुंबकीय क्षेत्र देने के लिए एक विशेष दिशा में डोमेन संरेखित होते हैं या चुंबकीय क्षेत्र। चुंबकीय टेप में डेटा लोड करने के दौरान, डोमेन के सहेजे गए अभिविन्यास को कॉल करने के लिए चुंबकीय क्षेत्र को एक दिशा में पारित किया जाता है और चुंबकीय क्षेत्र को दूसरी दिशा में पारित किया जाता है, तो डोमेन का सहेजा गया अभिविन्यास 0 होता है। इस तरह , आम तौर पर, 1 और 0 डेटा संग्रहीत होते हैं।[3]
यह भी देखें
- बिट सरणी
- बरनौली वितरण
- बूलियन डेटा प्रकार
- स्मृति
- सुस्पष्ट डेटा
- गुणात्मक तथ्य
संदर्भ
- ↑ 1.0 1.1 Collett 2002, p. 1.
- ↑ Agresti, Alan (2012). "1.2.2 Multinomial Distribution". श्रेणीबद्ध डेटा विश्लेषण (3rd ed.). Wiley. p. 6. ISBN 978-0470463635.
- ↑ Gul, Najam (2022-08-18). "How do different types of Data get stored in form of 0 and 1?". Curiosity Tea (in English). Retrieved 2023-01-05.
- Collett, David (2002). Modelling Binary Data (Second ed.). CRC Press. ISBN 9781420057386.