डाटा (कंप्यूटर विज्ञान)
[[कंप्यूटर विज्ञान]] में, डाटा (एकवचन, बहुवचन, या सामूहिक संज्ञा के रूप में माना जाता है) एक या अधिक प्रतीकों का कोई क्रम है; विवरण डाटा का एकल प्रतीक है। डाटा को सूचना बनने के लिए व्याख्या की आवश्यकता होती है। अंकीय डाटा वह डाटा है जिसे समधर्मी संकेत प्रतिनिधित्व के स्थान पर युग्मक संख्या प्रणाली (1) और शून्य (0) का उपयोग करके दर्शाया जाता है। आधुनिक (1960 के बाद) कंप्यूटर प्रणाली में, सभी डाटा अंकीय हैं।
डाटा तीन अवस्थाओं में उपस्थित होते हैं: स्थिर डाटा, पारगमन में डाटा और उपयोग में डाटा है। एक कंप्यूटर के भीतर डाटा, अधिकतर स्तिथियों में,समानांतर डेटा के रूप में चलता है। कंप्यूटर से या उसके पास जाने वाला डेटा, अधिकतर स्तिथियों में, क्रमिक डेटा के रूप में चलता है। एक समरूप युक्ति से प्राप्त डेटा, जैसे तापमान संवेदक, को रेखीय-से-अंकीय परिवर्तक का उपयोग करके अंकीय में परिवर्तित किया जा सकता है। मात्रा, वर्ण, या प्रतीकों का प्रतिनिधित्व करने वाला डाटा, जिस पर कंप्यूटर द्वारा संचालन किया जाता है, आधार सामग्री भंडारण और अभिलेखबद्ध (कंप्यूटर विज्ञान) चुंबकीय पट्टी पर डाटा भंडारण, दृक् भंडारण, विद्युत् या यांत्रिक अभिलेखन मीडिया, और अंकीय इलेक्ट्रिकल के रूप में डाटा संचार या दृक् संकेत है।[1] डाटा परिधीय के माध्यम से कंप्यूटर से अंदर और बाहर जाता है।
भौतिक स्मृति तत्वों में एक एड्रेस और डाटा संग्रहण का एक बाइट/शब्द सम्मिलित होता है। अंकीय डाटा को प्रायः संबंधात्मक आंकड़ाकोष में संग्रहीत किया जाता है, जैसे तालिका (आंकड़ाकोष) या SQL आंकड़ाकोष, और सामान्यतः सार कुंजी / मान जोड़े के रूप में प्रदर्शित किया जा सकता है। डाटा को कई अलग-अलग प्रकार की डाटा संरचनाओं में व्यवस्थित किया जा सकता है, जिसमें सरणियाँ, [[लेखाचित्र (सार डाटा प्रकार)]] सम्मिलित हैं। डाटा संरचनाएँ चल बिन्दु आधार, श्रृंखला (कंप्यूटर विज्ञान) और यहां तक कि अन्य पुनरावर्ती डाटा प्रकार सहित कई अलग-अलग डाटा प्रकारों के डाटा को संग्रहीत कर सकती हैं।
विशेषताएं
मेटाडाटा आंकड़ों को सूचना में अनुवाद करने में मदद करता है। मेटाडाटा डाटा के बारे में डाटा है। मेटाडाटा निहित, निर्दिष्ट या दिया जा सकता है।
भौतिक घटनाओं या प्रक्रियाओं से संबंधित डाटा में एक अस्थायी घटक होगा। यह अस्थायी घटक निहित हो सकता है। यह ऐसी स्तिथि है जब तापमान प्रचालेखित्र जैसे उपकरण को तापमान संवेदक से डाटा प्राप्त होते हैं। जब तापमान प्राप्त होता है तो यह माना जाता है कि डाटा का अब का अस्थायी संदर्भ है। इसलिए उपकरण तारीख, समय और तापमान को एक साथ अभिलेखबद्ध कर लेता है। जब डाटा प्रचालेखित्र तापमान का संचार करता है, तो उसे प्रत्येक तापमान पठन के लिए मेटाडाटा के रूप में दिनांक और समय की विवरणी भी करनी चाहिए।
मौलिक रूप से, कंप्यूटर डाटा के रूप में दिए गए निर्देशों के अनुक्रम का पालन करते हैं। किसी दिए गए कार्य (या कार्यों) को करने के लिए निर्देशों के एक सम्मुच्चय को कंप्यूटर क्रमादेश कहा जाता है। क्रमादेश एक कंप्यूटर या अन्य यन्त्र के संचालन को नियंत्रित करने के लिए कूटित निर्देशों के रूप में डाटा होते हैं। [2] नाममात्र की स्तिथि में, कंप्यूटर द्वारा निष्पादन (कंप्यूटिंग) के रूप में क्रमादेश में यन्त्र कूट सम्मिलित होगा। कंप्यूटर डाटा भंडारण के तत्व क्रमादेश द्वारा युक्तियोजित किए गए, लेकिन वास्तव में केंद्रीय प्रक्रिया इकाई (सीपीयू) द्वारा निष्पादित नहीं किए गए, डाटा भी हैं। सबसे आवश्यक रूप से, एकल डाटा एक विशिष्ट स्थान पर संग्रहीत मान (कंप्यूटर विज्ञान) है। इसलिए, कंप्यूटर क्रमादेश के लिए उनके क्रमादेशिकी डाटा में युक्तियोजित करके, अन्य कंप्यूटर क्रमादेश पर काम करना संभव है।
किसी संचिका में डाटा बाइट को संग्रहीत करने के लिए, उन्हें संचिका स्वरूप में क्रमबद्ध करना होगा। सामान्यतः, क्रमादेश विशेष संचिका प्रकारों में संग्रहीत होते हैं, जो अन्य डाटा के लिए उपयोग किए जाने वाले से भिन्न होते हैं। निष्पादन योग्य में कार्यक्रम होते हैं; अन्य सभी संचिकाएँ भी डाटा संचिकाएँ हैं। हालाँकि, निष्पादन योग्य संचिकाओं में क्रमादेश द्वारा उपयोग किया जाने वाला डाटा भी हो सकता है जो क्रमादेश में बनाया गया है। विशेष रूप से, कुछ निष्पादन योग्य संचिकाओं में एक डाटा खंड होता है, जिसमें मुख्य रूप से चर के लिए स्थिरांक और प्रारंभिक मान होते हैं, जिनमें से दोनों को आंकड़ा माना जा सकता है।
क्रमादेश और डाटा के बीच की रेखा धुंधली हो सकती है। उदाहरण के लिए एक दुभाषिया (कंप्यूटिंग), क्रमादेश है। एक दुभाषिया के लिए निविष्ट डाटा अपने आप में एक क्रमादेश है, केवल मूल यन्त्र कूट में व्यक्त नहीं किया गया है। कई स्तिथियों में, व्याख्या किया गया क्रमादेश मानव-पठनीय पाठ्य संचिका होगा, जिसेपाठ संपादक क्रमादेश के साथ जोड़-तोड़ किया जाता है। मेटाप्रोग्रामिंग में इसी तरह क्रमादेश सम्मिलित होते हैं जो डाटा के रूप में अन्य प्रोग्रामों में युक्तियोजित करते हैं। संकलनकर्ता, संयोजक (कंप्यूटिंग), दोषमार्जक, सॉफ्टवेयर आधुनिकीकरण, एंटीवायरस सॉफ्टवेयर जैसे क्रमादेश और ऐसे अन्य प्रोग्रामों को उनके डाटा के रूप में उपयोग करते हैं।
उदाहरण के लिए, एक उपयोगकर्ता (कंप्यूटिंग) पहले प्रचालन प्रणाली को एक संचिका से एकशब्द संसाधक क्रमादेश उद्भारण करने का निर्देश दे सकता है, और फिर किसी अन्य संचिका में संग्रहीत दस्तावेज़ संचिका स्वरूप को खोलने और संपादित करने के लिए चल रहे क्रमादेश का उपयोग कर सकता है। इस उदाहरण में, प्रपत्र को आंकड़ा माना जाएगा। यदि शब्द प्रक्रमक में वर्तनी परीक्षक भी होता है, तो वर्तनी परीक्षक के लिए शब्दकोष (शब्द सूची) को भी आंकड़ा माना जाएगा। वर्तनी परीक्षक द्वारा सुधारों का सुझाव देने के लिए उपयोग किए जाने वाले कलन विधि या तो यन्त्र कूट डाटा या कुछ व्याख्यात्मक क्रमादेशन भाषा में पाठ होंगे।
एक वैकल्पिक उपयोग में, युग्मक संचिकाएँ (जो मानव-पठनीय माध्यम नहीं हैं को कभी-कभी मानव-पठनीय पाठ संचिका से अलग डाटा कहा जाता है।[3] 2007 में अंकीय डाटा की कुल राशि 281 बिलियन गीगाबाइट (281 विविध-बाइट यूनिट) होने का अनुमान लगाया गया था।[4][5]
डाटा कुंजियाँ और मूल्य, संरचनाएँ और दृढ़ता
डाटा में कुंजियाँ मूल्यों के लिए संदर्भ प्रदान करती हैं। डाटा की संरचना के बावजूद, हमेशा एक प्रमुख घटक उपस्थित होता है। डाटा मूल्यों को अर्थ देने के लिए डाटा और डाटा-संरचनाओं में कुंजियाँ आवश्यक हैं। एक कुंजी के बिना जो सीधे या परोक्ष रूप से मूल्य से जुड़ा हुआ है, या संरचना में मूल्यों का संग्रह है, मूल्य अर्थहीन हो जाते हैं और डाटा नहीं रह जाते हैं। कहने का तात्पर्य यह है कि इसे आंकड़ा माना जाने के लिए एक मूल्य घटक से जुड़ा एक प्रमुख घटक होना चाहिए।
निम्नलिखित उदाहरणों के अनुसार कंप्यूटर में डाटा को कई तरीकों से दर्शाया जा सकता है:
रैम
- रैंडम अभिगम स्मृति (रैम) में वह डाटा होते हैं जिस तक सीपीयू की सीधी पहुंच होती है। एक सीपीयू केवल अपने संसाधक पंजिका या स्मृति के भीतर डाटा में युक्तियोजित कर सकता है। यह डाटा भंडारण के विपरीत है, जहां सीपीयू को भंडारण उपकरण (चर्किका, टेप...) और स्मृति के बीच डाटा स्थानान्तरण को निर्देशित करना चाहिए। RAM रैखिक सन्निहित स्थानों की एक सरणी है जिसे एक प्रोसेसर पढ़ने या लिखने के संचालन के लिए एक एड्रेस प्रदान करके पढ़ या लिख सकता है। प्रोसेसर किसी भी समय किसी भी क्रम में स्मृति में किसी भी स्थान पर काम कर सकता है। रैम में डाटा का सबसे छोटा तत्व युग्मक अंश होता है। RAM तक पहुँचने की क्षमताएँ और सीमाएँ प्रोसेसर विशिष्ट हैं। सामान्यतः कंप्यूटर डाटा भंडारण को एड्रेस 0 (हेक्साडेसिमल 0) से प्रारम्भ होने वाले स्मृति एड्रेस पंजी की एक सरणी के रूप में व्यवस्थित किया जाता है। कंप्यूटर शिल्प विद्या के आधार पर प्रत्येक स्थान सामान्यतः 8 या 32 बिट संग्रह कर सकता है।
कुंजी
- डाटा कुंजियों को स्मृति में प्रत्यक्ष हार्डवेयर एड्रेस नहीं होना चाहिए। डाटा संरचना बनाने के लिए अप्रत्यक्ष, अमूर्त और तार्किक कुंजियों के कूट मूल्यों के सहयोग से संग्रहीत किए जा सकते हैं। डाटा संरचनाओं ने संरचना के प्रारम्भ से प्रतिसंतुलन (कंप्यूटर विज्ञान) (या श्रृंखला या पथ) को पूर्व निर्धारित किया है, जिसमें डाटा मान संग्रहीत हैं। इसलिए, डाटा कुंजी में संरचना की कुंजी और संरचना में प्रतिसंतुलन (या श्रृंखला या पथ) सम्मिलित हैं। जब इस तरह की संरचना को दोहराया जाता है, तो डाटा मानों की विविधताओं और डाटा कुंजियों को एक ही दोहराई जाने वाली संरचना के भीतर संग्रहीत किया जाता है, परिणाम को एक तालिका (सूचना) के समान माना जा सकता है, जिसमें दोहराई जाने वाली संरचना के प्रत्येक तत्व को एक पंक्ति और संरचना के प्रत्येक दोहराव को तालिका की एक पंक्ति के रूप में माना जाता है। डाटा के ऐसे संगठन में, डाटा कुंजी सामान्यतः पंक्ति के एक (या कई में मानों का संयोजन) में एक मान होता है।
संगठित आवर्ती डाटा संरचनाएं
- डाटा संरचनाओं को दोहराने की तालिका (सूचना) दृश्य कई संभावनाओं में से एक है। दोहराई जाने वाली डाटा संरचनाओं को पदानुक्रम में व्यवस्थित किया जा सकता है, जैसे कि माता-पिता-बाल संबंधों के एक झरने में पर्णसंधि एक-दूसरे से जुड़े होते हैं। मान और संभावित रूप से अधिक जटिल डाटा-संरचनाएं पर्णसंधि से जुड़ी हुई हैं। इस प्रकार निःस्पंद पदानुक्रम निःस्पंद से जुड़े डाटा संरचनाओं को संबोधित करने की कुंजी प्रदान करता है। इस प्रतिनिधित्व को प्रतिलोमित तरू (डाटा संरचना) के रूप में माना जा सकता है। उदा. आधुनिक कंप्यूटर प्रचालन प्रणाली संचिका प्रणाली एक सामान्य उदाहरण हैं; और एक्सएमएल दूसरा उदाहरण है।
क्रमबद्ध या आदेशित डाटा
- डाटा जब समाकलन होता है तो उसमें कुछ अन्तर्निहित विशेषताएँ होती हैं। कुंजी के उपवर्ग के सभी मान एक साथ दिखाई देते हैं। एक ही कुंजी, या प्रमुख परिवर्तनों के एक उपसमुच्चय के साथ डाटा के समूहों के माध्यम से अनुक्रमिक रूप से पारित होने पर, इसे डाटा प्रसंस्करण वृत्त में विभाजन या नियंत्रण विभाजन के रूप में संदर्भित किया जाता है। यह विशेष रूप से कुंजी के उपवर्ग पर डाटा मानों के एकत्रीकरण की सुविधा प्रदान करता है।
परिधीय भंडारण
- स्फुर स्मृति जैसी थोक अहासी स्मृति के आगमन तक, परिधीय युक्ति को डाटा लिखकर पारंपरिक रूप से लगातार डाटा भंडारण प्राप्त किया गया था। ये उपकरण सामान्यतः चुंबकीय मीडिया पर एक स्थान की तलाश करते हैं और फिर पूर्व निर्धारित आकार के खंड (डाटा संग्रहण) को पढ़ते या लिखते हैं। इस स्तिथि में, मीडिया पर खोज स्थान डाटा कुंजी है और खंड डाटा मान हैं। डाटा संचिकाओं के लिए चक्रिका चालक पर प्रारंभिक उपयोग किए गए अप्रशिक्षित चर्किका डाटा संचिका-प्रणाली या चर्किका प्रचालन प्रणाली आरक्षित विखंडन (कंप्यूटिंग) खण्ड हैं। उन प्रणालियों में, संचिकाओं को भरा जा सकता था, इससे पहले कि उन्हें सभी डाटा लिखे गए थे, डाटा स्थान समाप्त हो गए। इस प्रकार प्रत्येक संचिका के लिए पर्याप्त खाली स्थान सुनिश्चित करने के लिए बहुत अधिक अप्रयुक्त डाटा स्थान अनुत्पादक रूप से आरक्षित किया गया था। बाद में संचिका-प्रणाली ने विभाजन प्रकार प्रस्तुत किया। उन्होंने विभाजन के लिए चर्किका डाटा स्थान के खण्ड आरक्षित किए और आवंटित खण्डों का अधिक आर्थिक रूप से उपयोग किया, गतिशील रूप से विभाजन के खण्ड को एक संचिका में आवश्यकतानुसार निर्दिष्ट करके किया गया। इसे प्राप्त करने के लिए, संचिका प्रणाली को सूची या संचिका आवंटन तालिका में डाटा संचिकाओं द्वारा कौन से खण्ड का उपयोग या अप्रयुक्त किया गया था, इसका पद चिन्ह रखना था। हालांकि इसने चर्किका डाटा स्थान का बेहतर उपयोग किया, इसके परिणामस्वरूप चर्किका भर में संचिकाओं का विखंडन हुआ, और डाटा पढ़ने के लिए अतिरिक्त खोज समय के कारण सहवर्ती प्रदर्शन उपरिव्यय हो गया। आधुनिक संचिका प्रणाली संचिका अभिगम समय को अनुकूलित करने के लिए खंडित संचिकाओं को गतिशील रूप से पुनर्गठित करते हैं। संचिका प्रणाली में आगे के विकास के परिणामस्वरूप चक्रिका चालक का आभासीकरण हुआ, जहां एक तार्किक अंतर्नोद को कई भौतिक अंतर्नोद से विभाजन के रूप में परिभाषित किया जा सकता है।
अनुक्रमित डाटा
- एक बहुत बड़े सम्मुच्चय से डाटा के एक छोटे से उपवर्ग को पुनः प्राप्त करने का अर्थ हो सकता है कि क्रमिक रूप से डाटा के माध्यम से अक्षम रूप से खोज करना है। आंकड़ाकोष तालिका संचिकाओं, तालिकाओं और डाटा सम्मुच्चयों में डाटा संरचनाओं से कुंजियों और स्थान के संचय स्थल को अनुकरण करने का एक तरीका है, फिर मूल डाटा के एक उपवर्ग को पुनः प्राप्त करने में लगने वाले समय को कम करने के लिए तरु (डाटा संरचना) का उपयोग करके उन्हें व्यवस्थित करें। ऐसा करने के लिए, पुनर्प्राप्त किए जाने वाले डाटा के उपवर्ग की कुंजी को पुनर्प्राप्ति प्रारम्भ होने से पहले ज्ञात होना चाहिए। सबसे लोकप्रिय तालिकाबी-वृक्ष और डायनेमिक हैश फंकशन की इंडेक्सिंग मेथड हैं। डाटा दर्ज करने और पुनर्प्राप्त करने के लिए सूचकांकन उपरिव्यय है। अनुक्रमणिका को व्यवस्थित करने के अन्य तरीके हैं, उदा. द्विभाजी अन्वेषण कलन विधि का उपयोग करना है।
अमूर्तता और संकेत
- वस्तु-उन्मुख क्रमादेशन डाटा और सॉफ्टवेयर को समझने के लिए दो बुनियादी अवधारणाओं का उपयोग करती है:
- वर्ग (कंप्यूटर क्रमादेशन) की वर्गीकरणात्मक क्रम संरचना, जो एक पदानुक्रमित डाटा संरचना का एक उदाहरण है; और
- कार्य अवधि पर, कक्षा पुस्तकालय से तत्काल वस्तुओं की स्मृति संघनन में डाटा-संरचनाओं के संदर्भों का निर्माण है।
यह तात्कालिकता के बाद ही होता है कि एक निर्दिष्ट वर्ग की वस्तु उपस्थित होती है। किसी वस्तु का संदर्भ साफ होने के बाद वस्तु का अस्तित्व भी समाप्त हो जाता है। स्मृति स्थान जहां वस्तु के डाटा संग्रहीत किये गए थे अपशिष्ट संग्रह (कंप्यूटर विज्ञान) है और पुन: उपयोग के लिए उपलब्ध अप्रयुक्त स्मृति के रूप में पुनः वर्गीकृत किया गया है।
आंकड़ाकोष डाटा
- आंकड़ाकोष के आगमन ने लगातार डाटा भंडारण के लिए एक और अमूर्त परत प्रस्तुत की है। आंकड़ाकोष मेटाडाटा का उपयोग करते हैं, और उपभोगता-परिवेषक प्रतिरूप प्रणाली के बीच एक SQL विज्ञप्ति, संगणक संजाल पर संचार करते हैं, डाटा को सहेजते समय आंकड़ाकोष लेनदेन पूर्णता सुनिश्चित करने के लिए दो-चरण प्रतिबद्ध विज्ञप्ति उत्काष्ठन प्रणाली का उपयोग करते हैं।
समानांतर वितरित उत्काष्ठन प्रसंस्करण
- आधुनिक मापनीय और उच्च-प्रदर्शन डाटा दृढ़ता प्रौद्योगिकियां, जैसे अपाचे हडूप, उच्च बैंड विस्तार संजाल पर कई वाणिज्या कंप्यूटरों में बड़े मापक्रम पर समानांतर वितरित डाटा प्रसंस्करण पर निर्भर करती हैं। ऐसी प्रणालियों में, डाटा कई कंप्यूटरों में वितरित किया जाता है और इसलिए प्रणाली में किसी विशेष कंप्यूटर को डाटा की कुंजी में प्रत्यक्ष या अप्रत्यक्ष रूप से दर्शाया जाना चाहिए। यह डाटा के दो समान सम्मुच्चय के बीच अंतर को सक्षम करता है, प्रत्येक को एक ही समय में एक अलग कंप्यूटर पर संसाधित किया जा रहा है।
यह भी देखें
संदर्भ
- ↑ "आंकड़े". Lexico. Archived from the original on 2019-06-23. Retrieved 14 January 2022.
- ↑ "कंप्यूटर प्रोग्राम". The Oxford pocket dictionary of current english. Archived from the original on 28 November 2011. Retrieved 11 October 2012.
- ↑ "फ़ाइल (1)". OpenBSD manual pages. 24 December 2015. Archived from the original on 5 February 2018. Retrieved 4 February 2018.
- ↑ Paul, Ryan (12 March 2008). "Study: amount of digital info > global storage capacity". Ars Technics. Archived from the original on 13 March 2008. Retrieved 13 March 2008.
- ↑ Gantz, John F.; et al. (2008). "विविध और विस्फोटक डिजिटल ब्रह्मांड". International Data Corporation via EMC. Archived from the original on 11 March 2008. Retrieved 12 March 2008.