फ़्लैट-फ़ाइल डेटाबेस

From Vigyanwiki
Revision as of 23:40, 4 August 2023 by alpha>Artiverma
फ़्लैट फ़ाइल मॉडल का उदाहरण[1]

फ़्लैट-फ़ाइल डेटाबेस फ़ाइल में संग्रहीत डेटाबेस है जिसे फ़्लैट फ़ाइल कहा जाता है। रिकॉर्ड समान प्रारूप का पालन करते हैं, और रिकॉर्ड के बीच संबंधों को अनुक्रमित करने या पहचानने के लिए कोई संरचना नहीं होती है। फ़ाइल सरल है. फ़्लैट फ़ाइल सादा पाठ फ़ाइल (उदाहरण के लिए अल्पविराम से अलग किए गए मान, टेक्स्ट फ़ाइल या टैब से अलग किए गए मान) या बाइनरी फ़ाइल हो सकती है। डेटाबेस में डेटा से संबंधों का अनुमान लगाया जा सकता है, लेकिन डेटाबेस प्रारूप स्वयं उन रिश्तों को स्पष्ट नहीं करता है।

इस शब्द का तात्पर्य आम तौर पर छोटा डेटाबेस है, लेकिन बहुत बड़े डेटाबेस भी सपाट हो सकते हैं।

अवलोकन

सादे पाठ फ़ाइलों में आमतौर पर प्रति पंक्ति रिकॉर्ड (कंप्यूटर विज्ञान) होता है।[2] डेटा को चित्रित करने के लिए अलग-अलग परंपराएँ हैं। अल्पविराम से अलग किए गए मान और सीमांकक से अलग किए गए मान फ़ाइलों में, फ़ील्ड (कंप्यूटर विज्ञान) को अल्पविराम से अलग किए गए मान या टैब से अलग किए गए मान वर्णों जैसे सीमांकक द्वारा अलग किया जा सकता है। अन्य मामलों में, प्रत्येक फ़ील्ड की निश्चित लंबाई हो सकती है; संक्षिप्त मानों को स्पेस वर्णों के साथ जोड़ा जा सकता है। सीमांकक टकराव से बचने के लिए अतिरिक्त स्वरूपण की आवश्यकता हो सकती है।

डिलीमीटर का उपयोग करने पर हर बार संसाधित होने पर उनका पता लगाने में कुछ कम्प्यूटेशनल ओवरहेड खर्च होता है (निश्चित-चौड़ाई फ़ॉर्मेटिंग के विपरीत), जिसका कंप्यूटर प्रदर्शन पर प्रभाव पड़ सकता है। हालाँकिअंतरिक्ष चरित्र डिलीमीटर (विशेष रूप से अल्पविराम) का उपयोग भी डेटा संपीड़न का कच्चा रूप है जो डेटा वॉल्यूम को कम करके समग्र प्रदर्शन में सहायता कर सकता है - विशेष रूप से डेटा ट्रांसमिशन उद्देश्यों के लिए। वर्ण सीमांकक का उपयोग जिसमें लंबाई घटक (स्ट्रिंग शाब्दिक#घोषणात्मक संकेतन) शामिल है, तुलनात्मक रूप से दुर्लभ है, लेकिन प्रत्येक क्षेत्र की सीमा का पता लगाने से जुड़े ओवरहेड को काफी हद तक कम कर देता है।

फ़्लैट फ़ाइलों के उदाहरणों में शामिल हैं /etc/passwd और /etc/group यूनिक्स जैसे ऑपरेटिंग सिस्टम पर। फ़्लैट फ़ाइल का अन्य उदाहरण नाम, पता और फ़ोन नंबर फ़ील्ड वाली नाम-और-पता सूची है।

कागज की शीट पर हाथ से लिखे गए नाम, पते और फोन नंबरों की सूची फ्लैट-फ़ाइल डेटाबेस है। यह किसी टाइपराइटर या शब्द संसाधक से भी किया जा सकता है। फ्लैट-फ़ाइल डेटाबेस को लागू करने के लिए स्प्रेडशीट या पाठ संपादक प्रोग्राम का उपयोग किया जा सकता है, जिसे बाद में बेहतर खोज क्षमताओं के लिए मुद्रित या ऑनलाइन उपयोग किया जा सकता है।

इतिहास

संयुक्त राज्य अमेरिका की जनगणना ब्यूरो के लिए हरमन होलेरिथ का काम पहली बार 1890 की संयुक्त राज्य अमेरिका की जनगणना में किया गया था, जिसमें पेपर कार्ड में छेद के माध्यम से सारणीबद्ध डेटा शामिल था,[3] इसे कभी-कभी पहला कम्प्यूटरीकृत फ़्लैट-फ़ाइल डेटाबेस माना जाता है, क्योंकि इसमें अन्य कार्डों को अनुक्रमित करने वाला कोई कार्ड शामिल नहीं होता है, या अन्यथा व्यक्तिगत कार्डों को -दूसरे से संबंधित नहीं किया जाता है, उनकी समूह सदस्यता को छोड़कर।

1980 के दशक में, कॉन्फ़िगर करने योग्य फ्लैट-फ़ाइल डेटाबेस कंप्यूटर अनुप्रयोग आईबीएम पीसी और एप्पल मैकिंटोश पर लोकप्रिय थे। ये प्रोग्राम व्यक्तियों के लिए अपने स्वयं के डेटाबेस को डिज़ाइन करना और उपयोग करना आसान बनाने के लिए डिज़ाइन किए गए थे, और लोकप्रियता में लगभग वर्ड प्रोसेसर और स्प्रेडशीट के बराबर थे। फ़्लैट-फ़ाइल डेटाबेस सॉफ़्टवेयर के उदाहरणों में फ़ाइल निर्माता के शुरुआती संस्करण और शेयरवेयर पीसी फ़ाइल और लोकप्रिय dBase शामिल हैं।

फ़्लैट-फ़ाइल डेटाबेस सामान्य और सर्वव्यापी हैं क्योंकि उन्हें लिखना और संपादित करना आसान है, और सरल तरीके से असंख्य उद्देश्यों के लिए उपयुक्त हैं।

आधुनिक कार्यान्वयन

NoSQL डेटा के रैखिक भंडार, JSON स्वरूपित डेटा, आदिम स्प्रेडशीट (शायद अल्पविराम से अलग या टैब-सीमांकित), और पाठ फ़ाइलें सभी को फ्लैट-फ़ाइल डेटाबेस के रूप में देखा जा सकता है, क्योंकि उनमें ीकृत अनुक्रमित, डेटा तत्वों के बीच अंतर्निहित संदर्भ, या जटिल डेटा प्रकारों का अभाव है। पुस्तकों या नियुक्तियों और पता पुस्तिका के संग्रह को प्रबंधित करने के लिए कार्यक्रम अनिवार्य रूप से ल-उद्देश्य वाले फ्लैट-फ़ाइल डेटाबेस का उपयोग कर सकते हैं, इंडेक्स या पॉइंटिंग सिस्टम से रहित फ्लैट फ़ाइलों से जानकारी संग्रहीत और पुनर्प्राप्त कर सकते हैं।

जबकि कोई उपयोगकर्ता सामग्री की तालिका को टेक्स्ट फ़ाइल में लिख सकता है, टेक्स्ट फ़ाइल प्रारूप में सामग्री की तालिका की अवधारणा शामिल नहीं होती है। जबकि कोई उपयोगकर्ता जॉन की संपर्क जानकारी के लिए नोट्स अनुभाग में कैथी के साथ मित्र लिख सकता है, यह डेटाबेस की अंतर्निहित सुविधा के बजाय उपयोगकर्ता द्वारा व्याख्या की जाती है। जब डेटाबेस प्रणाली रिकॉर्ड्स के बीच संबंधों को पहचानना और संहिताबद्ध करना शुरू करती है, तो यह सपाट होने से दूर होने लगती है, और जब इसमें प्रकारों और पदानुक्रमित संबंधों का वर्णन करने के लिए विस्तृत प्रणाली होती है, तो यह अब इतनी संरचित हो जाती है कि इसे सपाट नहीं माना जा सकता है।

उदाहरण आंकड़ेबेस

निम्नलिखित उदाहरण फ़्लैट-फ़ाइल डेटाबेस के विशिष्ट तत्वों को दिखाता है। डेटा व्यवस्था में तालिका (सूचना) में व्यवस्थित स्तंभों और पंक्तियों की श्रृंखला होती है। यह विशिष्ट उदाहरण केवल तालिका का उपयोग करता है।

कॉलम में शामिल हैं: नाम ( व्यक्ति का नाम, दूसरा कॉलम); टीम (व्यक्ति द्वारा समर्थित एथलेटिक टीम का नाम, तीसरा कॉलम); और संख्यात्मक अद्वितीय आईडी, (अभिलेखों को विशिष्ट रूप से पहचानने के लिए उपयोग किया जाता है, पहला कॉलम)।

यहां वर्णित डेटा का उदाहरण पाठ्य प्रस्तुतिकरण दिया गया है:

आईडी नाम टीम
1 एमी ब्लूज़
2 बॉब रेड्स
3 चक ब्लूज़
4 रिचर्ड ब्लूज़
5 एथेल रेड्स
6 फ्रेड ब्लूज़
7 गिल्ली ब्लूज़
8 हैंक रेड्स
9 हैंक ब्लूज़

इस प्रकार का डेटा प्रतिनिधित्व फ़्लैट-फ़ाइल डेटाबेस के लिए काफी मानक है, हालाँकि कुछ अतिरिक्त विचार हैं जो पाठ से आसानी से स्पष्ट नहीं होते हैं:

  • 'डेटा प्रकार:' डेटाबेस तालिका में प्रत्येक कॉलम, जैसा कि ऊपर दिया गया है, आमतौर पर विशिष्ट डेटा प्रकार तक ही सीमित होता है। ऐसे प्रतिबंध आम तौर पर सम्मेलन द्वारा स्थापित किए जाते हैं, लेकिन औपचारिक रूप से तब तक संकेत नहीं दिए जाते जब तक कि डेटा को संबंध का डेटाबेस सिस्टम में स्थानांतरित नहीं किया जाता है।
  • 'पृथक कॉलम:' उपरोक्त उदाहरण में, अलग-अलग कॉलम को व्हाइटस्पेस (कंप्यूटर विज्ञान) वर्णों का उपयोग करके अलग किया गया है। इसे इंडेंटेशन या निश्चित-चौड़ाई डेटा फ़ॉर्मेटिंग भी कहा जाता है। अन्य आम परंपरा या अधिक सीमांकक वर्णों का उपयोग करके स्तंभों को अलग करना है, जैसे अल्पविराम से अलग किए गए_मान|टैब या अल्पविराम।
  • 'संबंधपरक बीजगणित:' उपरोक्त तालिका में प्रत्येक पंक्ति या रिकॉर्ड संबंधपरक बीजगणित के तहत टुपल की मानक परिभाषा को पूरा करता है (उपरोक्त उदाहरण 3-टुपल्स की श्रृंखला को दर्शाता है)। इसके अतिरिक्त, पहली पंक्ति Tuple#Names को निर्दिष्ट करती है जो प्रत्येक पंक्ति के मानों से जुड़े होते हैं।
  • 'डेटाबेस प्रबंधन प्रणाली:' चूंकि टेक्स्ट फ़ाइल के साथ संभव औपचारिक संचालन आमतौर पर वांछित से अधिक सीमित होते हैं, उपरोक्त उदाहरण में टेक्स्ट आमतौर पर डेटाबेस प्रबंधन प्रणाली में स्थानांतरित होने से पहले डेटा की मध्यस्थ स्थिति का प्रतिनिधित्व करेगा।

यह भी देखें

  • passwd|/etc/passwd, आमतौर पर उपयोग की जाने वाली फ़्लैट फ़ाइल, जिसका उपयोग यूनिक्स में उपयोगकर्ताओं का विवरण देने के लिए किया जाता है
  • अल्पविराम से अलग किए गए मान (मानक अल्पविराम से अलग किए गए मान)
  • बर्कले डीबी (विशिष्ट फ्लैट-फ़ाइल डेटाबेस)
  • Awk (शास्त्रीय फ़्लैट-फ़ाइल प्रोसेसर)
  • Recfiles (सादा पाठ डेटाबेस फ़ाइल स्वरूप)

संदर्भ

  1. Data Integration Glossary Archived March 20, 2009, at the Wayback Machine, U.S. Department of Transportation, August 2001.
  2. Fowler, Glenn (1994), "cql: Flat-file database query language", WTEC'94: Proceedings of the USENIX Winter 1994 Technical Conference on USENIX Winter 1994 Technical Conference
  3. Blodgett, John H.; Schultz, Claire K. (1969). "Herman hollerith: data processing pioneer". American Documentation (in English). 20 (3): 221–226. doi:10.1002/asi.4630200307. ISSN 1936-6108.