बिग टेबल

From Vigyanwiki
Revision as of 07:59, 16 June 2023 by alpha>Indicwiki (Created page with "{{Short description|Cloud-based NoSQL database service}} {{Use dmy dates|date=November 2013}} {{Infobox software | name = Google Bigtable | title...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Google Bigtable
Developer(s)Google
Initial releaseFebruary 2005; 19 years ago (2005-02)
Written in
C++ (core), Java, Python, Go, Ruby
PlatformGoogle Cloud Platform
TypeCloud Storage
LicenseProprietary
Websitecloud.google.com/bigtable/

बिगटेबल गूगल क्लाउड पोर्टफोलियो के हिस्से के रूप में बड़े विश्लेषणात्मक और परिचालन वर्कलोड के लिए पूरी तरह से प्रबंधित वाइड-कॉलम और की-वैल्यू एनओएसक्यूएल डेटाबेस सेवा है।

इतिहास

बिगटेबल का विकास 2004 में शुरू हुआ।[1] यह अब कई Google अनुप्रयोगों द्वारा उपयोग किया जाता है, जैसे कि Google Analytics,[2] वेब अनुक्रमण,[3] MapReduce, जिसका उपयोग अक्सर Bigtable में संग्रहीत डेटा को जनरेट करने और संशोधित करने के लिए किया जाता है,[4] गूगल मानचित्र,[5] Google पुस्तकें खोज, मेरा खोज इतिहास , Google धरती, Blogger.com, Google कोड होस्टिंग, YouTube,[6] और जीमेल लगीं [7] Google के अपने स्वयं के डेटाबेस को विकसित करने के कारणों में मापनीयता और प्रदर्शन विशेषताओं का बेहतर नियंत्रण शामिल है।[8]

Google का स्पैनर (डेटाबेस) दो-चरण प्रतिबद्ध प्रोटोकॉल के लिए पैक्सोस (कंप्यूटर विज्ञान) समूह के साथ बिगटेबल के कार्यान्वयन पर स्तरित है। प्रत्येक तालिका के लिए दो-चरण प्रतिबद्ध है। Google F1 को MySQL पर आधारित कार्यान्वयन को बदलने के लिए स्पैनर का उपयोग करके बनाया गया था।[9] Apache HBase और Apache Cassandra कुछ सबसे प्रसिद्ध ओपन सोर्स प्रोजेक्ट हैं जिन्हें बिगटेबल के बाद तैयार किया गया था।

6 मई, 2015 को, क्लाउड बिगटेबल नाम के तहत बिगटेबल का एक सार्वजनिक संस्करण Google क्लाउड प्लेटफ़ॉर्म के एक भाग के रूप में उपलब्ध कराया गया था।[2]जनवरी 2022 तक, बिगटेबल 10 एक्साबाइट डेटा का प्रबंधन करता है और प्रति सेकंड 5 बिलियन से अधिक अनुरोधों को पूरा करता है।[10] 27 जनवरी, 2022 को, Google ने स्वचालित मापनीयता सहित बिगटेबल के लिए कई अपडेट की घोषणा की।[11]


डिजाइन

बिगटेबल वाइड-कॉलम स्टोर के प्रोटोटाइपिकल उदाहरणों में से एक है। यह दो मनमाना स्ट्रिंग मान (पंक्ति कुंजी और स्तंभ कुंजी) और टाइमस्टैम्प (इसलिए त्रि-आयामी मानचित्रण) को एक संबद्ध मनमाना बाइट सरणी में मैप करता है। यह एक संबंधपरक डेटाबेस नहीं है और इसे विरल, वितरित बहु-आयामी क्रमबद्ध मानचित्र के रूप में बेहतर परिभाषित किया जा सकता है।[3]: 1  यह कोलोसस (गूगल फाइल सिस्टम), वितरित लॉक मैनेजर#अन्य क्रियान्वयन, एसएसटेबल (लॉग-स्ट्रक्चर्ड स्टोरेज जैसे लेवलडीबी) और कुछ अन्य गूगल तकनीकों पर बनाया गया है। बिगटेबल को सैकड़ों या हजारों मशीनों में पेटाबाइट रेंज में स्केल करने के लिए डिज़ाइन किया गया है, और सिस्टम में [में] अधिक मशीनों को जोड़ना आसान बनाता है और स्वचालित रूप से बिना किसी पुन: कॉन्फ़िगरेशन के उन संसाधनों का लाभ लेना शुरू कर देता है।[12] उदाहरण के लिए, वेब की Google की कॉपी को एक बिगटेबल में स्टोर किया जा सकता है, जहां पंक्ति कुंजी एक रिवर्स डोमेन नेम नोटेशन|डोमेन-रिवर्स्ड URL है, और कॉलम एक वेब पेज के विभिन्न गुणों का वर्णन करते हैं, जिसमें एक विशेष कॉलम पेज को ही रखता है। पेज कॉलम में कई टाइमस्टैम्प वाले संस्करण हो सकते हैं जो वेब पेज की टाइमस्टैम्प की विभिन्न प्रतियों का वर्णन करते हैं जब वे लाए गए थे। बिगटेबल के प्रत्येक सेल में डेटा के शून्य या अधिक टाइमस्टैम्प वाले संस्करण हो सकते हैं। टाइमस्टैम्प का एक अन्य कार्य समय सीमा समाप्त डेटा के संस्करण नियंत्रण और कचरा संग्रहण (कंप्यूटर विज्ञान) दोनों के लिए अनुमति देना है।

टेबल्स को कई टैबलेट्स में विभाजित किया जाता है - टेबल के सेगमेंट को कुछ पंक्ति कुंजियों में विभाजित किया जाता है ताकि प्रत्येक टैबलेट कुछ सौ मेगाबाइट या कुछ गीगाबाइट आकार में हो। एक बिगटेबल कुछ हद तक एक मैप्रेड्यूस वर्कर पूल की तरह है जिसमें हजारों से सैकड़ों टैबलेट शार्क सैकड़ों से हजारों बिगटेबल सर्वरों द्वारा परोसे जा सकते हैं। जब तालिका का आकार एक निर्दिष्ट सीमा से अधिक बढ़ने का खतरा होता है, तो टैबलेट को BMDiff एल्गोरिथम का उपयोग करके संपीड़ित किया जा सकता है[13][14] और ज़िप्पी संपीड़न एल्गोरिदम[15] स्नैपी (संपीड़न) के रूप में सार्वजनिक रूप से ज्ञात और ओपन-सोर्स,[16] जो LZ77 का कम स्थान-इष्टतम रूपांतर है लेकिन कंप्यूटिंग समय के मामले में अधिक कुशल है। टेबलेट के GFS में स्थान कई विशेष टैबलेट में डेटाबेस प्रविष्टियों के रूप में दर्ज किए जाते हैं, जिन्हें META1 टैबलेट कहा जाता है। META1 टैबलेट एकल META0 टैबलेट को क्वेरी करके पाया जाता है, जो आम तौर पर अपने स्वयं के सर्वर पर रहता है क्योंकि इसे अक्सर क्लाइंट द्वारा META1 टैबलेट के स्थान के रूप में पूछताछ की जाती है, जिसके पास वास्तविक डेटा कहां स्थित है, इस प्रश्न का उत्तर होता है। . GFS के मास्टर सर्वर की तरह, META0 सर्वर आम तौर पर एक अड़चन (सॉफ़्टवेयर) नहीं है क्योंकि META1 स्थानों को खोजने और प्रसारित करने के लिए आवश्यक प्रोसेसर समय और बैंडविड्थ न्यूनतम है और ग्राहक प्रश्नों को कम करने के लिए स्थानों को आक्रामक रूप से कैश करते हैं।

संदर्भ

  1. Hitchcock, Andrew, Google's Bigtable, retrieved 29 July 2007, First an overview. Bigtable has been in development since early 2004 and has been in active use for about eight months (about February 2005)..
  2. 2.0 2.1 "Announcing Google Cloud Bigtable: The same database that powers Google Search, Gmail and Analytics is now available on Google Cloud Platform". Google Blog. 6 May 2015. Retrieved 21 September 2016.
  3. 3.0 3.1 Chang et al. 2006.
  4. Chang et al. 2006, p. 3: 'Bigtable can be used with MapReduce, a framework for running large-scale parallel computations developed at Google. We have written a set of wrappers that allow a Bigtable to be used both as an input source and as an output target for MapReduce jobs'
  5. Hitchcock, Andrew, Google's Bigtable, retrieved 29 July 2007, There are currently around 100 cells for services such as Print, Search History, Maps, and Orkut.
  6. Cordes, Kyle (12 July 2007), YouTube Scalability (talk), Their new solution for thumbnails is to use Google's Bigtable, which provides high performance for a large number of rows, fault tolerance, caching, etc. This is a nice (and rare?) example of actual synergy in an acquisition..
  7. "How Entities and Indexes are Stored", Google App Engine, Google Code, archived from the original on 7 January 2012, retrieved 17 April 2014.
  8. Chang et al. 2006, Conclusion: 'We have described Bigtable, a distributed system for storing structured data at Google... Our users like the performance and high availability provided by the Bigtable implementation, and that they can scale the capacity of their clusters by simply adding more machines to the system as their resource demands change over time... Finally, we have found that there are significant advantages to building our own storage solution at Google. We have gotten a substantial amount of flexibility from designing our own data model for Bigtable.'
  9. Shute, Jeffrey 'Jeff'; Oancea, Mircea; Ellner, Stephan; Handy, Benjamin 'Ben'; Rollins, Eric; Samwel, Bart; Vingralek, Radek; Whipkey, Chad; Chen, Xin; Jegerlehner, Beat; Littlefield, Kyle; Tong, Phoenix (2012), "Summary; F1 — the Fault-Tolerant Distributed RDBMS Supporting Google's Ad Business", Research (presentation), Sigmod, p. 19, We've moved a large and critical application suite from MySQL to F1{{citation}}: CS1 maint: location missing publisher (link).
  10. "Cloud Bigtable now even easier to manage with autoscaling".
  11. Kerner, Sean Michael (27 January 2022). "Google क्लाउड बिगटेबल NoSQL डेटाबेस का विस्तार करता है". TechTarget (in English). Retrieved 10 October 2022.
  12. "Google File System and Bigtable", Radar (World Wide Web log), Database War Stories, O'Reilly, May 2006.
  13. "गूगल बिगटेबल, कम्प्रेशन, ज़िप्पी और बीएमडीआईएफ". 12 October 2008. Archived from the original on 1 May 2013. Retrieved 14 April 2015..
  14. Bentley, Jon; McIlroy, Douglas (1999). लंबे सामान्य तार का उपयोग कर डेटा संपीड़न. DCC '99: Proceedings of the Conference on Data Compression. IEEE Computer Society. CiteSeerX 10.1.1.11.8470. doi:10.1109/DCC.1999.755678.
  15. "Google's Bigtable", Outer court (Weblog), 23 October 2005.
  16. Snappy (project).


ग्रन्थसूची


बाहरी संबंध