स्कीमा-अज्ञेयवादी डेटाबेस
स्कीमा-एग्नोस्टिक डेटाबेस या शब्दावली-स्वतंत्र डेटाबेस का उद्देश्य उपयोगकर्ताओं को डेटा के प्रतिनिधित्व से सारगर्भित होने में मदद करना है, जो प्रश्नों और डेटाबेस के बीच स्वचालित सिमेंटिक मिलान का समर्थन करता है। स्कीमा-अज्ञेयवाद उपयोगकर्ता शब्दावली और संरचना के साथ जारी किए गए क्वेरी को मैप करने के डेटाबेस की संपत्ति है, इसे स्वचालित रूप से डेटासेट शब्दावली में मैप करना।
आकार में वृद्धि और डेटाबेस स्कीमा के सिमेंटिक विषमता में उपयोगकर्ताओं को संरचित डेटा की क्वेरी और खोज के लिए नई आवश्यकताएं लाती हैं। इस पैमाने पर डेटा उपभोक्ताओं के लिए इसे क्वेरी करने के लिए डेटा के प्रतिनिधित्व से परिचित होना अक्षम्य हो सकता है। इस चर्चा के केंद्र में उपयोगकर्ताओं और डेटाबेस के बीच सिमेंटिक गैप है, जो डेटा के पैमाने और जटिलता बढ़ने के साथ और अधिक केंद्रीय हो जाता है।
विवरण
कई डेटा स्रोतों से डेटा की खपत और स्कीमा के आकार, जटिलता, गतिशीलता और विकेंद्रीकरण (SCoDD) में वृद्धि के लिए डेटा वातावरण का विकास[1][2][3] समकालीन डेटा प्रबंधन की जटिलता को बढ़ाता है। SCoDD प्रवृत्ति बड़े डेटा परिदृश्यों में एक केंद्रीय डेटा प्रबंधन चिंता के रूप में उभरती है, जहां उपयोगकर्ताओं और अनुप्रयोगों के पास स्वतंत्र डेटा स्रोतों द्वारा उत्पादित अधिक संपूर्ण डेटा की मांग होती है, जो कि विभिन्न सिमेंटिक मान्यताओं और उपयोग के संदर्भों के तहत होती है, जो सेमांटिक वेब के लिए विशिष्ट परिदृश्य है। डेटा अनुप्रयोग।
विषम डेटा वातावरण की दिशा में डेटाबेस का विकास मौजूदा डेटा एक्सेसिबिलिटी विधियों जैसे संरचित प्रश्नों, कीवर्ड-आधारित खोज और विज़ुअल क्वेरी सिस्टम के पीछे उपयोगिता, सांकेतिकता और सिमेंटिक धारणाओं को दृढ़ता से प्रभावित करता है। स्कीमा रहित डेटाबेस में संभावित रूप से लाखों गतिशील रूप से बदलती विशेषताएँ होती हैं, कुछ उपयोगकर्ताओं के लिए डेटाबेस को क्वेरी करने के लिए 'स्कीमा' या शब्दावली से अवगत होना अक्षम्य हो जाता है। इस पैमाने पर, संरचित क्वेरी बनाने के लिए स्कीमा को समझने का प्रयास निषेधात्मक हो सकता है।
स्कीमा-अज्ञेयवादी प्रश्न
स्कीमा-अज्ञेय प्रश्नों को संरचित डेटाबेस पर क्वेरी दृष्टिकोण के रूप में परिभाषित किया जा सकता है जो उपयोगकर्ताओं को डेटाबेस के प्रतिनिधित्व (स्कीमा) की समझ के बिना जटिल सूचना आवश्यकताओं को पूरा करने की अनुमति देता है। इसी तरह, ट्रान एट अल।[4] इसे खोज दृष्टिकोण के रूप में परिभाषित करता है, जिसके लिए उपयोगकर्ताओं को डेटा के अंतर्निहित स्कीमा को जानने की आवश्यकता नहीं होती है। डेटाबेस पर खोजशब्द-आधारित खोज जैसे दृष्टिकोण उपयोगकर्ताओं को संरचित प्रश्नों को नियोजित किए बिना डेटाबेस को क्वेरी करने की अनुमति देते हैं। हालाँकि, जैसा कि ट्रान एट अल द्वारा चर्चा की गई है: इन बिंदुओं से, उपयोगकर्ताओं को जटिल सूचना आवश्यकताओं को पूरा करने के लिए आगे नेविगेशन और अन्वेषण करना पड़ता है। वेब पर उपयोग की जाने वाली खोजशब्द खोज के विपरीत, जो सरल आवश्यकताओं पर केंद्रित है, यहाँ विस्तृत खोजशब्द खोज का उपयोग अधिक जटिल परिणाम प्राप्त करने के लिए किया जाता है। संसाधनों के एकल सेट के बजाय, लक्ष्य संसाधनों के जटिल सेट और उनके संबंधों की गणना करना है।
डेटाबेस पर प्राकृतिक भाषा यूजर इंटरफेस (एनएलआई) का समर्थन करने के लिए दृष्टिकोण का विकास स्कीमा-अज्ञेयवादी प्रश्नों के लक्ष्य की ओर लक्षित है। पूरक रूप से, खोजशब्द खोज पर आधारित कुछ दृष्टिकोणों ने खोजशब्द-आधारित प्रश्नों को लक्षित किया है जो अधिक जटिल सूचना आवश्यकताओं को व्यक्त करते हैं। अन्य दृष्टिकोणों ने डेटाबेस पर संरचित प्रश्नों के निर्माण की खोज की है जहाँ स्कीमा बाधाओं को कम किया जा सकता है। इन सभी दृष्टिकोणों (प्राकृतिक भाषा, खोजशब्द-आधारित खोज और संरचित प्रश्नों) ने प्रश्नों और डेटा के बीच एक लचीले सिमेंटिक मिलान का समर्थन करने की समस्या को संबोधित करने में परिष्कार के विभिन्न स्तरों को लक्षित किया है, जो सिमेंटिक सरोकार की पूरी तरह से अनुपस्थिति से लेकर अधिक सैद्धांतिक सिमेंटिक तक भिन्न होता है। मॉडल। जबकि संरचित डेटा पर सिमेंटिक खोज और प्राकृतिक भाषा क्वेरी सिस्टम में स्कीमा-अज्ञेयवाद की मांग एक अंतर्निहित आवश्यकता रही है, यह एक अवधारणा के रूप में और समकालीन डेटाबेस प्रबंधन प्रणालियों के लिए एक आवश्यक आवश्यकता के रूप में पर्याप्त रूप से व्यक्तिगत नहीं है। हाल के कार्यों ने स्कीमा-अज्ञेयवादी प्रश्नों में शामिल सिमेंटिक पहलुओं को परिभाषित और मॉडल करना शुरू कर दिया है।[1][5][6]
स्कीमा-अज्ञेयवादी संरचित प्रश्न
एक संरचित मानक (उदाहरण के लिए SQL, SPARQL) के सिंटैक्स के बाद स्कीमा-अज्ञेयवादी प्रश्नों से मिलकर बनता है। ऑपरेटरों के वाक्य-विन्यास और शब्दार्थ को बनाए रखा जाता है, जबकि विभिन्न शब्दावली का उपयोग किया जाता है।
उदाहरण 1
<पूर्व> चुनें? वाई {
बिल क्लिंटन की बेटी ?x है। ?x से शादी की ?y .
} </पूर्व>
जो डेटासेट शब्दावली में निम्नलिखित SPARQL क्वेरी को मैप करता है:
<वाक्यविन्यास लैंग = स्पार्कल> उपसर्ग : <http://dbpedia.org/resource/> उपसर्ग dbpedia2: <http://dbpedia.org/property/> उपसर्ग dbpedia: <http://dbpedia.org/ontology/> प्रीफ़िक्स स्कोस: <http://www.w3.org/2004/02/skos/core#> उपसर्ग dbo: <http://dbpedia.org/ontology/>
चुनें? वाई {
: बिल_क्लिंटन डीबीपीडिया: बच्चा? एक्स। ?x dbpedia2:पति/पत्नी ?y . }
</वाक्यविन्यास हाइलाइट>
उदाहरण 2
<वाक्यविन्यास लैंग = स्पार्कल> चयन करें? एक्स {
? x एक किताब है। ? x विलियम_गोल्डमैन द्वारा। ?x has_pages ?p . फ़िल्टर (?p > 300) }
</वाक्यविन्यास हाइलाइट>
जो डेटासेट शब्दावली में निम्नलिखित SPARQL क्वेरी को मैप करता है:
<वाक्यविन्यास लैंग = स्पार्कल> उपसर्ग आरडीएफ: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> उपसर्ग : <http://dbpedia.org/resource/> उपसर्ग dbpedia2: <http://dbpedia.org/property/> उपसर्ग dbpedia: <http://dbpedia.org/ontology/> चयन करें? एक्स {
?x rdf: dbpedia टाइप करें: बुक। ?x dbpedia2: लेखक : विलियम_गोल्डमैन। ?x dbpedia:numberOfPages ?p .
फ़िल्टर(?p > 300) } </वाक्यविन्यास हाइलाइट>
स्कीमा-अज्ञेयवादी खोजशब्द प्रश्न
कीवर्ड प्रश्नों का उपयोग करते हुए स्कीमा-अज्ञेयवादी प्रश्नों से मिलकर बनता है। इस मामले में ऑपरेटरों के सिंटैक्स और शब्दार्थ संरचित क्वेरी सिंटैक्स से भिन्न होते हैं।
उदाहरण
<पूर्व>
बिल क्लिंटन की बेटी से शादी की
</पूर्व>
<पूर्व>
300 से अधिक पृष्ठों वाली विलियम गोल्डमैन की पुस्तकें
</पूर्व>
सिमेंटिक जटिलता
2016 तक स्कीमा-अज्ञेयवादी प्रश्नों की अवधारणा मुख्य रूप से अकादमिक क्षेत्र में विकसित की गई है। डेटाबेस या सिमेंटिक वेब पर प्राकृतिक भाषा उपयोगकर्ता इंटरफ़ेस के संदर्भ में अधिकांश स्कीमा-एग्नोस्टिक क्वेरी सिस्टम की जांच की गई है।[7] ये कार्य बड़े, विषम और स्कीमा-रहित डेटाबेस पर सिमेंटिक पार्सिंग तकनीकों के अनुप्रयोग का पता लगाते हैं। हाल ही में, स्कीमा-एग्नोस्टिक क्वेरी सिस्टम और डेटाबेस की अवधारणा का वैयक्तिकरण साहित्य के भीतर अधिक स्पष्ट रूप से प्रकट हुआ है।[1][5][6]फ्रीटास एट अल।[8] स्कीमा-अज्ञेयवादी प्रश्नों की मैपिंग की सिमेंटिक जटिलता पर एक संभाव्य मॉडल प्रदान करें।
संदर्भ
- ↑ 1.0 1.1 1.2 A. Freitas, "Schema-agnostic queries over large-schema databases: a distributional semantics approach" PhD Thesis, 2015
- ↑ Pat Helland, ["If you have too much data, then 'good enough' is good enough"], Commun. ACM 54(6): 40–47, 2011.
- ↑ M. L. Brodie and J. T. Liu, ["The power and limits of relational technology in the age of information ecosystems"], Keynote, On The Move Federated Conferences, Heraklion, Greece, October 25–29, 2010.
- ↑ T. Tran, T. Mathaess, P. Haase, ["Usability of Keyword-driven Schema-agnostic Search – A Comparative Study of Keyword Search, Faceted Search, Query Completion and Result Completion"], In Proceedings of 7th Extended Semantic Web Conference (ESWC'10). Heraklion, Greece, June, 2010.
- ↑ 5.0 5.1 A. Freitas, J. C. Pereira Da Silva, E. Curry, "On the Semantic Mapping of Schema-agnostic Queries: A Preliminary Study", Workshop of the Natural Language Interfaces for the Web of Data (NLIWoD), 13th International Semantic Web Conference (ISWC), Rival del Garda, 2014.
- ↑ 6.0 6.1 S. Bischof, M. Kroetzsch, A. Polleres, S. Rudolph, ["Schema-Agnostic Query Rewriting in SPARQL 1.1"], In Proceedings of the 13th International Semantic Web Conference. Springer 2014.
- ↑ Unger et al., ["Introduction to Question Answering over Linked Data"], In Proceedings of the 2014 Reasoning Web Summer School, 2014
- ↑ A. Freitas, J. E. Sales, S. Handschuh, E. Curry, "How hard is the Query? Measuring the Semantic Complexity of Schema-Agnostic Queries", In Proceedings of the 11th International Conference on Computational Semantics (IWCS), London, 2015.