स्कीमा-अज्ञेयवादी डेटाबेस: Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
 
(17 intermediate revisions by 3 users not shown)
Line 1: Line 1:
'''स्कीमा-अज्ञेयवादी डेटाबेस''' या शब्दावली-स्वतंत्र [[डेटाबेस]] का उद्देश्य उपयोगकर्ताओं को डेटा के प्रतिनिधित्व से सारगर्भित होने में मदद करना है, जो प्रश्नों और डेटाबेस के बीच स्वचालित सिमेंटिक मिलान का समर्थन करता है। स्कीमा-अज्ञेयवाद उपयोगकर्ता शब्दावली और संरचना के साथ जारी किए गए क्वेरी को मैप करने के डेटाबेस की संपत्ति है, इसे स्वचालित रूप से डेटासेट शब्दावली में मैप करना।
'''स्कीमा-अज्ञेयवादी डेटाबेस''' या शब्दावली-स्वतंत्र [[डेटाबेस]] का उद्देश्य उपयोगकर्ताओं को डेटा के प्रतिनिधित्व से सारगर्भित होने में मदद करना होता है, जो प्रश्नों और डेटाबेस के बीच स्वचालित सिमेंटिक मिलान का समर्थन करता है। स्कीमा-अज्ञेयवाद उपयोगकर्ता शब्दावली और संरचना के साथ जारी किए गए क्वेरी को मैप करने के डेटाबेस की संपत्ति होती है, इसे स्वचालित रूप से डेटासेट शब्दावली में मैप करना होता है।


आकार में वृद्धि और डेटाबेस स्कीमा के सिमेंटिक विषमता में उपयोगकर्ताओं को [[संरचित डेटा]] की क्वेरी और खोज के लिए नई आवश्यकताएं लाती हैं। इस पैमाने पर डेटा उपभोक्ताओं के लिए इसे क्वेरी करने के लिए डेटा के प्रतिनिधित्व से परिचित होना अक्षम्य हो सकता है। इस चर्चा के केंद्र में उपयोगकर्ताओं और डेटाबेस के बीच [[सिमेंटिक गैप]] है, जो डेटा के पैमाने और जटिलता बढ़ने के साथ और अधिक केंद्रीय हो जाता है।
आकार में वृद्धि और डेटाबेस स्कीमा के सिमेंटिक विषमता में उपयोगकर्ताओं को [[संरचित डेटा]] की क्वेरी और खोज के लिए नई आवश्यकताएं लाती है। इस पैमाने पर डेटा उपभोक्ताओं के लिए इसे क्वेरी करने के लिए डेटा के प्रतिनिधित्व से परिचित होना अक्षम्य हो सकता है। इस चर्चा के केंद्र में उपयोगकर्ताओं और डेटाबेस के बीच [[सिमेंटिक गैप]] होता है, जो डेटा के पैमाने और जटिलता बढ़ने के साथ और अधिक केंद्रीय हो जाता है।  


== विवरण ==
== विवरण ==


कई डेटा स्रोतों से डेटा की खपत के प्रति डेटा वातावरण का विकास और स्कीमा के आकार, जटिलता, गतिशीलता और विकेंद्रीकरण (एससीओडीडी) में वृद्धि<ref name="freitasThesis">A. Freitas, [http://andrefreitas.org/papers/thesis_schema_agnostic.pdf "Schema-agnostic queries over large-schema databases: a distributional semantics approach"] PhD Thesis, 2015</ref><ref>Pat Helland, ["If you have too much data, then 'good enough' is good enough"], Commun. ACM 54(6): 40–47, 2011.</ref><ref>M. L. Brodie and J. T. Liu, ["The power and limits of relational technology in the age of information ecosystems"], Keynote, On The Move Federated Conferences, Heraklion, Greece, October 25–29, 2010.</ref> समकालीन डेटा प्रबंधन की जटिलता को बढ़ाता है। एससीओडीडी प्रवृत्ति बिग डेटा परिदृश्यों में एक केंद्रीय डेटा प्रबंधन चिंता के रूप में उभरती है, जहां उपयोगकर्ताओं और अनुप्रयोगों के पास स्वतंत्र डेटा स्रोतों द्वारा उत्पादित अधिक पूर्ण डेटा की मांग होती है, जो विभिन्न सिमेंटिक मान्यताओं और उपयोग के संदर्भों के अनुसार होती है, जो [[सेमांटिक वेब]] के लिए विशिष्ट परिदृश्य होती है।


कई डेटा स्रोतों से डेटा की खपत के प्रति डेटा वातावरण का विकास और स्कीमा के आकार, जटिलता, गतिशीलता और विकेंद्रीकरण (एससीओडीडी) में वृद्धि<ref name="freitasThesis">A. Freitas, [http://andrefreitas.org/papers/thesis_schema_agnostic.pdf "Schema-agnostic queries over large-schema databases: a distributional semantics approach"] PhD Thesis, 2015</ref><ref>Pat Helland, ["If you have too much data, then 'good enough' is good enough"], Commun. ACM 54(6): 40–47, 2011.</ref><ref>M. L. Brodie and J. T. Liu, ["The power and limits of relational technology in the age of information ecosystems"], Keynote, On The Move Federated Conferences, Heraklion, Greece, October 25–29, 2010.</ref> समकालीन डेटा प्रबंधन की जटिलता को बढ़ाता है। एससीओडीडी प्रवृत्ति बिग डेटा परिदृश्यों में एक केंद्रीय डेटा प्रबंधन चिंता के रूप में उभरती है, जहां उपयोगकर्ताओं और अनुप्रयोगों के पास स्वतंत्र डेटा स्रोतों द्वारा उत्पादित अधिक पूर्ण डेटा की मांग होती है, जो विभिन्न सिमेंटिक मान्यताओं और उपयोग के संदर्भों के तहत होती है, जो [[सेमांटिक वेब]] के लिए विशिष्ट परिदृश्य है। डेटा अनुप्रयोग।
विषम डेटा वातावरण की दिशा में डेटाबेस का विकास मौजूदा डेटा अभिगम्यता विधियों जैसे संरचित प्रश्नों, संकेत शब्द आधारित खोज और विज़ुअल क्वेरी प्रणाली के पीछे उपयोगिता, [[सांकेतिकता]] और सिमेंटिक धारणाओं को दृढ़ता से प्रभावित करता है। स्कीमा रहित डेटाबेस में संभावित रूप से लाखों गतिशील रूप से बदलती विशेषताएँ होती है, कुछ उपयोगकर्ताओं के लिए डेटाबेस को क्वेरी करने के लिए स्कीमा या शब्दावली से अवगत होना अक्षम्य हो जाता है। इस पैमाने पर, संरचित क्वेरी बनाने के लिए स्कीमा को समझने का प्रयास निषेधात्मक हो सकता है।
 
विषम डेटा वातावरण की दिशा में डेटाबेस का विकास मौजूदा डेटा एक्सेसिबिलिटी विधियों जैसे संरचित प्रश्नों, कीवर्ड-आधारित खोज और विज़ुअल क्वेरी सिस्टम के पीछे उपयोगिता, [[सांकेतिकता]] और सिमेंटिक धारणाओं को दृढ़ता से प्रभावित करता है। स्कीमा रहित डेटाबेस में संभावित रूप से लाखों गतिशील रूप से बदलती विशेषताएँ होती हैं, कुछ उपयोगकर्ताओं के लिए डेटाबेस को क्वेरी करने के लिए 'स्कीमा' या शब्दावली से अवगत होना अक्षम्य हो जाता है। इस पैमाने पर, संरचित क्वेरी बनाने के लिए स्कीमा को समझने का प्रयास निषेधात्मक हो सकता है।


== स्कीमा-अज्ञेयवादी प्रश्न ==
== स्कीमा-अज्ञेयवादी प्रश्न ==


स्कीमा-अज्ञेय प्रश्नों को संरचित डेटाबेस पर क्वेरी दृष्टिकोण के रूप में परिभाषित किया जा सकता है जो उपयोगकर्ताओं को डेटाबेस के प्रतिनिधित्व (स्कीमा) की समझ के बिना जटिल सूचना आवश्यकताओं को पूरा करने की अनुमति देता है। इसी तरह, ट्रान एट अल।<ref>T. Tran, T. Mathaess, P. Haase, ["Usability of Keyword-driven Schema-agnostic Search – A Comparative Study of Keyword Search, Faceted Search, Query Completion and Result Completion"], In Proceedings of 7th Extended Semantic Web Conference (ESWC'10). Heraklion, Greece, June, 2010.</ref> इसे खोज दृष्टिकोण के रूप में परिभाषित करता है, जिसके लिए उपयोगकर्ताओं को डेटा के अंतर्निहित स्कीमा को जानने की आवश्यकता नहीं होती है"। डेटाबेस पर खोजशब्द-आधारित खोज जैसे दृष्टिकोण उपयोगकर्ताओं को संरचित प्रश्नों को नियोजित किए बिना डेटाबेस को क्वेरी करने की अनुमति देते हैं। हालांकि, जैसा कि ट्रान एट अल द्वारा चर्चा की गई है: "इन बिंदुओं से, हालांकि, उपयोगकर्ताओं को जटिल जानकारी की जरूरतों को पूरा करने के लिए आगे नेविगेशन और अन्वेषण करना पड़ता है। वेब पर उपयोग किए जाने वाले कीवर्ड खोज के विपरीत, जो सरल आवश्यकताओं पर केंद्रित है, यहां विस्तृत खोजशब्द खोज है अधिक जटिल परिणाम प्राप्त करने के लिए उपयोग किया जाता है। संसाधनों के एकल सेट के बजाय, लक्ष्य संसाधनों के जटिल सेट और उनके संबंधों की गणना करना है।
स्कीमा-अज्ञेय प्रश्नों को संरचित डेटाबेस पर क्वेरी दृष्टिकोण के रूप में परिभाषित किया जा सकता है जो उपयोगकर्ताओं को डेटाबेस के प्रतिनिधित्व (स्कीमा) की समझ के बिना जटिल सूचना आवश्यकताओं को पूरा करने की अनुमति देता है।<ref>T. Tran, T. Mathaess, P. Haase, ["Usability of Keyword-driven Schema-agnostic Search – A Comparative Study of Keyword Search, Faceted Search, Query Completion and Result Completion"], In Proceedings of 7th Extended Semantic Web Conference (ESWC'10). Heraklion, Greece, June, 2010.</ref> इसे खोज दृष्टिकोण के रूप में परिभाषित करता है, जिसके लिए उपयोगकर्ताओं को डेटा के अंतर्निहित स्कीमा को जानने की आवश्यकता नहीं होती है। डेटाबेस पर खोजशब्द-आधारित खोज जैसे दृष्टिकोण उपयोगकर्ताओं को संरचित प्रश्नों को नियोजित किए बिना डेटाबेस को क्वेरी करने की अनुमति देता है। चूंकि, जैसा कि ट्रान एट अल द्वारा चर्चा की गई है: इन बिंदुओं से उपयोगकर्ताओं को जटिल जानकारी की जरूरतों को पूरा करने के लिए आगे मार्गदर्शन और अन्वेषण करना पड़ता है। वेब पर उपयोग किए जाने वाले संकेत शब्द खोज के विपरीत, जो सरल आवश्यकताओं पर केंद्रित होता है, यहां विस्तृत खोजशब्द खोज है अधिक जटिल परिणाम प्राप्त करने के लिए उपयोग किया जाता है। संसाधनों के एकल सेट के अतिरिक्त, लक्ष्य संसाधनों के जटिल सेट और उनके संबंधों की गणना करता है।


डेटाबेस पर प्राकृतिक भाषा इंटरफेस (एनएलआई) का समर्थन करने के लिए दृष्टिकोण का विकास स्कीमा-अज्ञेय प्रश्नों के लक्ष्य की ओर लक्षित है। पूरक रूप से, खोजशब्द खोज पर आधारित कुछ दृष्टिकोणों ने खोजशब्द-आधारित प्रश्नों को लक्षित किया है जो अधिक जटिल सूचना आवश्यकताओं को व्यक्त करते हैं। अन्य दृष्टिकोणों ने डेटाबेस पर संरचित प्रश्नों के निर्माण की खोज की है जहाँ स्कीमा बाधाओं को कम किया जा सकता है। इन सभी दृष्टिकोणों (प्राकृतिक भाषा, खोजशब्द-आधारित खोज और संरचित प्रश्नों) ने प्रश्नों और डेटा के बीच एक लचीले सिमेंटिक मिलान का समर्थन करने की समस्या को संबोधित करने में परिष्कार के विभिन्न स्तरों को लक्षित किया है, जो सिमेंटिक सरोकार की पूरी तरह से अनुपस्थिति से लेकर अधिक सैद्धांतिक सिमेंटिक तक भिन्न होता है। मॉडल। जबकि संरचित डेटा पर सिमेंटिक खोज और प्राकृतिक भाषा क्वेरी सिस्टम में स्कीमा-अज्ञेयवाद की मांग एक अंतर्निहित आवश्यकता रही है, यह एक अवधारणा के रूप में और समकालीन डेटाबेस प्रबंधन प्रणालियों के लिए एक आवश्यक आवश्यकता के रूप में पर्याप्त रूप से व्यक्तिगत नहीं है। हाल के कार्यों ने स्कीमा-अज्ञेयवादी प्रश्नों में शामिल सिमेंटिक पहलुओं को परिभाषित और मॉडल करना शुरू कर दिया है।<ref name="freitasThesis"/><ref name="Mapping">A. Freitas, J. C. Pereira Da Silva, E. Curry, [http://andrefreitas.org/papers/schema_agnostic_i_final_version.pdf, "On the Semantic Mapping of Schema-agnostic Queries: A Preliminary Study"], Workshop of the Natural Language Interfaces for the Web of Data (NLIWoD), 13th International Semantic Web Conference (ISWC), Rival del Garda, 2014.</ref><ref name="Bischof">S. Bischof, M. Kroetzsch, A. Polleres, S. Rudolph, ["Schema-Agnostic Query Rewriting in SPARQL 1.1"], In Proceedings of the 13th International Semantic Web Conference. Springer 2014.</ref>
डेटाबेस पर प्राकृतिक भाषा अंतराफलक (एनएलआई) का समर्थन करने के लिए दृष्टिकोण का विकास स्कीमा-अज्ञेय प्रश्नों के लक्ष्य की ओर लक्षित होता है। पूरक रूप से, खोजशब्द खोज पर आधारित प्रश्नों को लक्षित करता है जो अधिक जटिल सूचना आवश्यकताओं को व्यक्त करता है। अन्य दृष्टिकोणों ने डेटाबेस पर संरचित प्रश्नों के निर्माण की खोज की है जहाँ स्कीमा बाधाओं को कम किया जा सकता है। इन सभी दृष्टिकोणों (प्राकृतिक भाषा, खोजशब्द-आधारित खोज और संरचित प्रश्नों) ने प्रश्नों और डेटा के बीच एक लचीले सिमेंटिक मिलान का समर्थन करने की समस्या को संबोधित करने में परिष्कार के विभिन्न स्तरों को लक्षित करता है, जो सिमेंटिक सरोकार की पूरी तरह से अनुपस्थिति से लेकर अधिक सैद्धांतिक सिमेंटिक तक भिन्न होता है। जबकि संरचित डेटा पर सिमेंटिक खोज और प्राकृतिक भाषा क्वेरी प्रणाली में स्कीमा-अज्ञेयवाद की मांग एक अंतर्निहित आवश्यकता रहती है, यह एक अवधारणा के रूप में और समकालीन डेटाबेस प्रबंधन प्रणालियों के लिए एक आवश्यक आवश्यकता के रूप में पर्याप्त रूप से व्यक्तिगत नहीं होता है। हाल के कार्यों में स्कीमा-अज्ञेयवादी प्रश्नों में सम्मलित सिमेंटिक पहलुओं को परिभाषित और प्रतिरूप करना शुरू कर देता है।<ref name="freitasThesis"/><ref name="Mapping">A. Freitas, J. C. Pereira Da Silva, E. Curry, [http://andrefreitas.org/papers/schema_agnostic_i_final_version.pdf, "On the Semantic Mapping of Schema-agnostic Queries: A Preliminary Study"], Workshop of the Natural Language Interfaces for the Web of Data (NLIWoD), 13th International Semantic Web Conference (ISWC), Rival del Garda, 2014.</ref><ref name="Bischof">S. Bischof, M. Kroetzsch, A. Polleres, S. Rudolph, ["Schema-Agnostic Query Rewriting in SPARQL 1.1"], In Proceedings of the 13th International Semantic Web Conference. Springer 2014.</ref>
=== स्कीमा-अज्ञेयवादी संरचित प्रश्न ===
=== स्कीमा-अज्ञेयवादी संरचित प्रश्न ===


एक संरचित मानक (उदाहरण के लिए [[SQL]], [[SPARQL]]) के सिंटैक्स के बाद स्कीमा-अज्ञेयवादी प्रश्नों से मिलकर बनता है। ऑपरेटरों के वाक्य-विन्यास और शब्दार्थ को बनाए रखा जाता है, जबकि विभिन्न शब्दावली का उपयोग किया जाता है।
एक संरचित मानक (उदाहरण के लिए [[SQL]], [[SPARQL]]) के वाक्य-विन्यास के बाद स्कीमा-अज्ञेयवादी प्रश्नों से मिलकर बनता है। संचालिका के वाक्य-विन्यास और शब्दार्थ को बनाए रखा जाता है, जबकि विभिन्न शब्दावली का उपयोग किया जाता है।


==== उदाहरण 1 ====
==== उदाहरण 1 ====
<पूर्व>
SELECT ?y {
चुनें? वाई {
  BillClinton hasDaughter ?x .
  बिल क्लिंटन की बेटी ?x है।
  ?x marriedTo ?y .
  ?x से शादी की ?y .
}
</पूर्व>
 
जो डेटासेट शब्दावली में निम्नलिखित SPARQL क्वेरी को मैप करता है:
 
<वाक्यविन्यास लैंग = स्पार्कल>
उपसर्ग : <http://dbpedia.org/resource/>
उपसर्ग dbpedia2: <http://dbpedia.org/property/>
उपसर्ग dbpedia: <http://dbpedia.org/ontology/>
प्रीफ़िक्स स्कोस: <http://www.w3.org/2004/02/skos/core#>
उपसर्ग dbo: <http://dbpedia.org/ontology/>
 
चुनें? वाई {
: बिल_क्लिंटन डीबीपीडिया: बच्चा? एक्स।
?x dbpedia2:पति/पत्नी ?y .
  }
  }
</वाक्यविन्यास हाइलाइट>
जो डेटासेट शब्दावली में निम्नलिखित एसपीएआरक्यूएल क्वेरी को मैप करता है:
 
PREFIX : <http://dbpedia.org/resource/>
PREFIX dbpedia2: <http://dbpedia.org/property/>
PREFIX dbpedia: <http://dbpedia.org/ontology/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX dbo: <http://dbpedia.org/ontology/>
SELECT  ?y  {
  :Bill_Clinton dbpedia:child ?x .
  ?x dbpedia2:spouse ?y .
  }
==== उदाहरण 2 ====
==== उदाहरण 2 ====
 
SELECT  ?x {
<वाक्यविन्यास लैंग = स्पार्कल>
          ?x isA book .
चयन करें? एक्स {
          ?x by William_Goldman .
        ? x एक किताब है।
          ?x has_pages ?p .
        ? x विलियम_गोल्डमैन द्वारा।
          FILTER (?p > 300)
        ?x has_pages ?p .
  }
        फ़िल्टर (?p > 300)
जो डेटासेट शब्दावली में निम्नलिखित एसपीएआरक्यूएल क्वेरी को मैप करता है:
  }
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
</वाक्यविन्यास हाइलाइट>
PREFIX : <http://dbpedia.org/resource/>
 
PREFIX dbpedia2: <http://dbpedia.org/property/>
जो डेटासेट शब्दावली में निम्नलिखित SPARQL क्वेरी को मैप करता है:
PREFIX dbpedia: <http://dbpedia.org/ontology/>
 
SELECT ?x {
<वाक्यविन्यास लैंग = स्पार्कल>
          ?x rdf:type dbpedia:Book .
उपसर्ग आरडीएफ: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
          ?x dbpedia2:author :William_Goldman .
उपसर्ग : <http://dbpedia.org/resource/>
          ?x dbpedia:numberOfPages ?p .
उपसर्ग dbpedia2: <http://dbpedia.org/property/>
FILTER(?p > 300)
उपसर्ग dbpedia: <http://dbpedia.org/ontology/>
}
चयन करें? एक्स {
        ?x rdf: dbpedia टाइप करें: बुक।
        ?x dbpedia2: लेखक : विलियम_गोल्डमैन।
        ?x dbpedia:numberOfPages ?p .
फ़िल्टर(?p > 300)
}
</वाक्यविन्यास हाइलाइट>
 
=== स्कीमा-अज्ञेयवादी खोजशब्द प्रश्न ===
=== स्कीमा-अज्ञेयवादी खोजशब्द प्रश्न ===


कीवर्ड प्रश्नों का उपयोग करते हुए स्कीमा-अज्ञेयवादी प्रश्नों से मिलकर बनता है। इस मामले में ऑपरेटरों के सिंटैक्स और शब्दार्थ संरचित क्वेरी सिंटैक्स से भिन्न होते हैं।
संकेत शब्द प्रश्नों का उपयोग करते हुए स्कीमा-अज्ञेयवादी प्रश्नों से मिलकर बनता है। इस मामले में ऑपरेटरों के सिंटैक्स और शब्दार्थ संरचित क्वेरी सिंटैक्स से भिन्न होते है।


==== उदाहरण ====
==== उदाहरण ====
<पूर्व>
  "Bill Clinton daughter married to"
  बिल क्लिंटन की बेटी से शादी की
</पूर्व>
 
<पूर्व>
300 से अधिक पृष्ठों वाली विलियम गोल्डमैन की पुस्तकें
</पूर्व>


"Books by William Goldman with more than 300 pages"
== शब्दार्थ जटिलता ==
== शब्दार्थ जटिलता ==


2016 तक स्कीमा-अज्ञेयवादी प्रश्नों की अवधारणा मुख्य रूप से अकादमिक क्षेत्र में विकसित की गई है। अधिकांश स्कीमा-एग्नोस्टिक क्वेरी सिस्टम की जांच डेटाबेस या सिमेंटिक वेब पर प्राकृतिक भाषा इंटरफेस के संदर्भ में की गई है।<ref>Unger et al., ["Introduction to Question Answering over Linked Data"], In Proceedings of the 2014 Reasoning Web Summer School, 2014</ref> ये कार्य बड़े, विषम और स्कीमा-रहित डेटाबेस पर [[सिमेंटिक पार्सिंग]] तकनीकों के अनुप्रयोग का पता लगाते हैं। हाल ही में, स्कीमा-एग्नोस्टिक क्वेरी सिस्टम और डेटाबेस की अवधारणा का वैयक्तिकरण साहित्य के भीतर अधिक स्पष्ट रूप से प्रकट हुआ है।<ref name="freitasThesis"/><ref name="Mapping"/><ref name="Bischof"/> फ्रेटास एट अल।<ref>A. Freitas, J. E. Sales, S. Handschuh, E. Curry, [http://andrefreitas.org/papers/preprint_iwcs_2015.pdf "How hard is the Query? Measuring the Semantic Complexity of Schema-Agnostic Queries"], In Proceedings of the 11th International Conference on Computational Semantics (IWCS), London, 2015.</ref> स्कीमा-अज्ञेयवादी प्रश्नों की मैपिंग की सिमेंटिक जटिलता पर एक संभाव्य मॉडल प्रदान करें।
2016 तक स्कीमा-अज्ञेयवादी प्रश्नों की अवधारणा मुख्य रूप से अकादमिक क्षेत्र में विकसित की गई थी। अधिकांश स्कीमा-अज्ञेयवाद क्वेरी प्रणाली की जांच डेटाबेस या सिमेंटिक वेब पर प्राकृतिक भाषा अंतराफलक के संदर्भ में की गई थी।<ref>Unger et al., ["Introduction to Question Answering over Linked Data"], In Proceedings of the 2014 Reasoning Web Summer School, 2014</ref> ये कार्य बड़े, विषम और स्कीमा-रहित डेटाबेस पर [[सिमेंटिक पार्सिंग]] तकनीकों के अनुप्रयोग का पता लगाते है। हाल ही में, स्कीमा-अज्ञेयवाद क्वेरी प्रणाली और डेटाबेस की अवधारणा का वैयक्तिकरण साहित्य के भीतर अधिक स्पष्ट रूप से प्रकट हुआ था।<ref name="freitasThesis"/><ref name="Mapping"/><ref name="Bischof"/><ref>A. Freitas, J. E. Sales, S. Handschuh, E. Curry, [http://andrefreitas.org/papers/preprint_iwcs_2015.pdf "How hard is the Query? Measuring the Semantic Complexity of Schema-Agnostic Queries"], In Proceedings of the 11th International Conference on Computational Semantics (IWCS), London, 2015.</ref> स्कीमा-अज्ञेयवादी प्रश्नों की मैपिंग की सिमेंटिक जटिलता पर एक संभाव्य मॉडल प्रदान करता है।


== संदर्भ ==
== संदर्भ ==
{{reflist}}
{{reflist}}
[[Category: कृत्रिम होशियारी]] [[Category: कंप्यूटर डेटा]] [[Category: डेटाबेस प्रबंधन तंत्र]]


[[Category: Machine Translated Page]]
[[Category:Created On 16/02/2023]]
[[Category:Created On 16/02/2023]]
[[Category:Machine Translated Page]]
[[Category:Pages with script errors]]
[[Category:कंप्यूटर डेटा]]
[[Category:कृत्रिम होशियारी]]
[[Category:डेटाबेस प्रबंधन तंत्र]]

Latest revision as of 13:04, 12 March 2023

स्कीमा-अज्ञेयवादी डेटाबेस या शब्दावली-स्वतंत्र डेटाबेस का उद्देश्य उपयोगकर्ताओं को डेटा के प्रतिनिधित्व से सारगर्भित होने में मदद करना होता है, जो प्रश्नों और डेटाबेस के बीच स्वचालित सिमेंटिक मिलान का समर्थन करता है। स्कीमा-अज्ञेयवाद उपयोगकर्ता शब्दावली और संरचना के साथ जारी किए गए क्वेरी को मैप करने के डेटाबेस की संपत्ति होती है, इसे स्वचालित रूप से डेटासेट शब्दावली में मैप करना होता है।

आकार में वृद्धि और डेटाबेस स्कीमा के सिमेंटिक विषमता में उपयोगकर्ताओं को संरचित डेटा की क्वेरी और खोज के लिए नई आवश्यकताएं लाती है। इस पैमाने पर डेटा उपभोक्ताओं के लिए इसे क्वेरी करने के लिए डेटा के प्रतिनिधित्व से परिचित होना अक्षम्य हो सकता है। इस चर्चा के केंद्र में उपयोगकर्ताओं और डेटाबेस के बीच सिमेंटिक गैप होता है, जो डेटा के पैमाने और जटिलता बढ़ने के साथ और अधिक केंद्रीय हो जाता है।

विवरण

कई डेटा स्रोतों से डेटा की खपत के प्रति डेटा वातावरण का विकास और स्कीमा के आकार, जटिलता, गतिशीलता और विकेंद्रीकरण (एससीओडीडी) में वृद्धि[1][2][3] समकालीन डेटा प्रबंधन की जटिलता को बढ़ाता है। एससीओडीडी प्रवृत्ति बिग डेटा परिदृश्यों में एक केंद्रीय डेटा प्रबंधन चिंता के रूप में उभरती है, जहां उपयोगकर्ताओं और अनुप्रयोगों के पास स्वतंत्र डेटा स्रोतों द्वारा उत्पादित अधिक पूर्ण डेटा की मांग होती है, जो विभिन्न सिमेंटिक मान्यताओं और उपयोग के संदर्भों के अनुसार होती है, जो सेमांटिक वेब के लिए विशिष्ट परिदृश्य होती है।

विषम डेटा वातावरण की दिशा में डेटाबेस का विकास मौजूदा डेटा अभिगम्यता विधियों जैसे संरचित प्रश्नों, संकेत शब्द आधारित खोज और विज़ुअल क्वेरी प्रणाली के पीछे उपयोगिता, सांकेतिकता और सिमेंटिक धारणाओं को दृढ़ता से प्रभावित करता है। स्कीमा रहित डेटाबेस में संभावित रूप से लाखों गतिशील रूप से बदलती विशेषताएँ होती है, कुछ उपयोगकर्ताओं के लिए डेटाबेस को क्वेरी करने के लिए स्कीमा या शब्दावली से अवगत होना अक्षम्य हो जाता है। इस पैमाने पर, संरचित क्वेरी बनाने के लिए स्कीमा को समझने का प्रयास निषेधात्मक हो सकता है।

स्कीमा-अज्ञेयवादी प्रश्न

स्कीमा-अज्ञेय प्रश्नों को संरचित डेटाबेस पर क्वेरी दृष्टिकोण के रूप में परिभाषित किया जा सकता है जो उपयोगकर्ताओं को डेटाबेस के प्रतिनिधित्व (स्कीमा) की समझ के बिना जटिल सूचना आवश्यकताओं को पूरा करने की अनुमति देता है।[4] इसे खोज दृष्टिकोण के रूप में परिभाषित करता है, जिसके लिए उपयोगकर्ताओं को डेटा के अंतर्निहित स्कीमा को जानने की आवश्यकता नहीं होती है। डेटाबेस पर खोजशब्द-आधारित खोज जैसे दृष्टिकोण उपयोगकर्ताओं को संरचित प्रश्नों को नियोजित किए बिना डेटाबेस को क्वेरी करने की अनुमति देता है। चूंकि, जैसा कि ट्रान एट अल द्वारा चर्चा की गई है: इन बिंदुओं से उपयोगकर्ताओं को जटिल जानकारी की जरूरतों को पूरा करने के लिए आगे मार्गदर्शन और अन्वेषण करना पड़ता है। वेब पर उपयोग किए जाने वाले संकेत शब्द खोज के विपरीत, जो सरल आवश्यकताओं पर केंद्रित होता है, यहां विस्तृत खोजशब्द खोज है अधिक जटिल परिणाम प्राप्त करने के लिए उपयोग किया जाता है। संसाधनों के एकल सेट के अतिरिक्त, लक्ष्य संसाधनों के जटिल सेट और उनके संबंधों की गणना करता है।

डेटाबेस पर प्राकृतिक भाषा अंतराफलक (एनएलआई) का समर्थन करने के लिए दृष्टिकोण का विकास स्कीमा-अज्ञेय प्रश्नों के लक्ष्य की ओर लक्षित होता है। पूरक रूप से, खोजशब्द खोज पर आधारित प्रश्नों को लक्षित करता है जो अधिक जटिल सूचना आवश्यकताओं को व्यक्त करता है। अन्य दृष्टिकोणों ने डेटाबेस पर संरचित प्रश्नों के निर्माण की खोज की है जहाँ स्कीमा बाधाओं को कम किया जा सकता है। इन सभी दृष्टिकोणों (प्राकृतिक भाषा, खोजशब्द-आधारित खोज और संरचित प्रश्नों) ने प्रश्नों और डेटा के बीच एक लचीले सिमेंटिक मिलान का समर्थन करने की समस्या को संबोधित करने में परिष्कार के विभिन्न स्तरों को लक्षित करता है, जो सिमेंटिक सरोकार की पूरी तरह से अनुपस्थिति से लेकर अधिक सैद्धांतिक सिमेंटिक तक भिन्न होता है। जबकि संरचित डेटा पर सिमेंटिक खोज और प्राकृतिक भाषा क्वेरी प्रणाली में स्कीमा-अज्ञेयवाद की मांग एक अंतर्निहित आवश्यकता रहती है, यह एक अवधारणा के रूप में और समकालीन डेटाबेस प्रबंधन प्रणालियों के लिए एक आवश्यक आवश्यकता के रूप में पर्याप्त रूप से व्यक्तिगत नहीं होता है। हाल के कार्यों में स्कीमा-अज्ञेयवादी प्रश्नों में सम्मलित सिमेंटिक पहलुओं को परिभाषित और प्रतिरूप करना शुरू कर देता है।[1][5][6]

स्कीमा-अज्ञेयवादी संरचित प्रश्न

एक संरचित मानक (उदाहरण के लिए SQL, SPARQL) के वाक्य-विन्यास के बाद स्कीमा-अज्ञेयवादी प्रश्नों से मिलकर बनता है। संचालिका के वाक्य-विन्यास और शब्दार्थ को बनाए रखा जाता है, जबकि विभिन्न शब्दावली का उपयोग किया जाता है।

उदाहरण 1

SELECT ?y {
  BillClinton hasDaughter ?x .
  ?x marriedTo ?y .
}

जो डेटासेट शब्दावली में निम्नलिखित एसपीएआरक्यूएल क्वेरी को मैप करता है:

PREFIX : <http://dbpedia.org/resource/>
PREFIX dbpedia2: <http://dbpedia.org/property/>
PREFIX dbpedia: <http://dbpedia.org/ontology/>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX dbo: <http://dbpedia.org/ontology/>

SELECT   ?y  {
 :Bill_Clinton dbpedia:child ?x .
 ?x dbpedia2:spouse ?y .
 }

उदाहरण 2

SELECT   ?x {
         ?x isA book .
         ?x by William_Goldman .
         ?x has_pages ?p .
         FILTER (?p > 300)
  }

जो डेटासेट शब्दावली में निम्नलिखित एसपीएआरक्यूएल क्वेरी को मैप करता है:

PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX : <http://dbpedia.org/resource/>
PREFIX dbpedia2: <http://dbpedia.org/property/>
PREFIX dbpedia: <http://dbpedia.org/ontology/>
SELECT ?x {
         ?x rdf:type dbpedia:Book .
         ?x dbpedia2:author :William_Goldman . 
         ?x dbpedia:numberOfPages ?p .
FILTER(?p > 300)
}

स्कीमा-अज्ञेयवादी खोजशब्द प्रश्न

संकेत शब्द प्रश्नों का उपयोग करते हुए स्कीमा-अज्ञेयवादी प्रश्नों से मिलकर बनता है। इस मामले में ऑपरेटरों के सिंटैक्स और शब्दार्थ संरचित क्वेरी सिंटैक्स से भिन्न होते है।

उदाहरण

"Bill Clinton daughter married to"
"Books by William Goldman with more than 300 pages"

शब्दार्थ जटिलता

2016 तक स्कीमा-अज्ञेयवादी प्रश्नों की अवधारणा मुख्य रूप से अकादमिक क्षेत्र में विकसित की गई थी। अधिकांश स्कीमा-अज्ञेयवाद क्वेरी प्रणाली की जांच डेटाबेस या सिमेंटिक वेब पर प्राकृतिक भाषा अंतराफलक के संदर्भ में की गई थी।[7] ये कार्य बड़े, विषम और स्कीमा-रहित डेटाबेस पर सिमेंटिक पार्सिंग तकनीकों के अनुप्रयोग का पता लगाते है। हाल ही में, स्कीमा-अज्ञेयवाद क्वेरी प्रणाली और डेटाबेस की अवधारणा का वैयक्तिकरण साहित्य के भीतर अधिक स्पष्ट रूप से प्रकट हुआ था।[1][5][6][8] स्कीमा-अज्ञेयवादी प्रश्नों की मैपिंग की सिमेंटिक जटिलता पर एक संभाव्य मॉडल प्रदान करता है।

संदर्भ

  1. 1.0 1.1 1.2 A. Freitas, "Schema-agnostic queries over large-schema databases: a distributional semantics approach" PhD Thesis, 2015
  2. Pat Helland, ["If you have too much data, then 'good enough' is good enough"], Commun. ACM 54(6): 40–47, 2011.
  3. M. L. Brodie and J. T. Liu, ["The power and limits of relational technology in the age of information ecosystems"], Keynote, On The Move Federated Conferences, Heraklion, Greece, October 25–29, 2010.
  4. T. Tran, T. Mathaess, P. Haase, ["Usability of Keyword-driven Schema-agnostic Search – A Comparative Study of Keyword Search, Faceted Search, Query Completion and Result Completion"], In Proceedings of 7th Extended Semantic Web Conference (ESWC'10). Heraklion, Greece, June, 2010.
  5. 5.0 5.1 A. Freitas, J. C. Pereira Da Silva, E. Curry, "On the Semantic Mapping of Schema-agnostic Queries: A Preliminary Study", Workshop of the Natural Language Interfaces for the Web of Data (NLIWoD), 13th International Semantic Web Conference (ISWC), Rival del Garda, 2014.
  6. 6.0 6.1 S. Bischof, M. Kroetzsch, A. Polleres, S. Rudolph, ["Schema-Agnostic Query Rewriting in SPARQL 1.1"], In Proceedings of the 13th International Semantic Web Conference. Springer 2014.
  7. Unger et al., ["Introduction to Question Answering over Linked Data"], In Proceedings of the 2014 Reasoning Web Summer School, 2014
  8. A. Freitas, J. E. Sales, S. Handschuh, E. Curry, "How hard is the Query? Measuring the Semantic Complexity of Schema-Agnostic Queries", In Proceedings of the 11th International Conference on Computational Semantics (IWCS), London, 2015.