रेंज क्वेरी (डेटा संरचनाएं): Difference between revisions

From Vigyanwiki
No edit summary
No edit summary
Line 1: Line 1:
{{for|finding items that fall within a range|range query (database)}}[[डेटा संरचना]]ओं में, रेंज क्वेरी में [[डेटा प्री-प्रोसेसिंग]] शामिल होती है | इनपुट के किसी भी सबसेट पर किसी भी संख्या में प्रश्नों का कुशलतापूर्वक उत्तर देने के लिए डेटा संरचना में कुछ इनपुट डेटा को प्री-प्रोसेस किया जाता है। विशेष रूप से, समस्याओं का समूह है जिसका बड़े पैमाने पर अध्ययन किया गया है जहां इनपुट अवर्गीकृत संख्याओं की [[सरणी डेटा संरचना]] है और क्वेरी में सरणी की विशिष्ट सीमा पर कुछ फ़ंक्शन, जैसे न्यूनतम, की गणना करना शामिल है।
{{for|finding items that fall within a range|range query (database)}}[[डेटा संरचना]]ओं में, '''रेंज क्वेरी''' में [[डेटा प्री-प्रोसेसिंग]] सम्मिलित होती है | इनपुट के किसी भी सबसेट पर किसी भी संख्या में प्रश्नों का कुशलतापूर्वक उत्तर देने के लिए डेटा संरचना में कुछ इनपुट डेटा को प्री-प्रोसेस किया जाता है। विशेष रूप से, समस्याओं का समूह है जिसका बड़े मापदंड पर अध्ययन किया गया है जहां इनपुट अवर्गीकृत संख्याओं की [[सरणी डेटा संरचना]] है और क्वेरी में सरणी की विशिष्ट सीमा पर कुछ फलन, जैसे न्यूनतम, की गणना करना सम्मिलित है।


==परिभाषा==
==परिभाषा==


एक श्रेणी क्वेरी <math>q_f(A,i,j)</math> सरणी पर <math>A=[a_1,a_2,..,a_n]</math> किसी समुच्चय के n तत्वों का {{mvar|S}}, निरूपित <math>A[1,n]</math>, दो सूचकांक लेता है <math>1\leq i\leq j\leq n</math>, समारोह {{mvar|f}} के तत्वों की सरणियों पर परिभाषित {{mvar|S}} और आउटपुट <math>f(A[i,j])= f(a_i,\ldots,a_j)</math>.
कुछ सेट {{mvar|S}} के n तत्वों की एक सरणी <math>A=[a_1,a_2,..,a_n]</math> पर एक श्रेणी क्वेरी <math>q_f(A,i,j)</math>, जिसे <math>A[1,n]</math>, दो सूचकांक लेता है <math>1\leq i\leq j\leq n</math>, एक फलन {{mvar|f}} जो {{mvar|S}} के तत्वों के सरणियों पर परिभाषित होता है और <math>f(A[i,j])= f(a_i,\ldots,a_j)</math> आउटपुट करता है


उदाहरण के लिए, के लिए <math>f = \sum</math> और <math>A[1,n]</math> संख्याओं की सारणी, श्रेणी क्वेरी <math>\sum_{i,j} A</math> गणना करता है <math>\sum A[i,j] = (a_i+\ldots + a_j)</math>, किसी के लिए <math>1 \leq i  \leq j  \leq n</math>. इन प्रश्नों का उत्तर [[निरंतर समय]] और उपयोग में दिया जा सकता है <math>O(n)</math> पहले के योग की गणना करके अतिरिक्त स्थान {{mvar|i}} घटक {{mvar|A}} और उन्हें सहायक सरणी में संग्रहीत करना {{mvar|B}}, ऐसा है कि <math>B[i]</math> प्रथम का योग सम्मिलित है {{mvar|i}} घटक {{mvar|A}} हरएक के लिए  <math>0\leq i\leq n</math>. इसलिए, किसी भी प्रश्न का उत्तर ऐसा करके दिया जा सकता है <math>\sum A[i,j] = B[j] - B[i-1]</math>.
उदाहरण के लिए, के लिए <math>f = \sum</math> और <math>A[1,n]</math> संख्याओं की सारणी, श्रेणी क्वेरी <math>\sum_{i,j} A</math> गणना करता है <math>\sum A[i,j] = (a_i+\ldots + a_j)</math>, किसी के लिए <math>1 \leq i  \leq j  \leq n</math>. इन प्रश्नों का उत्तर [[निरंतर समय]] और उपयोग <math>O(n)</math> में दिया जा सकता है  पहले के योग की गणना करके अतिरिक्त स्थान {{mvar|i}} घटक {{mvar|A}} और उन्हें सहायक सरणी में संग्रहीत करना {{mvar|B}}, ऐसा है कि <math>B[i]</math> प्रथम का योग सम्मिलित है {{mvar|i}} घटक {{mvar|A}} हर एक के लिए  <math>0\leq i\leq n</math>. इसलिए, किसी भी प्रश्न का उत्तर ऐसा करके दिया जा सकता है .
 
<math>\sum A[i,j] = B[j] - B[i-1]</math>
 
इस रणनीति को प्रत्येक [[समूह (गणित)]] ऑपरेटर के लिए बढ़ाया जा सकता है {{mvar|f}}  जहां की धारणा <math>f^{-1}</math> अच्छी तरह से परिभाषित और सरलता से गणना योग्य है।<ref name="morin">{{cite journal|first1=Danny|last1=Krizanc|first2=Pat|last2=Morin|author2-link= Pat Morin |first3=Michiel H. M.|last3=Smid|title=सूचियों और पेड़ों पर रेंज मोड और रेंज मेडियन क्वेरीज़|journal=ISAAC|year=2003|pages=517–526|url=http://cg.scs.carleton.ca/~morin/publications/|arxiv=cs/0307034|bibcode=2003cs........7034K }}</ref> अंत में, इस समाधान को समान पूर्व-प्रसंस्करण के साथ द्वि-आयामी सरणियों तक बढ़ाया जा सकता है।<ref name="menhe">{{cite journal|last1=Meng|first1=He|first2=J. Ian|last2=Munro|first3=Patrick K.|last3=Nicholson|title=रैखिक अंतरिक्ष में गतिशील रेंज चयन|journal=ISAAC|year=2011|pages=160–169|arxiv=1106.5076 }}</ref>


इस रणनीति को प्रत्येक [[समूह (गणित)]] ऑपरेटर के लिए बढ़ाया जा सकता है {{mvar|f}} जहां की धारणा <math>f^{-1}</math> अच्छी तरह से परिभाषित और आसानी से गणना योग्य है।<ref name="morin">{{cite journal|first1=Danny|last1=Krizanc|first2=Pat|last2=Morin|author2-link= Pat Morin |first3=Michiel H. M.|last3=Smid|title=सूचियों और पेड़ों पर रेंज मोड और रेंज मेडियन क्वेरीज़|journal=ISAAC|year=2003|pages=517–526|url=http://cg.scs.carleton.ca/~morin/publications/|arxiv=cs/0307034|bibcode=2003cs........7034K }}</ref> अंत में, इस समाधान को समान पूर्व-प्रसंस्करण के साथ द्वि-आयामी सरणियों तक बढ़ाया जा सकता है।<ref name=menhe>{{cite journal|last1=Meng|first1=He|first2=J. Ian|last2=Munro|first3=Patrick K.|last3=Nicholson|title=रैखिक अंतरिक्ष में गतिशील रेंज चयन|journal=ISAAC|year=2011|pages=160–169|arxiv=1106.5076 }}</ref>




Line 14: Line 17:
===सेमीग्रुप ऑपरेटर===
===सेमीग्रुप ऑपरेटर===
[[File:LowesCommon-fixed.png|thumb|right|300x200px|alt=न्यूनतम श्रेणी की क्वेरी को हल करने के लिए संबंधित कार्टेशियन ट्री का निर्माण करना। निम्नतम सामान्य पूर्वज समस्या तक सीमित।]]
[[File:LowesCommon-fixed.png|thumb|right|300x200px|alt=न्यूनतम श्रेणी की क्वेरी को हल करने के लिए संबंधित कार्टेशियन ट्री का निर्माण करना। निम्नतम सामान्य पूर्वज समस्या तक सीमित।]]
{{main|Range minimum query}}
{{main|न्यूनतम क्वेरी रेंज}}


जब किसी श्रेणी क्वेरी में रुचि का कार्य एक [[ अर्धसमूह ]] ऑपरेटर होता है, तो इसकी धारणा <math>f^{-1}</math> हमेशा परिभाषित नहीं किया जाता है, इसलिए पिछले अनुभाग की रणनीति काम नहीं करती है। [[एंड्रयू याओ]] ने दिखाया<ref name="yao">{{cite journal|last=Yao, A. C|title=रेंज प्रश्नों का उत्तर देने के लिए स्पेस-टाइम ट्रेडऑफ़|journal=E 14th Annual ACM Symposium on the Theory of Computing|year=1982|pages=128–136}}</ref> सेमीग्रुप ऑपरेटरों को शामिल करने वाली रेंज क्वेरीज़ के लिए कुशल समाधान मौजूद है। उन्होंने इसे किसी भी स्थिरांक के लिए सिद्ध किया {{mvar|c}}, समय और स्थान का पूर्व-प्रसंस्करण <math>\theta(c\cdot n)</math> जहां सूचियों पर श्रेणी प्रश्नों का उत्तर देने की अनुमति देता है {{mvar|f}} सेमीग्रुप ऑपरेटर है <math>\theta(\alpha_c(n))</math> समय, कहाँ <math>\alpha_c</math> [[एकरमैन फ़ंक्शन]] का निश्चित कार्यात्मक व्युत्क्रम है।
जब किसी श्रेणी क्वेरी में रुचि का कार्य एक [[ अर्धसमूह ]] ऑपरेटर होता है, जिससे इसकी धारणा <math>f^{-1}</math> सदैव परिभाषित नहीं किया जाता है, इसलिए पिछले अनुभाग की रणनीति काम नहीं करती है। [[एंड्रयू याओ]] ने दिखाया <ref name="yao">{{cite journal|last=Yao, A. C|title=रेंज प्रश्नों का उत्तर देने के लिए स्पेस-टाइम ट्रेडऑफ़|journal=E 14th Annual ACM Symposium on the Theory of Computing|year=1982|pages=128–136}}</ref> सेमीग्रुप ऑपरेटरों को सम्मिलित करने वाली रेंज क्वेरीज़ के लिए कुशल समाधान उपस्थित है। उन्होंने इसे किसी भी स्थिरांक के लिए सिद्ध किया {{mvar|c}}, समय और स्थान का पूर्व-प्रसंस्करण <math>\theta(c\cdot n)</math> जहां सूचियों पर श्रेणी प्रश्नों का उत्तर देने की अनुमति देता है {{mvar|f}} सेमीग्रुप ऑपरेटर है <math>\theta(\alpha_c(n))</math> समय, जहाँ <math>\alpha_c</math> [[एकरमैन फ़ंक्शन|एकरमैन फलन]] का निश्चित कार्यात्मक व्युत्क्रम है।


कुछ सेमीग्रुप ऑपरेटर हैं जो थोड़ा बेहतर समाधान स्वीकार करते हैं। उदाहरण के लिए जब <math>f\in \{\max,\min\}</math>. मान लीजिए <math> f = \min</math> तब <math>\min(A[1..n])</math> के [[न्यूनतम]] तत्व का सूचकांक लौटाता है <math>A[1..n]</math>. तब <math>\min_{i,j}(A)</math> संबंधित न्यूनतम श्रेणी क्वेरी को दर्शाता है। ऐसी कई डेटा संरचनाएं हैं जो न्यूनतम सीमा में क्वेरी का उत्तर देने की अनुमति देती हैं <math>O(1)</math> समय और स्थान की पूर्व-प्रसंस्करण का उपयोग करके <math>O(n)</math>. ऐसा समाधान इस समस्या और निम्नतम सामान्य पूर्वज समस्या के बीच समानता पर आधारित है।
कुछ सेमीग्रुप ऑपरेटर हैं जो थोड़ा उत्तम समाधान स्वीकार करते हैं। उदाहरण के लिए जब <math>f\in \{\max,\min\}</math>. मान लीजिए <math> f = \min</math> तब <math>\min(A[1..n])</math> के [[न्यूनतम]] तत्व का सूचकांक लौटाता है <math>A[1..n]</math>. तब <math>\min_{i,j}(A)</math> संबंधित न्यूनतम श्रेणी क्वेरी को दर्शाता है। ऐसी कई डेटा संरचनाएं हैं जो न्यूनतम सीमा में क्वेरी का उत्तर देने की अनुमति देती हैं <math>O(1)</math> समय और स्थान की पूर्व-प्रसंस्करण का उपयोग करके <math>O(n)</math>. ऐसा समाधान इस समस्या और निम्नतम सामान्य प्राचीन समस्या के बीच समानता पर आधारित है।


[[कार्तीय वृक्ष]] <math>T_A</math> सरणी का <math>A[1,n]</math> जड़ के रूप में है <math>a_i = \min\{a_1,a_2,\ldots,a_n\}</math> और बाएँ और दाएँ उपवृक्ष के रूप में कार्तीय वृक्ष <math>A[1,i-1]</math> और कार्तीय वृक्ष <math>A[i+1,n]</math> क्रमश। श्रेणी न्यूनतम क्वेरी <math>\min_{i,j}(A)</math> में निम्नतम सामान्य पूर्वज है <math>T_A</math> का <math>a_i</math> और <math>a_j</math>. क्योंकि सबसे कम सामान्य पूर्वज को समय और स्थान की पूर्व-प्रसंस्करण का उपयोग करके निरंतर समय में हल किया जा सकता है <math>O(n)</math>, रेंज न्यूनतम क्वेरी भी कर सकते हैं। समाधान जब <math>f = \max</math> अनुरूप है. कार्तीय वृक्षों का निर्माण [[रैखिक समय]] में किया जा सकता है।
[[कार्तीय वृक्ष]] <math>T_A</math> सरणी का <math>A[1,n]</math> जड़ के रूप में है <math>a_i = \min\{a_1,a_2,\ldots,a_n\}</math> और बाएँ और दाएँ उपवृक्ष के रूप में कार्तीय वृक्ष <math>A[1,i-1]</math> और कार्तीय वृक्ष <math>A[i+1,n]</math> क्रमश। श्रेणी न्यूनतम क्वेरी <math>\min_{i,j}(A)</math> में निम्नतम सामान्य प्राचीन है <math>T_A</math> का <math>a_i</math> और <math>a_j</math>. क्योंकि सबसे कम सामान्य प्राचीन को समय और स्थान की पूर्व-प्रसंस्करण का उपयोग करके निरंतर समय में हल किया जा सकता है <math>O(n)</math>, रेंज न्यूनतम क्वेरी भी कर सकते हैं। समाधान जब <math>f = \max</math> अनुरूप है. कार्तीय वृक्षों का निर्माण [[रैखिक समय]] में किया जा सकता है।


===मोड===
===मोड===
{{Main|Range mode query}}
{{Main|रेंज मोड क्वेरी}}


किसी सरणी A का [[मोड (सांख्यिकी)]] वह तत्व है जो A में सबसे अधिक दिखाई देता है। उदाहरण के लिए का मोड <math>A=[4,5,6,7,4]</math> है {{val|4}}. संबंधों के मामले में सबसे अधिक बार आने वाले तत्वों में से किसी को मोड के रूप में चुना जा सकता है। रेंज मोड क्वेरी में प्री-प्रोसेसिंग शामिल होती है <math>A[1,n]</math> जैसे कि हम किसी भी रेंज में मोड पा सकते हैं <math>A[1,n]</math>. इस समस्या को हल करने के लिए कई डेटा संरचनाएं तैयार की गई हैं, हम निम्नलिखित तालिका में कुछ परिणामों का सारांश प्रस्तुत करते हैं।<ref name=morin />
किसी सरणी A का [[मोड (सांख्यिकी)]] वह तत्व है जो A में सबसे अधिक दिखाई देता है। उदाहरण के लिए का मोड <math>A=[4,5,6,7,4]</math> है {{val|4}}. संबंधों के स्थिति में सबसे अधिक बार आने वाले तत्वों में से किसी को मोड के रूप में चुना जा सकता है। रेंज मोड क्वेरी में प्री-प्रोसेसिंग सम्मिलित होती है <math>A[1,n]</math> जैसे कि हम किसी भी रेंज में मोड पा सकते हैं <math>A[1,n]</math>. इस समस्या को हल करने के लिए कई डेटा संरचनाएं तैयार की गई हैं, हम निम्नलिखित तालिका में कुछ परिणामों का सारांश प्रस्तुत करते हैं।<ref name=morin />


{| class="wikitable"
{| class="wikitable"
|-
|-
|+ Range Mode Queries
|+ रेंज मोड क्वेरीज़
|-
|-
! Space || Query Time || Restrictions
! स्पेस || प्रश्नोत्तरी समय || प्रतिबंध
|-
|-
| <math>O(n^{2-2\epsilon})</math> ||<math> O(n^\epsilon \log n)</math> || <math>0\leq \epsilon\leq \frac 1 2</math>
| <math>O(n^{2-2\epsilon})</math> ||<math> O(n^\epsilon \log n)</math> || <math>0\leq \epsilon\leq \frac 1 2</math>
Line 38: Line 41:
|-
|-
|}
|}
हाल ही में जोर्गेनसेन एट अल। के सेल-जांच मॉडल पर निचली सीमा साबित हुई <math>\Omega\left(\tfrac{\log n}{\log (S w/n)}\right)</math> उपयोग करने वाली किसी भी डेटा संरचना के लिए {{mvar|S}} कोशिकाएं.<ref name=jorgensen>{{cite journal|last1=Greve|first1=M|last2=J{\o}rgensen|first2= A.|last3=Larsen|first3= K.|last4=Truelsen|first4= J.|title=रेंज मोड के लिए सेल जांच निचली सीमाएं और सन्निकटन|journal=Automata, Languages and Programming|year=2010|pages=605–616}}</ref>
वर्तमान में जोर्गेनसेन एट अल के सेल-जांच मॉडल पर निचली सीमा सिद्ध हुई <math>\Omega\left(\tfrac{\log n}{\log (S w/n)}\right)</math> उपयोग करने वाली किसी भी डेटा संरचना के लिए {{mvar|S}} कोशिकाएं प्रयोग की जाती है.<ref name=jorgensen>{{cite journal|last1=Greve|first1=M|last2=J{\o}rgensen|first2= A.|last3=Larsen|first3= K.|last4=Truelsen|first4= J.|title=रेंज मोड के लिए सेल जांच निचली सीमाएं और सन्निकटन|journal=Automata, Languages and Programming|year=2010|pages=605–616}}</ref>




===माध्यिका===
===माध्यिका===


यह विशेष मामला विशेष रुचि का है क्योंकि माध्यिका ज्ञात करने के कई अनुप्रयोग हैं।<ref name=heriel>{{cite journal|first1=Sariel|last1=Har-Peled|author1-link=Sariel Har-Peled|first2=S.|last2=Muthukrishnan|author2-link=S. Muthukrishnan (computer scientist)|title=रेंज माध्यिकाएँ|journal=ESA|year=2008|pages=503–514}}</ref> दूसरी ओर, माध्यिका समस्या, चयन समस्या का विशेष मामला, माध्यिका एल्गोरिथ्म का उपयोग करके O(n) में हल किया जा सकता है।<ref name=tarjanmedian>{{Cite journal | last1 = Blum | first1 = M. | authorlink1 = Manuel Blum| last2 = Floyd | first2 = R. W. | authorlink2 = Robert W. Floyd| last3 = Pratt | first3 = V. R. | authorlink3 = Vaughan Pratt| last4 = Rivest | first4 = R. L. | authorlink4 = Ron Rivest| last5 = Tarjan | first5 = R. E. | authorlink5 = Robert Tarjan | title = चयन के लिए समय सीमा| doi = 10.1016/S0022-0000(73)80033-9 | journal = Journal of Computer and System Sciences | volume = 7 | issue = 4  | pages = 448–461 | date =August 1973 | url = http://people.csail.mit.edu/rivest/pubs/BFPRT73.pdf| doi-access = free }}</ref> हालाँकि रेंज मीडियन प्रश्नों के माध्यम से इसका सामान्यीकरण हाल ही में हुआ है।<ref name=ethpaper />एक श्रेणी माध्यिका क्वेरी <math>\operatorname{median}(A,i,j)</math> जहां A,i और j के सामान्य अर्थ हैं, का मध्य तत्व लौटाता है <math>A[i,j]</math>. समान रूप से, <math>\operatorname{median}(A,i,j)</math> का तत्व वापस करना चाहिए <math>A[i,j]</math> रैंक का <math>\frac{j-i}{2}</math>. सेमीग्रुप ऑपरेटरों के लिए याओ के दृष्टिकोण सहित ऊपर चर्चा की गई किसी भी पिछली विधि का पालन करके रेंज मीडियन प्रश्नों को हल नहीं किया जा सकता है।<ref name="morin kranakis" />
यह विशेष मामला विशेष रुचि का है क्योंकि माध्यिका ज्ञात करने के कई अनुप्रयोग हैं।<ref name=heriel>{{cite journal|first1=Sariel|last1=Har-Peled|author1-link=Sariel Har-Peled|first2=S.|last2=Muthukrishnan|author2-link=S. Muthukrishnan (computer scientist)|title=रेंज माध्यिकाएँ|journal=ESA|year=2008|pages=503–514}}</ref> दूसरी ओर, माध्यिका समस्या, चयन समस्या का विशेष मामला, माध्यिका एल्गोरिथ्म का उपयोग करके O(n) में हल किया जा सकता है।<ref name=tarjanmedian>{{Cite journal | last1 = Blum | first1 = M. | authorlink1 = Manuel Blum| last2 = Floyd | first2 = R. W. | authorlink2 = Robert W. Floyd| last3 = Pratt | first3 = V. R. | authorlink3 = Vaughan Pratt| last4 = Rivest | first4 = R. L. | authorlink4 = Ron Rivest| last5 = Tarjan | first5 = R. E. | authorlink5 = Robert Tarjan | title = चयन के लिए समय सीमा| doi = 10.1016/S0022-0000(73)80033-9 | journal = Journal of Computer and System Sciences | volume = 7 | issue = 4  | pages = 448–461 | date =August 1973 | url = http://people.csail.mit.edu/rivest/pubs/BFPRT73.pdf| doi-access = free }}</ref> हालाँकि रेंज मीडियन प्रश्नों के माध्यम से इसका सामान्यीकरण वर्तमान में हुआ है।<ref name=ethpaper />एक श्रेणी माध्यिका क्वेरी <math>\operatorname{median}(A,i,j)</math> जहां A,i और j के सामान्य अर्थ हैं, का मध्य तत्व लौटाता है <math>A[i,j]</math>. समान रूप से, <math>\operatorname{median}(A,i,j)</math> का तत्व वापस करना चाहिए <math>A[i,j]</math> रैंक का <math>\frac{j-i}{2}</math>. सेमीग्रुप ऑपरेटरों के लिए याओ के दृष्टिकोण सहित ऊपर चर्चा की गई किसी भी पिछली विधि का पालन करके रेंज मीडियन प्रश्नों को हल नहीं किया जा सकता है।<ref name="morin kranakis" />


इस समस्या के दो प्रकारों का अध्ययन किया गया है, [[ऑफ़लाइन एल्गोरिदम]] संस्करण, जहां रुचि के सभी k प्रश्न बैच में दिए गए हैं, और संस्करण जहां सभी पूर्व-प्रसंस्करण पहले ही किया जाता है। ऑफ़लाइन संस्करण के साथ हल किया जा सकता है <math>O(n\log k + k \log n)</math> समय और <math>O(n\log k)</math> अंतरिक्ष।
इस समस्या के दो प्रकारों का अध्ययन किया गया है, [[ऑफ़लाइन एल्गोरिदम]] संस्करण, जहां रुचि के सभी k प्रश्न बैच में दिए गए हैं, और संस्करण जहां सभी पूर्व-प्रसंस्करण पहले ही किया जाता है। ऑफ़लाइन संस्करण के साथ हल किया जा सकता है <math>O(n\log k + k \log n)</math> समय और <math>O(n\log k)</math> अंतरिक्ष।
Line 65: Line 68:
  }
  }


प्रक्रिया {{code|rangeMedian}} विभाजन {{code|A}}, का उपयोग करना {{code|A}} का माध्यिका, दो सरणियों में {{code|A.low}} और {{code|A.high}}, जहां पूर्व शामिल है
प्रक्रिया {{code|rangeMedian}} विभाजन {{code|A}}, का उपयोग करना {{code|A}} का माध्यिका, दो सरणियों में {{code|A.low}} और {{code|A.high}}, जहां पूर्व सम्मिलित है
के तत्व {{code|A}} जो माध्यिका से कम या उसके बराबर हैं {{code|m}} और बाद वाले के बाकी तत्व {{code|A}}. यदि हम जानते हैं कि तत्वों की संख्या <math>A[i,j]</math> वह
के तत्व {{code|A}} जो माध्यिका से कम या उसके बराबर हैं {{code|m}} और बाद वाले के बाकी तत्व {{code|A}}. यदि हम जानते हैं कि तत्वों की संख्या <math>A[i,j]</math> वह
में खत्म {{code|A.low}} है {{code|t}} और यह संख्या इससे भी बड़ी है {{code|r}} तो हमें रैंक के तत्व की तलाश करते रहना चाहिए {{code|r}} में {{code|A.low}}; अन्यथा हमें रैंक के तत्व की तलाश करनी चाहिए <math>(r-t)</math> में {{code|A.high}}. ढूँढ़ने के लिए {{mvar|t}}, यह अधिकतम सूचकांक ज्ञात करने के लिए पर्याप्त है <math>m\leq i-1</math> ऐसा है कि <math>a_m</math> में है {{code|A.low}} और अधिकतम सूचकांक <math>l\leq j</math> ऐसा है कि <math>a_l</math>
में खत्म {{code|A.low}} है {{code|t}} और यह संख्या इससे भी बड़ी है {{code|r}} तो हमें रैंक के तत्व की तलाश करते रहना चाहिए {{code|r}} में {{code|A.low}}; अन्यथा हमें रैंक के तत्व की तलाश करनी चाहिए <math>(r-t)</math> में {{code|A.high}}. ढूँढ़ने के लिए {{mvar|t}}, यह अधिकतम सूचकांक ज्ञात करने के लिए पर्याप्त है <math>m\leq i-1</math> ऐसा है कि <math>a_m</math> में है {{code|A.low}} और अधिकतम सूचकांक <math>l\leq j</math> ऐसा है कि <math>a_l</math>
Line 73: Line 76:


===बहुमत===
===बहुमत===
किसी दिए गए आइटम सेट में लगातार तत्वों को ढूंढना डेटा माइनिंग में सबसे महत्वपूर्ण कार्यों में से है। जब अधिकांश वस्तुओं की आवृत्तियाँ समान हों तो बारंबार तत्वों को ढूँढना कठिन कार्य हो सकता है। इसलिए, यह अधिक फायदेमंद हो सकता है यदि ऐसी वस्तुओं का पता लगाने के लिए महत्व की कुछ सीमा का उपयोग किया जाए। किसी सरणी के अधिकांश भाग को खोजने के लिए सबसे प्रसिद्ध एल्गोरिदम में से बॉयर और मूर द्वारा प्रस्तावित किया गया था <ref>{{Citation|last1=Boyer|first1=Robert S.|title=MJRTY—A Fast Majority Vote Algorithm|date=1991|url=http://dx.doi.org/10.1007/978-94-011-3488-0_5|pages=105–117|place=Dordrecht|publisher=Springer Netherlands|access-date=2021-12-18|last2=Moore|first2=J. Strother|series=Automated Reasoning Series |volume=1 |doi=10.1007/978-94-011-3488-0_5 |isbn=978-94-010-5542-0 }}</ref> जिसे बॉयर-मूर बहुमत वोट एल्गोरिदम के रूप में भी जाना जाता है। बॉयर और मूर ने स्ट्रिंग के अधिकांश तत्व (यदि इसमें है) को खोजने के लिए एल्गोरिदम प्रस्तावित किया <math>O(n)</math> समय और उपयोग  <math>O(1)</math> अंतरिक्ष। बॉयर और मूर के काम के संदर्भ में और आम तौर पर बोलते हुए, वस्तुओं के सेट में बहुसंख्यक तत्व (उदाहरण के लिए स्ट्रिंग या सरणी) वह होता है जिसके उदाहरणों की संख्या उस सेट के आकार के आधे से अधिक होती है। कुछ साल बाद, मिश्रा और ग्रिज़ <ref>{{Cite journal|last1=Misra|first1=J.|last2=Gries|first2=David|date=November 1982|title=दोहराए गए तत्वों को ढूँढना|url=http://dx.doi.org/10.1016/0167-6423(82)90012-0|journal=Science of Computer Programming|volume=2|issue=2|pages=143–152|doi=10.1016/0167-6423(82)90012-0|issn=0167-6423|doi-access=free}}</ref> बॉयर और मूर के एल्गोरिदम का अधिक सामान्य संस्करण प्रस्तावित किया <math>O \left ( n \log \left ( \frac{1}{\tau} \right ) \right )</math> किसी सारणी में सभी वस्तुओं को खोजने के लिए तुलना जिनकी सापेक्ष आवृत्तियाँ कुछ सीमा से अधिक हैं <math>0<\tau<1</math>. दायरा <math>\tau</math>-अधिकांश क्वेरी वह होती है, जिसमें डेटा संरचना (उदाहरण के लिए सरणी) के आकार की उपश्रेणी दी जाती है <math>|R|</math>, उन सभी अलग-अलग आइटमों का सेट लौटाता है जो (या कुछ प्रकाशनों में इसके बराबर) से अधिक दिखाई देते हैं <math>\tau |R|</math> उस दी गई सीमा में कई बार. विभिन्न संरचनाओं में जो रेंज का समर्थन करते हैं <math>\tau</math>-अधिकांश प्रश्न, <math>\tau </math> या तो स्थिर हो सकता है (पूर्व-प्रसंस्करण के दौरान निर्दिष्ट) या गतिशील (क्वेरी समय पर निर्दिष्ट)। ऐसे कई दृष्टिकोण इस तथ्य पर आधारित हैं कि, किसी दिए गए दायरे के आकार की परवाह किए बिना <math>\tau</math> ज्यादा से ज्यादा हो सकता है <math>O(1/\tau)</math> कम से कम सापेक्ष आवृत्तियों वाले विशिष्ट उम्मीदवार <math>\tau</math>. इनमें से प्रत्येक उम्मीदवार का निरंतर समय में सत्यापन करके,  <math>O(1/\tau)</math> क्वेरी का समय प्राप्त हो गया है. दायरा <math>\tau</math>-अधिकांश क्वेरी विघटित करने योग्य है <ref name=":1">{{Cite book|author=Karpiński, Marek|url=http://worldcat.org/oclc/277046650|title=आयतों में बारंबार रंगों की खोज|oclc=277046650}}</ref> इस अर्थ में कि ए <math>\tau</math>-एक सीमा में बहुमत <math>R</math> विभाजन के साथ <math>R_1</math> और <math>R_2</math> होना चाहिए <math>\tau</math>-दोनों में बहुमत <math>R_1</math>या <math>R_2</math>. इस विघटनशीलता के कारण, कुछ डेटा संरचनाएँ उत्तर देती हैं <math>\tau</math>- [[रेंज वृक्ष]] में क्वेरी रेंज के अंतिम बिंदुओं के निम्नतम सामान्य पूर्वज (एलसीए) को ढूंढकर और उम्मीदवारों के दो सेट (आकार के) को मान्य करके एक-आयामी सरणियों पर अधिकांश प्रश्न <math>O(1/\tau)</math>) प्रत्येक समापन बिंदु से निम्नतम सामान्य पूर्वज तक निरंतर समय के परिणामस्वरूप <math>O(1/\tau)</math> पूछताछ का समय.
किसी दिए गए आइटम सेट में लगातार तत्वों को ढूंढना डेटा माइनिंग में सबसे महत्वपूर्ण कार्यों में से है। जब अधिकांश वस्तुओं की आवृत्तियाँ समान हों तो बारंबार तत्वों को ढूँढना कठिन कार्य हो सकता है। इसलिए, यह अधिक फायदेमंद हो सकता है यदि ऐसी वस्तुओं का पता लगाने के लिए महत्व की कुछ सीमा का उपयोग किया जाए। किसी सरणी के अधिकांश भाग को खोजने के लिए सबसे प्रसिद्ध एल्गोरिदम में से बॉयर और मूर द्वारा प्रस्तावित किया गया था <ref>{{Citation|last1=Boyer|first1=Robert S.|title=MJRTY—A Fast Majority Vote Algorithm|date=1991|url=http://dx.doi.org/10.1007/978-94-011-3488-0_5|pages=105–117|place=Dordrecht|publisher=Springer Netherlands|access-date=2021-12-18|last2=Moore|first2=J. Strother|series=Automated Reasoning Series |volume=1 |doi=10.1007/978-94-011-3488-0_5 |isbn=978-94-010-5542-0 }}</ref> जिसे बॉयर-मूर बहुमत वोट एल्गोरिदम के रूप में भी जाना जाता है। बॉयर और मूर ने स्ट्रिंग के अधिकांश तत्व (यदि इसमें है) को खोजने के लिए एल्गोरिदम प्रस्तावित किया <math>O(n)</math> समय और उपयोग  <math>O(1)</math> अंतरिक्ष। बॉयर और मूर के काम के संदर्भ में और आम तौर पर बोलते हुए, वस्तुओं के सेट में बहुसंख्यक तत्व (उदाहरण के लिए स्ट्रिंग या सरणी) वह होता है जिसके उदाहरणों की संख्या उस सेट के आकार के आधे से अधिक होती है। कुछ साल बाद, मिश्रा और ग्रिज़ <ref>{{Cite journal|last1=Misra|first1=J.|last2=Gries|first2=David|date=November 1982|title=दोहराए गए तत्वों को ढूँढना|url=http://dx.doi.org/10.1016/0167-6423(82)90012-0|journal=Science of Computer Programming|volume=2|issue=2|pages=143–152|doi=10.1016/0167-6423(82)90012-0|issn=0167-6423|doi-access=free}}</ref> बॉयर और मूर के एल्गोरिदम का अधिक सामान्य संस्करण प्रस्तावित किया <math>O \left ( n \log \left ( \frac{1}{\tau} \right ) \right )</math> किसी सारणी में सभी वस्तुओं को खोजने के लिए तुलना जिनकी सापेक्ष आवृत्तियाँ कुछ सीमा से अधिक हैं <math>0<\tau<1</math>. दायरा <math>\tau</math>-अधिकांश क्वेरी वह होती है, जिसमें डेटा संरचना (उदाहरण के लिए सरणी) के आकार की उपश्रेणी दी जाती है <math>|R|</math>, उन सभी अलग-अलग आइटमों का सेट लौटाता है जो (या कुछ प्रकाशनों में इसके बराबर) से अधिक दिखाई देते हैं <math>\tau |R|</math> उस दी गई सीमा में कई बार. विभिन्न संरचनाओं में जो रेंज का समर्थन करते हैं <math>\tau</math>-अधिकांश प्रश्न, <math>\tau </math> या तो स्थिर हो सकता है (पूर्व-प्रसंस्करण के दौरान निर्दिष्ट) या गतिशील (क्वेरी समय पर निर्दिष्ट)। ऐसे कई दृष्टिकोण इस तथ्य पर आधारित हैं कि, किसी दिए गए दायरे के आकार की परवाह किए बिना <math>\tau</math> ज्यादा से ज्यादा हो सकता है <math>O(1/\tau)</math> कम से कम सापेक्ष आवृत्तियों वाले विशिष्ट उम्मीदवार <math>\tau</math>. इनमें से प्रत्येक उम्मीदवार का निरंतर समय में सत्यापन करके,  <math>O(1/\tau)</math> क्वेरी का समय प्राप्त हो गया है. दायरा <math>\tau</math>-अधिकांश क्वेरी विघटित करने योग्य है <ref name=":1">{{Cite book|author=Karpiński, Marek|url=http://worldcat.org/oclc/277046650|title=आयतों में बारंबार रंगों की खोज|oclc=277046650}}</ref> इस अर्थ में कि ए <math>\tau</math>-एक सीमा में बहुमत <math>R</math> विभाजन के साथ <math>R_1</math> और <math>R_2</math> होना चाहिए <math>\tau</math>-दोनों में बहुमत <math>R_1</math>या <math>R_2</math>. इस विघटनशीलता के कारण, कुछ डेटा संरचनाएँ उत्तर देती हैं <math>\tau</math>- [[रेंज वृक्ष]] में क्वेरी रेंज के अंतिम बिंदुओं के निम्नतम सामान्य प्राचीन (एलसीए) को ढूंढकर और उम्मीदवारों के दो सेट (आकार के) को मान्य करके एक-आयामी सरणियों पर अधिकांश प्रश्न <math>O(1/\tau)</math>) प्रत्येक समापन बिंदु से निम्नतम सामान्य प्राचीन तक निरंतर समय के परिणामस्वरूप <math>O(1/\tau)</math> पूछताछ का समय.


==== द्वि-आयामी सरणियाँ ====
==== द्वि-आयामी सरणियाँ ====
गैगी एट अल.<ref>{{Citation|last1=Gagie|first1=Travis|title=Finding Frequent Elements in Compressed 2D Arrays and Strings|date=2011|url=http://dx.doi.org/10.1007/978-3-642-24583-1_29|work=String Processing and Information Retrieval|pages=295–300|place=Berlin, Heidelberg|publisher=Springer Berlin Heidelberg|isbn=978-3-642-24582-4|access-date=2021-12-18|last2=He|first2=Meng|last3=Munro|first3=J. Ian|last4=Nicholson|first4=Patrick K.|doi=10.1007/978-3-642-24583-1_29 }}</ref> डेटा संरचना प्रस्तावित की जो रेंज का समर्थन करती है <math>\tau</math>-अधिकांश प्रश्न पर  <math>m\times n</math> सरणी <math>A</math>. प्रत्येक प्रश्न के लिए <math>\operatorname{Q}=(\operatorname{R}, \tau)</math> इस डेटा संरचना में सीमा है <math>0<\tau<1</math> और आयताकार श्रेणी <math>\operatorname{R}</math> निर्दिष्ट हैं, और उन सभी तत्वों का सेट जिनकी सापेक्ष आवृत्तियाँ (उस आयताकार सीमा के अंदर) से अधिक या उसके बराबर हैं <math>\tau</math> आउटपुट के रूप में लौटाए जाते हैं। यह डेटा संरचना गतिशील थ्रेशोल्ड (क्वेरी समय पर निर्दिष्ट) और प्री-प्रोसेसिंग थ्रेशोल्ड का समर्थन करती है <math>\alpha</math> जिसके आधार पर इसका निर्माण किया गया है। पूर्व-प्रसंस्करण के दौरान, ऊर्ध्वाधर और क्षैतिज अंतराल का सेट बनाया जाता है <math>m \times n</math> सरणी. ऊर्ध्वाधर और क्षैतिज अंतराल मिलकर ब्लॉक बनाते हैं। प्रत्येक ब्लॉक अपने से नौ गुना बड़े सुपरब्लॉक का हिस्सा है (ब्लॉक के क्षैतिज अंतराल के आकार का तीन गुना और इसके ऊर्ध्वाधर के आकार का तीन गुना)। प्रत्येक ब्लॉक के लिए उम्मीदवारों का सेट (साथ) <math>\frac{9}{\alpha}</math> अधिक से अधिक तत्व) संग्रहित किया जाता है जिसमें कम से कम सापेक्ष आवृत्तियों वाले तत्व शामिल होते हैं <math>\frac{\alpha}{9}</math> (पूर्व-प्रसंस्करण सीमा जैसा कि ऊपर बताया गया है) अपने संबंधित सुपरब्लॉक में। इन तत्वों को उनकी आवृत्तियों के अनुसार गैर-बढ़ते क्रम में संग्रहीत किया जाता है और यह देखना आसान है कि, कोई भी तत्व जिसकी कम से कम सापेक्ष आवृत्ति होती है <math>\alpha</math> किसी ब्लॉक में उसके उम्मीदवारों का समूह उपस्थित होना चाहिए। प्रत्येक <math>\tau</math>-अधिकांश क्वेरी का उत्तर सबसे पहले क्वेरी ब्लॉक, या दिए गए क्वेरी आयत में शामिल सबसे बड़े ब्लॉक को ढूंढकर दिया जाता है <math>O(1)</math> समय। प्राप्त क्वेरी ब्लॉक के लिए, पहला <math>\frac{9}{\tau}</math> अभ्यर्थियों को (सत्यापित किए बिना) लौटा दिया जाता है <math>O(1/\tau)</math> समय, इसलिए यह प्रक्रिया कुछ ग़लत सकारात्मक परिणाम दे सकती है। कई अन्य डेटा संरचनाओं (जैसा कि नीचे चर्चा की गई है) ने प्रत्येक उम्मीदवार को निरंतर समय में सत्यापित करने और इस प्रकार बनाए रखने के तरीकों का प्रस्ताव दिया है <math>O(1/\tau)</math> कोई गलत सकारात्मकता न लौटाते हुए क्वेरी का समय। वे मामले जिनमें क्वेरी ब्लॉक छोटा है <math>1/\alpha</math> भण्डारण द्वारा किया जाता है <math>\log \left ( \frac{1}{\alpha} \right )</math> निम्नलिखित प्रपत्र की इस डेटा संरचना के विभिन्न उदाहरण:
गैगी एट अल.<ref>{{Citation|last1=Gagie|first1=Travis|title=Finding Frequent Elements in Compressed 2D Arrays and Strings|date=2011|url=http://dx.doi.org/10.1007/978-3-642-24583-1_29|work=String Processing and Information Retrieval|pages=295–300|place=Berlin, Heidelberg|publisher=Springer Berlin Heidelberg|isbn=978-3-642-24582-4|access-date=2021-12-18|last2=He|first2=Meng|last3=Munro|first3=J. Ian|last4=Nicholson|first4=Patrick K.|doi=10.1007/978-3-642-24583-1_29 }}</ref> डेटा संरचना प्रस्तावित की जो रेंज का समर्थन करती है <math>\tau</math>-अधिकांश प्रश्न पर  <math>m\times n</math> सरणी <math>A</math>. प्रत्येक प्रश्न के लिए <math>\operatorname{Q}=(\operatorname{R}, \tau)</math> इस डेटा संरचना में सीमा है <math>0<\tau<1</math> और आयताकार श्रेणी <math>\operatorname{R}</math> निर्दिष्ट हैं, और उन सभी तत्वों का सेट जिनकी सापेक्ष आवृत्तियाँ (उस आयताकार सीमा के अंदर) से अधिक या उसके बराबर हैं <math>\tau</math> आउटपुट के रूप में लौटाए जाते हैं। यह डेटा संरचना गतिशील थ्रेशोल्ड (क्वेरी समय पर निर्दिष्ट) और प्री-प्रोसेसिंग थ्रेशोल्ड का समर्थन करती है <math>\alpha</math> जिसके आधार पर इसका निर्माण किया गया है। पूर्व-प्रसंस्करण के दौरान, ऊर्ध्वाधर और क्षैतिज अंतराल का सेट बनाया जाता है <math>m \times n</math> सरणी. ऊर्ध्वाधर और क्षैतिज अंतराल मिलकर ब्लॉक बनाते हैं। प्रत्येक ब्लॉक अपने से नौ गुना बड़े सुपरब्लॉक का हिस्सा है (ब्लॉक के क्षैतिज अंतराल के आकार का तीन गुना और इसके ऊर्ध्वाधर के आकार का तीन गुना)। प्रत्येक ब्लॉक के लिए उम्मीदवारों का सेट (साथ) <math>\frac{9}{\alpha}</math> अधिक से अधिक तत्व) संग्रहित किया जाता है जिसमें कम से कम सापेक्ष आवृत्तियों वाले तत्व सम्मिलित होते हैं <math>\frac{\alpha}{9}</math> (पूर्व-प्रसंस्करण सीमा जैसा कि ऊपर बताया गया है) अपने संबंधित सुपरब्लॉक में। इन तत्वों को उनकी आवृत्तियों के अनुसार गैर-बढ़ते क्रम में संग्रहीत किया जाता है और यह देखना आसान है कि, कोई भी तत्व जिसकी कम से कम सापेक्ष आवृत्ति होती है <math>\alpha</math> किसी ब्लॉक में उसके उम्मीदवारों का समूह उपस्थित होना चाहिए। प्रत्येक <math>\tau</math>-अधिकांश क्वेरी का उत्तर सबसे पहले क्वेरी ब्लॉक, या दिए गए क्वेरी आयत में सम्मिलित सबसे बड़े ब्लॉक को ढूंढकर दिया जाता है <math>O(1)</math> समय। प्राप्त क्वेरी ब्लॉक के लिए, पहला <math>\frac{9}{\tau}</math> अभ्यर्थियों को (सत्यापित किए बिना) लौटा दिया जाता है <math>O(1/\tau)</math> समय, इसलिए यह प्रक्रिया कुछ ग़लत सकारात्मक परिणाम दे सकती है। कई अन्य डेटा संरचनाओं (जैसा कि नीचे चर्चा की गई है) ने प्रत्येक उम्मीदवार को निरंतर समय में सत्यापित करने और इस प्रकार बनाए रखने के तरीकों का प्रस्ताव दिया है <math>O(1/\tau)</math> कोई गलत सकारात्मकता न लौटाते हुए क्वेरी का समय। वे स्थिति जिनमें क्वेरी ब्लॉक छोटा है <math>1/\alpha</math> भण्डारण द्वारा किया जाता है <math>\log \left ( \frac{1}{\alpha} \right )</math> निम्नलिखित प्रपत्र की इस डेटा संरचना के विभिन्न उदाहरण:


<math>\beta=2^{-i}, \;\; i\in \left \{ 1,\dots,\log \left (\frac{1}{\alpha} \right ) \right \}
<math>\beta=2^{-i}, \;\; i\in \left \{ 1,\dots,\log \left (\frac{1}{\alpha} \right ) \right \}
</math>
</math>
कहाँ <math>\beta</math> की प्री-प्रोसेसिंग सीमा है <math>i</math>-वाँ उदाहरण. इस प्रकार, क्वेरी ब्लॉक से छोटे के लिए <math>1/\alpha</math>  <math>\lceil\log (1 / \tau)\rceil</math>-वें उदाहरण पर सवाल उठाया गया है। जैसा कि ऊपर बताया गया है, इस डेटा संरचना में क्वेरी समय है  <math>O(1/\tau)</math> और आवश्यकता है <math>O \left ( m n(H+1) \log^2 \left ( \frac{1}{\alpha} \right ) \right )</math> हफ़मैन-एन्कोडेड प्रतिलिपि को संग्रहीत करके अंतरिक्ष के टुकड़े (ध्यान दें)। <math>\log(\frac{1}{\alpha})</math> फ़ैक्टर और [[हफ़मैन कोडिंग]] भी देखें)।
जहाँ <math>\beta</math> की प्री-प्रोसेसिंग सीमा है <math>i</math>-वाँ उदाहरण. इस प्रकार, क्वेरी ब्लॉक से छोटे के लिए <math>1/\alpha</math>  <math>\lceil\log (1 / \tau)\rceil</math>-वें उदाहरण पर सवाल उठाया गया है। जैसा कि ऊपर बताया गया है, इस डेटा संरचना में क्वेरी समय है  <math>O(1/\tau)</math> और आवश्यकता है <math>O \left ( m n(H+1) \log^2 \left ( \frac{1}{\alpha} \right ) \right )</math> हफ़मैन-एन्कोडेड प्रतिलिपि को संग्रहीत करके अंतरिक्ष के टुकड़े (ध्यान दें)। <math>\log(\frac{1}{\alpha})</math> फ़ैक्टर और [[हफ़मैन कोडिंग]] भी देखें)।


==== एक-आयामी सरणियाँ ====
==== एक-आयामी सरणियाँ ====
चान एट अल.<ref name=":0">{{Citation|last1=Chan|first1=Timothy M.|title=Linear-Space Data Structures for Range Minority Query in Arrays|date=2012|url=http://dx.doi.org/10.1007/978-3-642-31155-0_26|work=Algorithm Theory – SWAT 2012|pages=295–306|place=Berlin, Heidelberg|publisher=Springer Berlin Heidelberg|isbn=978-3-642-31154-3|access-date=2021-12-20|last2=Durocher|first2=Stephane|last3=Skala|first3=Matthew|last4=Wilkinson|first4=Bryan T.|doi=10.1007/978-3-642-31155-0_26 }}</ref> डेटा संरचना का प्रस्ताव रखा जिसने आयामी सरणी दी<math>A</math>, उपश्रेणी <math>R</math> का <math>A</math> (क्वेरी समय पर निर्दिष्ट) और सीमा <math>\tau</math> (क्वेरी समय पर निर्दिष्ट), सभी की सूची वापस करने में सक्षम है <math>\tau</math>-में बहुमत <math>O(1/\tau)</math> समय की आवश्यकता है <math>O(n \log n)</math> अंतरिक्ष के शब्द. ऐसे प्रश्नों का उत्तर देने के लिए, चैन एट अल।<ref name=":0" />यह ध्यान देकर प्रारंभ करें कि डेटा संरचना मौजूद है जो किसी श्रेणी में शीर्ष-के सबसे अधिक बार आने वाली वस्तुओं को वापस करने में सक्षम है <math>O(k)</math> समय की आवश्यकता है <math>O(n)</math> अंतरिक्ष के शब्द. एक-आयामी सरणी के लिए <math>A[0,..,n-1]</math>, तरफा टॉप-के रेंज क्वेरी को फॉर्म का होने दें <math>A[0..i] \text { for } 0 \leq i \leq n-1</math>. श्रेणियों की अधिकतम सीमा के लिए <math>A[0..i] \text { through } A[0..j]</math> जिसमें विशिष्ट तत्व की आवृत्ति होती है <math>e</math> में <math>A</math> अपरिवर्तित रहता है (और बराबर होता है <math>f</math>), क्षैतिज रेखा खंड का निर्माण किया जाता है। <math>x</math>वें>-इस रेखाखंड का अंतराल से मेल खाता है <math>[i,j]</math> और इसमें है <math>y</math>-मूल्य के बराबर <math>f</math>. प्रत्येक तत्व को जोड़ने के बाद से <math>A</math> ठीक विशिष्ट तत्व की आवृत्ति को बदलता है, उपरोक्त प्रक्रिया बनाता है <math>O(n)</math> रेखा खंड। इसके अलावा, ऊर्ध्वाधर रेखा के लिए <math>x=i</math> इसे प्रतिच्छेद करने वाले सभी क्षैतिज रेखाखंडों को उनकी आवृत्तियों के अनुसार क्रमबद्ध किया जाता है। ध्यान दें कि, प्रत्येक क्षैतिज रेखा खंड के साथ <math>x</math>-मध्यान्तर <math>[\ell,r]</math> बिल्कुल विशिष्ट तत्व से मेल खाता है <math>e</math> में <math>A</math>, ऐसा है कि <math>A[\ell]=e</math>. टॉप-के क्वेरी का उत्तर ऊर्ध्वाधर किरण को शूट करके दिया जा सकता है <math>x=i</math> और सबसे पहले रिपोर्टिंग <math>k</math> क्षैतिज रेखा खंड जो इसे प्रतिच्छेद करते हैं (ऊपर से याद रखें कि ये रेखा रेखा खंड पहले से ही उनकी आवृत्तियों के अनुसार क्रमबद्ध हैं) <math>O(k)</math> समय।
चान एट अल.<ref name=":0">{{Citation|last1=Chan|first1=Timothy M.|title=Linear-Space Data Structures for Range Minority Query in Arrays|date=2012|url=http://dx.doi.org/10.1007/978-3-642-31155-0_26|work=Algorithm Theory – SWAT 2012|pages=295–306|place=Berlin, Heidelberg|publisher=Springer Berlin Heidelberg|isbn=978-3-642-31154-3|access-date=2021-12-20|last2=Durocher|first2=Stephane|last3=Skala|first3=Matthew|last4=Wilkinson|first4=Bryan T.|doi=10.1007/978-3-642-31155-0_26 }}</ref> डेटा संरचना का प्रस्ताव रखा जिसने आयामी सरणी दी<math>A</math>, उपश्रेणी <math>R</math> का <math>A</math> (क्वेरी समय पर निर्दिष्ट) और सीमा <math>\tau</math> (क्वेरी समय पर निर्दिष्ट), सभी की सूची वापस करने में सक्षम है <math>\tau</math>-में बहुमत <math>O(1/\tau)</math> समय की आवश्यकता है <math>O(n \log n)</math> अंतरिक्ष के शब्द. ऐसे प्रश्नों का उत्तर देने के लिए, चैन एट अल।<ref name=":0" />यह ध्यान देकर प्रारंभ करें कि डेटा संरचना उपस्थित है जो किसी श्रेणी में शीर्ष-के सबसे अधिक बार आने वाली वस्तुओं को वापस करने में सक्षम है <math>O(k)</math> समय की आवश्यकता है <math>O(n)</math> अंतरिक्ष के शब्द. एक-आयामी सरणी के लिए <math>A[0,..,n-1]</math>, तरफा टॉप-के रेंज क्वेरी को फॉर्म का होने दें <math>A[0..i] \text { for } 0 \leq i \leq n-1</math>. श्रेणियों की अधिकतम सीमा के लिए <math>A[0..i] \text { through } A[0..j]</math> जिसमें विशिष्ट तत्व की आवृत्ति होती है <math>e</math> में <math>A</math> अपरिवर्तित रहता है (और बराबर होता है <math>f</math>), क्षैतिज रेखा खंड का निर्माण किया जाता है। <math>x</math>वें>-इस रेखाखंड का अंतराल से मेल खाता है <math>[i,j]</math> और इसमें है <math>y</math>-मूल्य के बराबर <math>f</math>. प्रत्येक तत्व को जोड़ने के बाद से <math>A</math> ठीक विशिष्ट तत्व की आवृत्ति को बदलता है, उपरोक्त प्रक्रिया बनाता है <math>O(n)</math> रेखा खंड। इसके अलावा, ऊर्ध्वाधर रेखा के लिए <math>x=i</math> इसे प्रतिच्छेद करने वाले सभी क्षैतिज रेखाखंडों को उनकी आवृत्तियों के अनुसार क्रमबद्ध किया जाता है। ध्यान दें कि, प्रत्येक क्षैतिज रेखा खंड के साथ <math>x</math>-मध्यान्तर <math>[\ell,r]</math> बिल्कुल विशिष्ट तत्व से मेल खाता है <math>e</math> में <math>A</math>, ऐसा है कि <math>A[\ell]=e</math>. टॉप-के क्वेरी का उत्तर ऊर्ध्वाधर किरण को शूट करके दिया जा सकता है <math>x=i</math> और सबसे पहले रिपोर्टिंग <math>k</math> क्षैतिज रेखा खंड जो इसे प्रतिच्छेद करते हैं (ऊपर से याद रखें कि ये रेखा रेखा खंड पहले से ही उनकी आवृत्तियों के अनुसार क्रमबद्ध हैं) <math>O(k)</math> समय।


चान एट अल.<ref name=":0" />सबसे पहले रेंज ट्री का निर्माण करें जिसमें प्रत्येक ब्रांचिंग नोड तरफा रेंज टॉप-के प्रश्नों के लिए ऊपर वर्णित डेटा संरचना की प्रति संग्रहीत करता है और प्रत्येक पत्ता तत्व का प्रतिनिधित्व करता है <math>A</math>. प्रत्येक नोड पर टॉप-के डेटा संरचना का निर्माण उस नोड के उप-वृक्षों में मौजूद मूल्यों के आधार पर किया जाता है और इसका उद्देश्य एकतरफा रेंज टॉप-के प्रश्नों का उत्तर देना है। कृपया ध्यान दें कि एक-आयामी सरणी के लिए <math>A</math>, रेंज ट्री को विभाजित करके बनाया जा सकता है <math>A</math> दो हिस्सों में और दोनों हिस्सों पर पुनरावृत्ति; इसलिए, परिणामी रेंज ट्री का प्रत्येक नोड रेंज का प्रतिनिधित्व करता है। यह भी देखा जा सकता है कि इस श्रेणी के पेड़ की आवश्यकता है <math>O(n \log n)</math> अंतरिक्ष के शब्द, क्योंकि वहाँ हैं <math>O(\log n)</math> स्तर और प्रत्येक स्तर <math>\ell</math> है <math>2^{\ell}</math> नोड्स. इसके अलावा, चूँकि प्रत्येक स्तर पर <math>\ell</math> रेंज ट्री के सभी नोड्स का कुल योग होता है <math>n</math> घटक <math>A</math> उनके उपवृक्षों पर और चूँकि वहाँ हैं <math>O(\log n)</math> स्तरों, इस रेंज ट्री की अंतरिक्ष जटिलता है <math>O(n \log n)</math>.
चान एट अल.<ref name=":0" />सबसे पहले रेंज ट्री का निर्माण करें जिसमें प्रत्येक ब्रांचिंग नोड तरफा रेंज टॉप-के प्रश्नों के लिए ऊपर वर्णित डेटा संरचना की प्रति संग्रहीत करता है और प्रत्येक पत्ता तत्व का प्रतिनिधित्व करता है <math>A</math>. प्रत्येक नोड पर टॉप-के डेटा संरचना का निर्माण उस नोड के उप-वृक्षों में उपस्थित मूल्यों के आधार पर किया जाता है और इसका उद्देश्य एकतरफा रेंज टॉप-के प्रश्नों का उत्तर देना है। कृपया ध्यान दें कि एक-आयामी सरणी के लिए <math>A</math>, रेंज ट्री को विभाजित करके बनाया जा सकता है <math>A</math> दो हिस्सों में और दोनों हिस्सों पर पुनरावृत्ति; इसलिए, परिणामी रेंज ट्री का प्रत्येक नोड रेंज का प्रतिनिधित्व करता है। यह भी देखा जा सकता है कि इस श्रेणी के पेड़ की आवश्यकता है <math>O(n \log n)</math> अंतरिक्ष के शब्द, क्योंकि वहाँ हैं <math>O(\log n)</math> स्तर और प्रत्येक स्तर <math>\ell</math> है <math>2^{\ell}</math> नोड्स. इसके अलावा, चूँकि प्रत्येक स्तर पर <math>\ell</math> रेंज ट्री के सभी नोड्स का कुल योग होता है <math>n</math> घटक <math>A</math> उनके उपवृक्षों पर और चूँकि वहाँ हैं <math>O(\log n)</math> स्तरों, इस रेंज ट्री की अंतरिक्ष जटिलता है <math>O(n \log n)</math>.


इस संरचना का उपयोग करते हुए, श्रेणी <math>\tau</math>-बहुमत प्रश्न <math>A[i..j]</math> पर <math>A[0..n-1]</math> साथ <math>0\leq i\leq  j \leq n</math> इसका उत्तर इस प्रकार दिया गया है। सबसे पहले, पत्ती नोड्स का निम्नतम सामान्य पूर्वज (LCA)। <math>i</math> और <math>j</math> स्थिर समय में पाया जाता है. ध्यान दें कि आवश्यक डेटा संरचना मौजूद है <math>O(n)</math> अंतरिक्ष के टुकड़े जो एलसीए प्रश्नों का उत्तर देने में सक्षम हैं <math>O(1)</math> समय।<ref>{{Cite journal|last1=Sadakane|first1=Kunihiko|last2=Navarro|first2=Gonzalo|date=2010-01-17|title=पूरी तरह कार्यात्मक संक्षिप्त पेड़|url=http://dx.doi.org/10.1137/1.9781611973075.13|journal=Proceedings of the Twenty-First Annual ACM-SIAM Symposium on Discrete Algorithms|pages=134–149 |location=Philadelphia, PA|publisher=Society for Industrial and Applied Mathematics|doi=10.1137/1.9781611973075.13|isbn=978-0-89871-701-3 |s2cid=3189222 |doi-access=free}}</ref> होने देना <math>z</math> के एलसीए को निरूपित करें <math>i </math> और <math>j</math>, का उपयोग करना <math>z</math> और सीमा की विघटनशीलता के अनुसार <math>\tau</math>-अधिकांश प्रश्न (जैसा कि ऊपर और अंदर वर्णित है)। <ref name=":1" />), दो तरफा रेंज क्वेरी <math>A[i..j]</math> दो एकतरफ़ा रेंज टॉप-के क्वेरीज़ (से) में परिवर्तित किया जा सकता है <math>z</math> को <math>i</math> और <math>j</math>). ये दो एकतरफ़ा रेंज टॉप-के क्वेरीज़ टॉप-( लौटाती हैं<math>1/\tau</math>) प्रत्येक संबंधित श्रेणी में सबसे अधिक बार आने वाले तत्व <math>O(1/\tau)</math> समय। ये सामान्य तत्व उम्मीदवारों के समूह का निर्माण करते हैं <math>\tau</math>-में बहुमत <math>A[i..j]</math> जिसमें हैं <math>O(1/\tau)</math> उम्मीदवार जिनमें से कुछ गलत सकारात्मक हो सकते हैं। फिर प्रत्येक उम्मीदवार का रैखिक-अंतरिक्ष डेटा संरचना (जैसा कि लेम्मा 3 में वर्णित है) का उपयोग करके निरंतर समय में मूल्यांकन किया जाता है <ref>{{Cite journal|last1=Chan|first1=Timothy M.|last2=Durocher|first2=Stephane|last3=Larsen|first3=Kasper Green|last4=Morrison|first4=Jason|last5=Wilkinson|first5=Bryan T.|date=2013-03-08|title=एरेज़ में रेंज मोड क्वेरी के लिए रैखिक-स्पेस डेटा संरचनाएं|url=http://dx.doi.org/10.1007/s00224-013-9455-2|journal=Theory of Computing Systems|volume=55|issue=4|pages=719–741|doi=10.1007/s00224-013-9455-2|s2cid=253747004 |issn=1432-4350}}</ref>) जो निर्धारित करने में सक्षम है  <math>O(1)</math> समय चाहे किसी सरणी की दी गई उपश्रेणी हो या नहीं <math>A</math> कम से कम शामिल है <math>q</math> किसी विशेष तत्व के उदाहरण <math>e</math>.
इस संरचना का उपयोग करते हुए, श्रेणी <math>\tau</math>-बहुमत प्रश्न <math>A[i..j]</math> पर <math>A[0..n-1]</math> साथ <math>0\leq i\leq  j \leq n</math> इसका उत्तर इस प्रकार दिया गया है। सबसे पहले, पत्ती नोड्स का निम्नतम सामान्य प्राचीन (LCA)। <math>i</math> और <math>j</math> स्थिर समय में पाया जाता है. ध्यान दें कि आवश्यक डेटा संरचना उपस्थित है <math>O(n)</math> अंतरिक्ष के टुकड़े जो एलसीए प्रश्नों का उत्तर देने में सक्षम हैं <math>O(1)</math> समय।<ref>{{Cite journal|last1=Sadakane|first1=Kunihiko|last2=Navarro|first2=Gonzalo|date=2010-01-17|title=पूरी तरह कार्यात्मक संक्षिप्त पेड़|url=http://dx.doi.org/10.1137/1.9781611973075.13|journal=Proceedings of the Twenty-First Annual ACM-SIAM Symposium on Discrete Algorithms|pages=134–149 |location=Philadelphia, PA|publisher=Society for Industrial and Applied Mathematics|doi=10.1137/1.9781611973075.13|isbn=978-0-89871-701-3 |s2cid=3189222 |doi-access=free}}</ref> होने देना <math>z</math> के एलसीए को निरूपित करें <math>i </math> और <math>j</math>, का उपयोग करना <math>z</math> और सीमा की विघटनशीलता के अनुसार <math>\tau</math>-अधिकांश प्रश्न (जैसा कि ऊपर और अंदर वर्णित है)। <ref name=":1" />), दो तरफा रेंज क्वेरी <math>A[i..j]</math> दो एकतरफ़ा रेंज टॉप-के क्वेरीज़ (से) में परिवर्तित किया जा सकता है <math>z</math> को <math>i</math> और <math>j</math>). ये दो एकतरफ़ा रेंज टॉप-के क्वेरीज़ टॉप-( लौटाती हैं<math>1/\tau</math>) प्रत्येक संबंधित श्रेणी में सबसे अधिक बार आने वाले तत्व <math>O(1/\tau)</math> समय। ये सामान्य तत्व उम्मीदवारों के समूह का निर्माण करते हैं <math>\tau</math>-में बहुमत <math>A[i..j]</math> जिसमें हैं <math>O(1/\tau)</math> उम्मीदवार जिनमें से कुछ गलत सकारात्मक हो सकते हैं। फिर प्रत्येक उम्मीदवार का रैखिक-अंतरिक्ष डेटा संरचना (जैसा कि लेम्मा 3 में वर्णित है) का उपयोग करके निरंतर समय में मूल्यांकन किया जाता है <ref>{{Cite journal|last1=Chan|first1=Timothy M.|last2=Durocher|first2=Stephane|last3=Larsen|first3=Kasper Green|last4=Morrison|first4=Jason|last5=Wilkinson|first5=Bryan T.|date=2013-03-08|title=एरेज़ में रेंज मोड क्वेरी के लिए रैखिक-स्पेस डेटा संरचनाएं|url=http://dx.doi.org/10.1007/s00224-013-9455-2|journal=Theory of Computing Systems|volume=55|issue=4|pages=719–741|doi=10.1007/s00224-013-9455-2|s2cid=253747004 |issn=1432-4350}}</ref>) जो निर्धारित करने में सक्षम है  <math>O(1)</math> समय चाहे किसी सरणी की दी गई उपश्रेणी हो या नहीं <math>A</math> कम से कम सम्मिलित है <math>q</math> किसी विशेष तत्व के उदाहरण <math>e</math>.


==== वृक्ष पथ ====
==== वृक्ष पथ ====
गैगी एट अल.<ref name=":2">{{Cite journal|last1=Gagie|first1=Travis|last2=He|first2=Meng|last3=Navarro|first3=Gonzalo|last4=Ochoa|first4=Carlos|date=September 2020|title=वृक्ष पथ बहुसंख्यक डेटा संरचनाएँ|url=http://dx.doi.org/10.1016/j.tcs.2020.05.039|journal=Theoretical Computer Science|volume=833|pages=107–119|doi=10.1016/j.tcs.2020.05.039|issn=0304-3975}}</ref> डेटा संरचना प्रस्तावित की गई है जो दो नोड्स दिए गए प्रश्नों का समर्थन करती है <math>u</math> और <math>v</math> पेड़ में, उन तत्वों की सूची की रिपोर्ट करने में सक्षम हैं जिनकी तुलना में अधिक सापेक्ष आवृत्ति है <math>\tau</math> से रास्ते पर <math>u</math> को <math>v</math>. अधिक औपचारिक रूप से, आइए <math>T</math> लेबल वाला पेड़ बनें जिसमें प्रत्येक नोड में आकार के वर्णमाला से लेबल हो <math>\sigma</math>. होने देना <math>label(u)\in [1,\dots,\sigma]</math> नोड के लेबल को निरूपित करें <math>u</math> में <math>T</math>. होने देना <math>P_{uv}</math> से अद्वितीय पथ को निरूपित करें <math>u</math> को <math>v</math> में <math>T</math> जिसमें मध्य नोड्स को उनके देखे जाने के क्रम में सूचीबद्ध किया गया है। दिया गया <math>T</math>, और निश्चित (पूर्व-प्रसंस्करण के दौरान निर्दिष्ट) सीमा <math>0<\tau<1</math>, पूछताछ <math>Q(u,v)</math> से अधिक दिखाई देने वाले सभी लेबलों का सेट वापस करना होगा  <math>\tau|P_{uv}|</math> कई बार <math>P_{uv}</math>.
गैगी एट अल.<ref name=":2">{{Cite journal|last1=Gagie|first1=Travis|last2=He|first2=Meng|last3=Navarro|first3=Gonzalo|last4=Ochoa|first4=Carlos|date=September 2020|title=वृक्ष पथ बहुसंख्यक डेटा संरचनाएँ|url=http://dx.doi.org/10.1016/j.tcs.2020.05.039|journal=Theoretical Computer Science|volume=833|pages=107–119|doi=10.1016/j.tcs.2020.05.039|issn=0304-3975}}</ref> डेटा संरचना प्रस्तावित की गई है जो दो नोड्स दिए गए प्रश्नों का समर्थन करती है <math>u</math> और <math>v</math> पेड़ में, उन तत्वों की सूची की रिपोर्ट करने में सक्षम हैं जिनकी तुलना में अधिक सापेक्ष आवृत्ति है <math>\tau</math> से रास्ते पर <math>u</math> को <math>v</math>. अधिक औपचारिक रूप से, आइए <math>T</math> लेबल वाला पेड़ बनें जिसमें प्रत्येक नोड में आकार के वर्णमाला से लेबल हो <math>\sigma</math>. होने देना <math>label(u)\in [1,\dots,\sigma]</math> नोड के लेबल को निरूपित करें <math>u</math> में <math>T</math>. होने देना <math>P_{uv}</math> से अद्वितीय पथ को निरूपित करें <math>u</math> को <math>v</math> में <math>T</math> जिसमें मध्य नोड्स को उनके देखे जाने के क्रम में सूचीबद्ध किया गया है। दिया गया <math>T</math>, और निश्चित (पूर्व-प्रसंस्करण के दौरान निर्दिष्ट) सीमा <math>0<\tau<1</math>, पूछताछ <math>Q(u,v)</math> से अधिक दिखाई देने वाले सभी लेबलों का सेट वापस करना होगा  <math>\tau|P_{uv}|</math> कई बार <math>P_{uv}</math>.


सबसे पहले इस डेटा संरचना का निर्माण करें <math>{O}(\tau n)</math> नोड्स चिह्नित हैं. यह किसी भी नोड को चिह्नित करके किया जा सकता है जिसमें कम से कम दूरी हो <math>\lceil 1 / \tau\rceil</math> तीन के नीचे से (ऊंचाई) और जिसकी गहराई से विभाज्य है <math>\lceil 1 / \tau\rceil</math>. ऐसा करने के बाद, यह देखा जा सकता है कि प्रत्येक नोड और उसके निकटतम चिह्नित पूर्वज के बीच की दूरी कम है <math>2\lceil 1 / \tau\rceil</math>. चिह्नित नोड के लिए <math>x</math>, <math>\log(depth(x))</math> विभिन्न अनुक्रम (जड़ की ओर पथ) <math>P_i(x)</math> जमा हो जाती है,
सबसे पहले इस डेटा संरचना का निर्माण करें <math>{O}(\tau n)</math> नोड्स चिह्नित हैं. यह किसी भी नोड को चिह्नित करके किया जा सकता है जिसमें कम से कम दूरी हो <math>\lceil 1 / \tau\rceil</math> तीन के नीचे से (ऊंचाई) और जिसकी गहराई से विभाज्य है <math>\lceil 1 / \tau\rceil</math>. ऐसा करने के बाद, यह देखा जा सकता है कि प्रत्येक नोड और उसके निकटतम चिह्नित प्राचीन के बीच की दूरी कम है <math>2\lceil 1 / \tau\rceil</math>. चिह्नित नोड के लिए <math>x</math>, <math>\log(depth(x))</math> विभिन्न अनुक्रम (जड़ की ओर पथ) <math>P_i(x)</math> जमा हो जाती है,


<math>P_{i}(x)=\left\langle  \operatorname{label}(x),  \operatorname{par}(x),  \operatorname{par}^{2}(x), \ldots,  \operatorname{par}^{2^i}(x)\right\rangle
<math>P_{i}(x)=\left\langle  \operatorname{label}(x),  \operatorname{par}(x),  \operatorname{par}^{2}(x), \ldots,  \operatorname{par}^{2^i}(x)\right\rangle
</math>
</math>
के लिए <math>0\leq i \leq \log(depth(x))</math> कहाँ <math>\operatorname{par}(x)</math> नोड के प्रत्यक्ष पैरेंट का लेबल लौटाता है <math>x</math>. दूसरे तरीके से कहें तो, प्रत्येक चिह्नित नोड के लिए, रूट की ओर दो लंबाई (प्लस नोड के लिए एक) की शक्ति वाले सभी पथों का सेट संग्रहीत किया जाता है। इसके अलावा, प्रत्येक के लिए <math>P_i(x)</math>, सभी बहुमत उम्मीदवारों का सेट <math>C_i(x)</math> जमा हो जाती है। अधिक विशेष रूप से, <math>C_i(x)</math> सभी का सेट शामिल है <math>(\tau/2)</math>-में बहुमत <math>P_i(x)</math> या लेबल जो इससे अधिक दिखाई देते हैं <math>(\tau/2).(2^i+1)</math> कई बार <math>P_i(x)</math>. यह देखना आसान है कि उम्मीदवारों का सेट <math>C_i(x)</math> ज्यादा से ज्यादा हो सकता है <math>2/\tau</math> प्रत्येक के लिए अलग-अलग लेबल <math>i</math>. गैगी एट अल.<ref name=":2"/>फिर ध्यान दें कि सभी का सेट <math>\tau</math>-किसी भी चिह्नित नोड से पथ में प्रमुखताएँ <math>x</math> अपने पूर्वजों में से को <math>z</math> कुछ में शामिल है <math>C_i(x)</math> (लेम्मा 2 इंच) <ref name=":2"/> की लंबाई के बाद से <math>P_i(x)</math> के बराबर है <math>(2^i+1)</math> इस प्रकार वहाँ मौजूद है <math>P_i(x)</math> के लिए <math>0\leq i \leq \log(depth(x))</math> जिनकी लंबाई बीच में है <math>d_{xz} \text{ and } 2 d_{xz}</math> कहाँ <math>d_{xz}</math> x और z के बीच की दूरी है. ऐसे का अस्तित्व <math>P_i(x)</math> तात्पर्य यह है कि ए <math>\tau</math>-बहुमत से रास्ते में <math>x</math> को <math>z</math> होना चाहिए <math>(\tau/2)</math>-बहुमत में <math>P_i(x)</math>, और इस प्रकार अवश्य प्रकट होना चाहिए <math>C_i(x)</math>. यह देखना आसान है कि इस डेटा संरचना की आवश्यकता है <math>O(n \log n)</math> अंतरिक्ष के शब्द, क्योंकि जैसा कि निर्माण चरण में ऊपर बताया गया है <math>O(\tau n)</math> नोड्स चिह्नित किए जाते हैं और प्रत्येक चिह्नित नोड के लिए कुछ उम्मीदवार सेट संग्रहीत किए जाते हैं। परिभाषा के अनुसार, प्रत्येक चिह्नित नोड के लिए <math>O(\log n)</math> ऐसे सेट स्टोर हैं, जिनमें से प्रत्येक में शामिल है <math>O(1/\tau)</math> उम्मीदवार। इसलिए, इस डेटा संरचना की आवश्यकता है <math>O(\log n \times (1/\tau) \times \tau n)=O(n \log n)</math> अंतरिक्ष के शब्द. कृपया ध्यान दें कि प्रत्येक नोड <math>x</math> भण्डारण भी करता है <math>count(x)</math> जो कि उदाहरणों की संख्या के बराबर है <math>label(x)</math> से रास्ते पर <math>x</math> की जड़ तक <math>T</math>, इससे स्थान जटिलता नहीं बढ़ती क्योंकि यह केवल प्रति नोड शब्दों की स्थिर संख्या जोड़ता है।
के लिए <math>0\leq i \leq \log(depth(x))</math> जहाँ <math>\operatorname{par}(x)</math> नोड के प्रत्यक्ष पैरेंट का लेबल लौटाता है <math>x</math>. दूसरे तरीके से कहें तो, प्रत्येक चिह्नित नोड के लिए, रूट की ओर दो लंबाई (प्लस नोड के लिए एक) की शक्ति वाले सभी पथों का सेट संग्रहीत किया जाता है। इसके अलावा, प्रत्येक के लिए <math>P_i(x)</math>, सभी बहुमत उम्मीदवारों का सेट <math>C_i(x)</math> जमा हो जाती है। अधिक विशेष रूप से, <math>C_i(x)</math> सभी का सेट सम्मिलित है <math>(\tau/2)</math>-में बहुमत <math>P_i(x)</math> या लेबल जो इससे अधिक दिखाई देते हैं <math>(\tau/2).(2^i+1)</math> कई बार <math>P_i(x)</math>. यह देखना आसान है कि उम्मीदवारों का सेट <math>C_i(x)</math> ज्यादा से ज्यादा हो सकता है <math>2/\tau</math> प्रत्येक के लिए अलग-अलग लेबल <math>i</math>. गैगी एट अल.<ref name=":2"/>फिर ध्यान दें कि सभी का सेट <math>\tau</math>-किसी भी चिह्नित नोड से पथ में प्रमुखताएँ <math>x</math> अपने पूर्वजों में से को <math>z</math> कुछ में सम्मिलित है <math>C_i(x)</math> (लेम्मा 2 इंच) <ref name=":2"/> की लंबाई के बाद से <math>P_i(x)</math> के बराबर है <math>(2^i+1)</math> इस प्रकार वहाँ उपस्थित है <math>P_i(x)</math> के लिए <math>0\leq i \leq \log(depth(x))</math> जिनकी लंबाई बीच में है <math>d_{xz} \text{ and } 2 d_{xz}</math> जहाँ <math>d_{xz}</math> x और z के बीच की दूरी है. ऐसे का अस्तित्व <math>P_i(x)</math> तात्पर्य यह है कि ए <math>\tau</math>-बहुमत से रास्ते में <math>x</math> को <math>z</math> होना चाहिए <math>(\tau/2)</math>-बहुमत में <math>P_i(x)</math>, और इस प्रकार अवश्य प्रकट होना चाहिए <math>C_i(x)</math>. यह देखना आसान है कि इस डेटा संरचना की आवश्यकता है <math>O(n \log n)</math> अंतरिक्ष के शब्द, क्योंकि जैसा कि निर्माण चरण में ऊपर बताया गया है <math>O(\tau n)</math> नोड्स चिह्नित किए जाते हैं और प्रत्येक चिह्नित नोड के लिए कुछ उम्मीदवार सेट संग्रहीत किए जाते हैं। परिभाषा के अनुसार, प्रत्येक चिह्नित नोड के लिए <math>O(\log n)</math> ऐसे सेट स्टोर हैं, जिनमें से प्रत्येक में सम्मिलित है <math>O(1/\tau)</math> उम्मीदवार। इसलिए, इस डेटा संरचना की आवश्यकता है <math>O(\log n \times (1/\tau) \times \tau n)=O(n \log n)</math> अंतरिक्ष के शब्द. कृपया ध्यान दें कि प्रत्येक नोड <math>x</math> भण्डारण भी करता है <math>count(x)</math> जो कि उदाहरणों की संख्या के बराबर है <math>label(x)</math> से रास्ते पर <math>x</math> की जड़ तक <math>T</math>, इससे स्थान जटिलता नहीं बढ़ती क्योंकि यह केवल प्रति नोड शब्दों की स्थिर संख्या जोड़ता है।


दो नोड्स के बीच प्रत्येक क्वेरी <math>u</math> और <math>v</math> रेंज की डीकंपोज़बिलिटी प्रॉपर्टी (जैसा कि ऊपर बताया गया है) का उपयोग करके उत्तर दिया जा सकता है <math>\tau</math>-अधिकांश प्रश्न और बीच में प्रश्न पथ को तोड़कर <math>u</math> और <math>v</math> चार उपपथों में। होने देना <math>z</math> का निम्नतम सामान्य पूर्वज हो <math>u</math> और <math>v</math>, साथ <math>x</math> और <math>y</math> के निकटतम चिह्नित पूर्वज हैं <math>u</math> और <math>v</math> क्रमश। से रास्ता <math>u</math> को <math>v</math> से पथों में विघटित हो जाता है <math>u</math> और <math>v</math> को <math>x</math> और <math>y</math> क्रमशः (इन पथों का आकार छोटा है <math>2\lceil 1 / \tau\rceil</math> परिभाषा के अनुसार, इनमें से सभी को उम्मीदवार माना जाता है), और रास्ते <math>x</math> और <math>y</math> को <math>z</math> (उपयुक्त ढूंढकर <math>C_i(x)</math> जैसा कि ऊपर बताया गया है और इसके सभी लेबलों को उम्मीदवार के रूप में माना जा रहा है)। कृपया ध्यान दें कि, सीमा नोड्स को तदनुसार संभाला जाना चाहिए ताकि ये सभी उपपथ असंयुक्त हों और उन सभी से सेट हो <math>O(1/\tau)</math> उम्मीदवार व्युत्पन्न है. इनमें से प्रत्येक उम्मीदवार को फिर के संयोजन का उपयोग करके सत्यापित किया जाता है <math>labelanc (x, \ell)</math> क्वेरी जो नोड का निम्नतम पूर्वज लौटाती है <math>x</math> उस पर लेबल है <math>\ell</math> और यह <math>count(x)</math> प्रत्येक नोड के फ़ील्ड. पर <math>w</math>-बिट रैम और आकार का वर्णमाला <math>\sigma</math>, द <math>labelanc (x, \ell)</math> प्रश्न का उत्तर इसमें दिया जा सकता है <math>O\left(\log \log _{w} \sigma\right) </math> रैखिक स्थान आवश्यकताओं के साथ समय।<ref>{{Cite journal|last1=He|first1=Meng|last2=Munro|first2=J. Ian|last3=Zhou|first3=Gelin|date=2014-07-08|title=बड़े अक्षरों पर संक्षिप्त लेबल वाले सामान्य वृक्षों के लिए एक रूपरेखा|url=http://dx.doi.org/10.1007/s00453-014-9894-4|journal=Algorithmica|volume=70|issue=4|pages=696–717|doi=10.1007/s00453-014-9894-4|s2cid=253977813 |issn=0178-4617}}</ref> इसलिए, प्रत्येक का सत्यापन किया जा रहा है <math>O(1/\tau)</math> उम्मीदवारों में <math>O\left(\log \log _{w} \sigma\right) </math> समय परिणाम देता है <math>O\left((1/\tau)\log \log _{w} \sigma\right) </math> सभी का सेट वापस करने के लिए कुल क्वेरी समय <math>\tau </math>-बहुसंख्यक राह पर हैं <math>u </math> को <math>v </math>.
दो नोड्स के बीच प्रत्येक क्वेरी <math>u</math> और <math>v</math> रेंज की डीकंपोज़बिलिटी प्रॉपर्टी (जैसा कि ऊपर बताया गया है) का उपयोग करके उत्तर दिया जा सकता है <math>\tau</math>-अधिकांश प्रश्न और बीच में प्रश्न पथ को तोड़कर <math>u</math> और <math>v</math> चार उपपथों में। होने देना <math>z</math> का निम्नतम सामान्य प्राचीन हो <math>u</math> और <math>v</math>, साथ <math>x</math> और <math>y</math> के निकटतम चिह्नित प्राचीन हैं <math>u</math> और <math>v</math> क्रमश। से रास्ता <math>u</math> को <math>v</math> से पथों में विघटित हो जाता है <math>u</math> और <math>v</math> को <math>x</math> और <math>y</math> क्रमशः (इन पथों का आकार छोटा है <math>2\lceil 1 / \tau\rceil</math> परिभाषा के अनुसार, इनमें से सभी को उम्मीदवार माना जाता है), और रास्ते <math>x</math> और <math>y</math> को <math>z</math> (उपयुक्त ढूंढकर <math>C_i(x)</math> जैसा कि ऊपर बताया गया है और इसके सभी लेबलों को उम्मीदवार के रूप में माना जा रहा है)। कृपया ध्यान दें कि, सीमा नोड्स को तदनुसार संभाला जाना चाहिए ताकि ये सभी उपपथ असंयुक्त हों और उन सभी से सेट हो <math>O(1/\tau)</math> उम्मीदवार व्युत्पन्न है. इनमें से प्रत्येक उम्मीदवार को फिर के संयोजन का उपयोग करके सत्यापित किया जाता है <math>labelanc (x, \ell)</math> क्वेरी जो नोड का निम्नतम प्राचीन लौटाती है <math>x</math> उस पर लेबल है <math>\ell</math> और यह <math>count(x)</math> प्रत्येक नोड के फ़ील्ड. पर <math>w</math>-बिट रैम और आकार का वर्णमाला <math>\sigma</math>, द <math>labelanc (x, \ell)</math> प्रश्न का उत्तर इसमें दिया जा सकता है <math>O\left(\log \log _{w} \sigma\right) </math> रैखिक स्थान आवश्यकताओं के साथ समय।<ref>{{Cite journal|last1=He|first1=Meng|last2=Munro|first2=J. Ian|last3=Zhou|first3=Gelin|date=2014-07-08|title=बड़े अक्षरों पर संक्षिप्त लेबल वाले सामान्य वृक्षों के लिए एक रूपरेखा|url=http://dx.doi.org/10.1007/s00453-014-9894-4|journal=Algorithmica|volume=70|issue=4|pages=696–717|doi=10.1007/s00453-014-9894-4|s2cid=253977813 |issn=0178-4617}}</ref> इसलिए, प्रत्येक का सत्यापन किया जा रहा है <math>O(1/\tau)</math> उम्मीदवारों में <math>O\left(\log \log _{w} \sigma\right) </math> समय परिणाम देता है <math>O\left((1/\tau)\log \log _{w} \sigma\right) </math> सभी का सेट वापस करने के लिए कुल क्वेरी समय <math>\tau </math>-बहुसंख्यक राह पर हैं <math>u </math> को <math>v </math>.


==संबंधित समस्याएँ==
==संबंधित समस्याएँ==
ऊपर वर्णित सभी समस्याओं का अध्ययन उच्च आयामों के साथ-साथ उनके गतिशील संस्करणों के लिए भी किया गया है। दूसरी ओर, रेंज क्वेरीज़ को अन्य डेटा संरचनाओं जैसे ट्री (डेटा संरचना) तक बढ़ाया जा सकता है।<ref name="morin kranakis">{{cite journal|first1=P|last1=Bose|author1-link=Jit Bose|first2=E.|last2=Kranakis|first3=P.|last3=Morin|author3-link= Pat Morin |first4=Y.|last4=Tang|title=अनुमानित रेंज मोड और रेंज माध्यिका प्रश्न|journal=In Proceedings of the 22nd Symposium on Theoretical Aspects of Computer Science (STACS 2005), Volume 3404 of Lecture Notes in ComputerScience|year=2005|pages=377–388|url=http://cg.scs.carleton.ca/~morin/publications/}}</ref> जैसे कि [[स्तर पूर्वज समस्या]]। समस्याओं का समान परिवार श्रेणी खोज क्वेरीज़ हैं, जिन्हें गिनती क्वेरीज़ के रूप में भी जाना जाता है।
ऊपर वर्णित सभी समस्याओं का अध्ययन उच्च आयामों के साथ-साथ उनके गतिशील संस्करणों के लिए भी किया गया है। दूसरी ओर, रेंज क्वेरीज़ को अन्य डेटा संरचनाओं जैसे ट्री (डेटा संरचना) तक बढ़ाया जा सकता है।<ref name="morin kranakis">{{cite journal|first1=P|last1=Bose|author1-link=Jit Bose|first2=E.|last2=Kranakis|first3=P.|last3=Morin|author3-link= Pat Morin |first4=Y.|last4=Tang|title=अनुमानित रेंज मोड और रेंज माध्यिका प्रश्न|journal=In Proceedings of the 22nd Symposium on Theoretical Aspects of Computer Science (STACS 2005), Volume 3404 of Lecture Notes in ComputerScience|year=2005|pages=377–388|url=http://cg.scs.carleton.ca/~morin/publications/}}</ref> जैसे कि [[स्तर पूर्वज समस्या|स्तर प्राचीन समस्या]]। समस्याओं का समान परिवार श्रेणी खोज क्वेरीज़ हैं, जिन्हें गिनती क्वेरीज़ के रूप में भी जाना जाता है।


== यह भी देखें ==
== यह भी देखें ==
* स्तर पूर्वज समस्या
* स्तर प्राचीन समस्या
* निम्नतम सामान्य पूर्वज
* निम्नतम सामान्य प्राचीन


==संदर्भ==
==संदर्भ==

Revision as of 14:15, 5 July 2023

डेटा संरचनाओं में, रेंज क्वेरी में डेटा प्री-प्रोसेसिंग सम्मिलित होती है | इनपुट के किसी भी सबसेट पर किसी भी संख्या में प्रश्नों का कुशलतापूर्वक उत्तर देने के लिए डेटा संरचना में कुछ इनपुट डेटा को प्री-प्रोसेस किया जाता है। विशेष रूप से, समस्याओं का समूह है जिसका बड़े मापदंड पर अध्ययन किया गया है जहां इनपुट अवर्गीकृत संख्याओं की सरणी डेटा संरचना है और क्वेरी में सरणी की विशिष्ट सीमा पर कुछ फलन, जैसे न्यूनतम, की गणना करना सम्मिलित है।

परिभाषा

कुछ सेट S के n तत्वों की एक सरणी पर एक श्रेणी क्वेरी , जिसे , दो सूचकांक लेता है , एक फलन f जो S के तत्वों के सरणियों पर परिभाषित होता है और आउटपुट करता है

उदाहरण के लिए, के लिए और संख्याओं की सारणी, श्रेणी क्वेरी गणना करता है , किसी के लिए . इन प्रश्नों का उत्तर निरंतर समय और उपयोग में दिया जा सकता है पहले के योग की गणना करके अतिरिक्त स्थान i घटक A और उन्हें सहायक सरणी में संग्रहीत करना B, ऐसा है कि प्रथम का योग सम्मिलित है i घटक A हर एक के लिए . इसलिए, किसी भी प्रश्न का उत्तर ऐसा करके दिया जा सकता है .

इस रणनीति को प्रत्येक समूह (गणित) ऑपरेटर के लिए बढ़ाया जा सकता है f जहां की धारणा अच्छी तरह से परिभाषित और सरलता से गणना योग्य है।[1] अंत में, इस समाधान को समान पूर्व-प्रसंस्करण के साथ द्वि-आयामी सरणियों तक बढ़ाया जा सकता है।[2]


उदाहरण

सेमीग्रुप ऑपरेटर

न्यूनतम श्रेणी की क्वेरी को हल करने के लिए संबंधित कार्टेशियन ट्री का निर्माण करना। निम्नतम सामान्य पूर्वज समस्या तक सीमित।

जब किसी श्रेणी क्वेरी में रुचि का कार्य एक अर्धसमूह ऑपरेटर होता है, जिससे इसकी धारणा सदैव परिभाषित नहीं किया जाता है, इसलिए पिछले अनुभाग की रणनीति काम नहीं करती है। एंड्रयू याओ ने दिखाया [3] सेमीग्रुप ऑपरेटरों को सम्मिलित करने वाली रेंज क्वेरीज़ के लिए कुशल समाधान उपस्थित है। उन्होंने इसे किसी भी स्थिरांक के लिए सिद्ध किया c, समय और स्थान का पूर्व-प्रसंस्करण जहां सूचियों पर श्रेणी प्रश्नों का उत्तर देने की अनुमति देता है f सेमीग्रुप ऑपरेटर है समय, जहाँ एकरमैन फलन का निश्चित कार्यात्मक व्युत्क्रम है।

कुछ सेमीग्रुप ऑपरेटर हैं जो थोड़ा उत्तम समाधान स्वीकार करते हैं। उदाहरण के लिए जब . मान लीजिए तब के न्यूनतम तत्व का सूचकांक लौटाता है . तब संबंधित न्यूनतम श्रेणी क्वेरी को दर्शाता है। ऐसी कई डेटा संरचनाएं हैं जो न्यूनतम सीमा में क्वेरी का उत्तर देने की अनुमति देती हैं समय और स्थान की पूर्व-प्रसंस्करण का उपयोग करके . ऐसा समाधान इस समस्या और निम्नतम सामान्य प्राचीन समस्या के बीच समानता पर आधारित है।

कार्तीय वृक्ष सरणी का जड़ के रूप में है और बाएँ और दाएँ उपवृक्ष के रूप में कार्तीय वृक्ष और कार्तीय वृक्ष क्रमश। श्रेणी न्यूनतम क्वेरी में निम्नतम सामान्य प्राचीन है का और . क्योंकि सबसे कम सामान्य प्राचीन को समय और स्थान की पूर्व-प्रसंस्करण का उपयोग करके निरंतर समय में हल किया जा सकता है , रेंज न्यूनतम क्वेरी भी कर सकते हैं। समाधान जब अनुरूप है. कार्तीय वृक्षों का निर्माण रैखिक समय में किया जा सकता है।

मोड

किसी सरणी A का मोड (सांख्यिकी) वह तत्व है जो A में सबसे अधिक दिखाई देता है। उदाहरण के लिए का मोड है 4. संबंधों के स्थिति में सबसे अधिक बार आने वाले तत्वों में से किसी को मोड के रूप में चुना जा सकता है। रेंज मोड क्वेरी में प्री-प्रोसेसिंग सम्मिलित होती है जैसे कि हम किसी भी रेंज में मोड पा सकते हैं . इस समस्या को हल करने के लिए कई डेटा संरचनाएं तैयार की गई हैं, हम निम्नलिखित तालिका में कुछ परिणामों का सारांश प्रस्तुत करते हैं।[1]

रेंज मोड क्वेरीज़
स्पेस प्रश्नोत्तरी समय प्रतिबंध

वर्तमान में जोर्गेनसेन एट अल के सेल-जांच मॉडल पर निचली सीमा सिद्ध हुई उपयोग करने वाली किसी भी डेटा संरचना के लिए S कोशिकाएं प्रयोग की जाती है.[4]


माध्यिका

यह विशेष मामला विशेष रुचि का है क्योंकि माध्यिका ज्ञात करने के कई अनुप्रयोग हैं।[5] दूसरी ओर, माध्यिका समस्या, चयन समस्या का विशेष मामला, माध्यिका एल्गोरिथ्म का उपयोग करके O(n) में हल किया जा सकता है।[6] हालाँकि रेंज मीडियन प्रश्नों के माध्यम से इसका सामान्यीकरण वर्तमान में हुआ है।[7]एक श्रेणी माध्यिका क्वेरी जहां A,i और j के सामान्य अर्थ हैं, का मध्य तत्व लौटाता है . समान रूप से, का तत्व वापस करना चाहिए रैंक का . सेमीग्रुप ऑपरेटरों के लिए याओ के दृष्टिकोण सहित ऊपर चर्चा की गई किसी भी पिछली विधि का पालन करके रेंज मीडियन प्रश्नों को हल नहीं किया जा सकता है।[8]

इस समस्या के दो प्रकारों का अध्ययन किया गया है, ऑफ़लाइन एल्गोरिदम संस्करण, जहां रुचि के सभी k प्रश्न बैच में दिए गए हैं, और संस्करण जहां सभी पूर्व-प्रसंस्करण पहले ही किया जाता है। ऑफ़लाइन संस्करण के साथ हल किया जा सकता है समय और अंतरिक्ष।

तुरंत चयन का निम्नलिखित छद्मकोड दिखाता है कि रैंक के तत्व को कैसे खोजा जाए r में हमारे द्वारा निर्धारित सीमा माध्यिकाओं को खोजने के लिए, अलग-अलग तत्वों की अवर्गीकृत सरणी .[7] रेंजमेडियन(ए, आई, जे, आर) {

    यदि A.लंबाई() == 1
        वापसी ए[1]

    यदि A.low अपरिभाषित है तो
        एम = माध्यिका(ए)
        A.low = [e in A | ई <= एम]
        ए.हाई = [ई इन ए | ई > एम ]

    A[i, j] के उन तत्वों की संख्या की गणना करें जो A.low से संबंधित हैं

    यदि r <= t तो
        रिटर्न रेंजमेडियन(ए.लो, आई, जे, आर)
    अन्य
        रिटर्न रेंजमेडियन(ए.हाई, आई, जे, आरटी)
}

प्रक्रिया rangeMedian विभाजन A, का उपयोग करना A का माध्यिका, दो सरणियों में A.low और A.high, जहां पूर्व सम्मिलित है के तत्व A जो माध्यिका से कम या उसके बराबर हैं m और बाद वाले के बाकी तत्व A. यदि हम जानते हैं कि तत्वों की संख्या वह में खत्म A.low है t और यह संख्या इससे भी बड़ी है r तो हमें रैंक के तत्व की तलाश करते रहना चाहिए r में A.low; अन्यथा हमें रैंक के तत्व की तलाश करनी चाहिए में A.high. ढूँढ़ने के लिए t, यह अधिकतम सूचकांक ज्ञात करने के लिए पर्याप्त है ऐसा है कि में है A.low और अधिकतम सूचकांक ऐसा है कि में है A.high. तब . विभाजन भाग पर विचार किए बिना, किसी भी प्रश्न की कुल लागत है चूँकि अधिक से अधिक रिकर्सन कॉल किए जाते हैं और उनमें से प्रत्येक में केवल निरंतर संख्या में ऑपरेशन किए जाते हैं (मान प्राप्त करने के लिए)। tआंशिक प्रपात का उपयोग किया जाना चाहिए)। यदि मध्यस्थों को खोजने के लिए रैखिक एल्गोरिथ्म का उपयोग किया जाता है, तो पूर्व-प्रसंस्करण की कुल लागत kश्रेणी माध्यिका प्रश्न है . समस्या के ऑनलाइन एल्गोरिदम संस्करण को हल करने के लिए एल्गोरिथम को भी संशोधित किया जा सकता है।[7]


बहुमत

किसी दिए गए आइटम सेट में लगातार तत्वों को ढूंढना डेटा माइनिंग में सबसे महत्वपूर्ण कार्यों में से है। जब अधिकांश वस्तुओं की आवृत्तियाँ समान हों तो बारंबार तत्वों को ढूँढना कठिन कार्य हो सकता है। इसलिए, यह अधिक फायदेमंद हो सकता है यदि ऐसी वस्तुओं का पता लगाने के लिए महत्व की कुछ सीमा का उपयोग किया जाए। किसी सरणी के अधिकांश भाग को खोजने के लिए सबसे प्रसिद्ध एल्गोरिदम में से बॉयर और मूर द्वारा प्रस्तावित किया गया था [9] जिसे बॉयर-मूर बहुमत वोट एल्गोरिदम के रूप में भी जाना जाता है। बॉयर और मूर ने स्ट्रिंग के अधिकांश तत्व (यदि इसमें है) को खोजने के लिए एल्गोरिदम प्रस्तावित किया समय और उपयोग अंतरिक्ष। बॉयर और मूर के काम के संदर्भ में और आम तौर पर बोलते हुए, वस्तुओं के सेट में बहुसंख्यक तत्व (उदाहरण के लिए स्ट्रिंग या सरणी) वह होता है जिसके उदाहरणों की संख्या उस सेट के आकार के आधे से अधिक होती है। कुछ साल बाद, मिश्रा और ग्रिज़ [10] बॉयर और मूर के एल्गोरिदम का अधिक सामान्य संस्करण प्रस्तावित किया किसी सारणी में सभी वस्तुओं को खोजने के लिए तुलना जिनकी सापेक्ष आवृत्तियाँ कुछ सीमा से अधिक हैं . दायरा -अधिकांश क्वेरी वह होती है, जिसमें डेटा संरचना (उदाहरण के लिए सरणी) के आकार की उपश्रेणी दी जाती है , उन सभी अलग-अलग आइटमों का सेट लौटाता है जो (या कुछ प्रकाशनों में इसके बराबर) से अधिक दिखाई देते हैं उस दी गई सीमा में कई बार. विभिन्न संरचनाओं में जो रेंज का समर्थन करते हैं -अधिकांश प्रश्न, या तो स्थिर हो सकता है (पूर्व-प्रसंस्करण के दौरान निर्दिष्ट) या गतिशील (क्वेरी समय पर निर्दिष्ट)। ऐसे कई दृष्टिकोण इस तथ्य पर आधारित हैं कि, किसी दिए गए दायरे के आकार की परवाह किए बिना ज्यादा से ज्यादा हो सकता है कम से कम सापेक्ष आवृत्तियों वाले विशिष्ट उम्मीदवार . इनमें से प्रत्येक उम्मीदवार का निरंतर समय में सत्यापन करके, क्वेरी का समय प्राप्त हो गया है. दायरा -अधिकांश क्वेरी विघटित करने योग्य है [11] इस अर्थ में कि ए -एक सीमा में बहुमत विभाजन के साथ और होना चाहिए -दोनों में बहुमत या . इस विघटनशीलता के कारण, कुछ डेटा संरचनाएँ उत्तर देती हैं - रेंज वृक्ष में क्वेरी रेंज के अंतिम बिंदुओं के निम्नतम सामान्य प्राचीन (एलसीए) को ढूंढकर और उम्मीदवारों के दो सेट (आकार के) को मान्य करके एक-आयामी सरणियों पर अधिकांश प्रश्न ) प्रत्येक समापन बिंदु से निम्नतम सामान्य प्राचीन तक निरंतर समय के परिणामस्वरूप पूछताछ का समय.

द्वि-आयामी सरणियाँ

गैगी एट अल.[12] डेटा संरचना प्रस्तावित की जो रेंज का समर्थन करती है -अधिकांश प्रश्न पर सरणी . प्रत्येक प्रश्न के लिए इस डेटा संरचना में सीमा है और आयताकार श्रेणी निर्दिष्ट हैं, और उन सभी तत्वों का सेट जिनकी सापेक्ष आवृत्तियाँ (उस आयताकार सीमा के अंदर) से अधिक या उसके बराबर हैं आउटपुट के रूप में लौटाए जाते हैं। यह डेटा संरचना गतिशील थ्रेशोल्ड (क्वेरी समय पर निर्दिष्ट) और प्री-प्रोसेसिंग थ्रेशोल्ड का समर्थन करती है जिसके आधार पर इसका निर्माण किया गया है। पूर्व-प्रसंस्करण के दौरान, ऊर्ध्वाधर और क्षैतिज अंतराल का सेट बनाया जाता है सरणी. ऊर्ध्वाधर और क्षैतिज अंतराल मिलकर ब्लॉक बनाते हैं। प्रत्येक ब्लॉक अपने से नौ गुना बड़े सुपरब्लॉक का हिस्सा है (ब्लॉक के क्षैतिज अंतराल के आकार का तीन गुना और इसके ऊर्ध्वाधर के आकार का तीन गुना)। प्रत्येक ब्लॉक के लिए उम्मीदवारों का सेट (साथ) अधिक से अधिक तत्व) संग्रहित किया जाता है जिसमें कम से कम सापेक्ष आवृत्तियों वाले तत्व सम्मिलित होते हैं (पूर्व-प्रसंस्करण सीमा जैसा कि ऊपर बताया गया है) अपने संबंधित सुपरब्लॉक में। इन तत्वों को उनकी आवृत्तियों के अनुसार गैर-बढ़ते क्रम में संग्रहीत किया जाता है और यह देखना आसान है कि, कोई भी तत्व जिसकी कम से कम सापेक्ष आवृत्ति होती है किसी ब्लॉक में उसके उम्मीदवारों का समूह उपस्थित होना चाहिए। प्रत्येक -अधिकांश क्वेरी का उत्तर सबसे पहले क्वेरी ब्लॉक, या दिए गए क्वेरी आयत में सम्मिलित सबसे बड़े ब्लॉक को ढूंढकर दिया जाता है समय। प्राप्त क्वेरी ब्लॉक के लिए, पहला अभ्यर्थियों को (सत्यापित किए बिना) लौटा दिया जाता है समय, इसलिए यह प्रक्रिया कुछ ग़लत सकारात्मक परिणाम दे सकती है। कई अन्य डेटा संरचनाओं (जैसा कि नीचे चर्चा की गई है) ने प्रत्येक उम्मीदवार को निरंतर समय में सत्यापित करने और इस प्रकार बनाए रखने के तरीकों का प्रस्ताव दिया है कोई गलत सकारात्मकता न लौटाते हुए क्वेरी का समय। वे स्थिति जिनमें क्वेरी ब्लॉक छोटा है भण्डारण द्वारा किया जाता है निम्नलिखित प्रपत्र की इस डेटा संरचना के विभिन्न उदाहरण:

जहाँ की प्री-प्रोसेसिंग सीमा है -वाँ उदाहरण. इस प्रकार, क्वेरी ब्लॉक से छोटे के लिए -वें उदाहरण पर सवाल उठाया गया है। जैसा कि ऊपर बताया गया है, इस डेटा संरचना में क्वेरी समय है और आवश्यकता है हफ़मैन-एन्कोडेड प्रतिलिपि को संग्रहीत करके अंतरिक्ष के टुकड़े (ध्यान दें)। फ़ैक्टर और हफ़मैन कोडिंग भी देखें)।

एक-आयामी सरणियाँ

चान एट अल.[13] डेटा संरचना का प्रस्ताव रखा जिसने आयामी सरणी दी, उपश्रेणी का (क्वेरी समय पर निर्दिष्ट) और सीमा (क्वेरी समय पर निर्दिष्ट), सभी की सूची वापस करने में सक्षम है -में बहुमत समय की आवश्यकता है अंतरिक्ष के शब्द. ऐसे प्रश्नों का उत्तर देने के लिए, चैन एट अल।[13]यह ध्यान देकर प्रारंभ करें कि डेटा संरचना उपस्थित है जो किसी श्रेणी में शीर्ष-के सबसे अधिक बार आने वाली वस्तुओं को वापस करने में सक्षम है समय की आवश्यकता है अंतरिक्ष के शब्द. एक-आयामी सरणी के लिए , तरफा टॉप-के रेंज क्वेरी को फॉर्म का होने दें . श्रेणियों की अधिकतम सीमा के लिए जिसमें विशिष्ट तत्व की आवृत्ति होती है में अपरिवर्तित रहता है (और बराबर होता है ), क्षैतिज रेखा खंड का निर्माण किया जाता है। वें>-इस रेखाखंड का अंतराल से मेल खाता है और इसमें है -मूल्य के बराबर . प्रत्येक तत्व को जोड़ने के बाद से ठीक विशिष्ट तत्व की आवृत्ति को बदलता है, उपरोक्त प्रक्रिया बनाता है रेखा खंड। इसके अलावा, ऊर्ध्वाधर रेखा के लिए इसे प्रतिच्छेद करने वाले सभी क्षैतिज रेखाखंडों को उनकी आवृत्तियों के अनुसार क्रमबद्ध किया जाता है। ध्यान दें कि, प्रत्येक क्षैतिज रेखा खंड के साथ -मध्यान्तर बिल्कुल विशिष्ट तत्व से मेल खाता है में , ऐसा है कि . टॉप-के क्वेरी का उत्तर ऊर्ध्वाधर किरण को शूट करके दिया जा सकता है और सबसे पहले रिपोर्टिंग क्षैतिज रेखा खंड जो इसे प्रतिच्छेद करते हैं (ऊपर से याद रखें कि ये रेखा रेखा खंड पहले से ही उनकी आवृत्तियों के अनुसार क्रमबद्ध हैं) समय।

चान एट अल.[13]सबसे पहले रेंज ट्री का निर्माण करें जिसमें प्रत्येक ब्रांचिंग नोड तरफा रेंज टॉप-के प्रश्नों के लिए ऊपर वर्णित डेटा संरचना की प्रति संग्रहीत करता है और प्रत्येक पत्ता तत्व का प्रतिनिधित्व करता है . प्रत्येक नोड पर टॉप-के डेटा संरचना का निर्माण उस नोड के उप-वृक्षों में उपस्थित मूल्यों के आधार पर किया जाता है और इसका उद्देश्य एकतरफा रेंज टॉप-के प्रश्नों का उत्तर देना है। कृपया ध्यान दें कि एक-आयामी सरणी के लिए , रेंज ट्री को विभाजित करके बनाया जा सकता है दो हिस्सों में और दोनों हिस्सों पर पुनरावृत्ति; इसलिए, परिणामी रेंज ट्री का प्रत्येक नोड रेंज का प्रतिनिधित्व करता है। यह भी देखा जा सकता है कि इस श्रेणी के पेड़ की आवश्यकता है अंतरिक्ष के शब्द, क्योंकि वहाँ हैं स्तर और प्रत्येक स्तर है नोड्स. इसके अलावा, चूँकि प्रत्येक स्तर पर रेंज ट्री के सभी नोड्स का कुल योग होता है घटक उनके उपवृक्षों पर और चूँकि वहाँ हैं स्तरों, इस रेंज ट्री की अंतरिक्ष जटिलता है .

इस संरचना का उपयोग करते हुए, श्रेणी -बहुमत प्रश्न पर साथ इसका उत्तर इस प्रकार दिया गया है। सबसे पहले, पत्ती नोड्स का निम्नतम सामान्य प्राचीन (LCA)। और स्थिर समय में पाया जाता है. ध्यान दें कि आवश्यक डेटा संरचना उपस्थित है अंतरिक्ष के टुकड़े जो एलसीए प्रश्नों का उत्तर देने में सक्षम हैं समय।[14] होने देना के एलसीए को निरूपित करें और , का उपयोग करना और सीमा की विघटनशीलता के अनुसार -अधिकांश प्रश्न (जैसा कि ऊपर और अंदर वर्णित है)। [11]), दो तरफा रेंज क्वेरी दो एकतरफ़ा रेंज टॉप-के क्वेरीज़ (से) में परिवर्तित किया जा सकता है को और ). ये दो एकतरफ़ा रेंज टॉप-के क्वेरीज़ टॉप-( लौटाती हैं) प्रत्येक संबंधित श्रेणी में सबसे अधिक बार आने वाले तत्व समय। ये सामान्य तत्व उम्मीदवारों के समूह का निर्माण करते हैं -में बहुमत जिसमें हैं उम्मीदवार जिनमें से कुछ गलत सकारात्मक हो सकते हैं। फिर प्रत्येक उम्मीदवार का रैखिक-अंतरिक्ष डेटा संरचना (जैसा कि लेम्मा 3 में वर्णित है) का उपयोग करके निरंतर समय में मूल्यांकन किया जाता है [15]) जो निर्धारित करने में सक्षम है समय चाहे किसी सरणी की दी गई उपश्रेणी हो या नहीं कम से कम सम्मिलित है किसी विशेष तत्व के उदाहरण .

वृक्ष पथ

गैगी एट अल.[16] डेटा संरचना प्रस्तावित की गई है जो दो नोड्स दिए गए प्रश्नों का समर्थन करती है और पेड़ में, उन तत्वों की सूची की रिपोर्ट करने में सक्षम हैं जिनकी तुलना में अधिक सापेक्ष आवृत्ति है से रास्ते पर को . अधिक औपचारिक रूप से, आइए लेबल वाला पेड़ बनें जिसमें प्रत्येक नोड में आकार के वर्णमाला से लेबल हो . होने देना नोड के लेबल को निरूपित करें में . होने देना से अद्वितीय पथ को निरूपित करें को में जिसमें मध्य नोड्स को उनके देखे जाने के क्रम में सूचीबद्ध किया गया है। दिया गया , और निश्चित (पूर्व-प्रसंस्करण के दौरान निर्दिष्ट) सीमा , पूछताछ से अधिक दिखाई देने वाले सभी लेबलों का सेट वापस करना होगा कई बार .

सबसे पहले इस डेटा संरचना का निर्माण करें नोड्स चिह्नित हैं. यह किसी भी नोड को चिह्नित करके किया जा सकता है जिसमें कम से कम दूरी हो तीन के नीचे से (ऊंचाई) और जिसकी गहराई से विभाज्य है . ऐसा करने के बाद, यह देखा जा सकता है कि प्रत्येक नोड और उसके निकटतम चिह्नित प्राचीन के बीच की दूरी कम है . चिह्नित नोड के लिए , विभिन्न अनुक्रम (जड़ की ओर पथ) जमा हो जाती है,

के लिए जहाँ नोड के प्रत्यक्ष पैरेंट का लेबल लौटाता है . दूसरे तरीके से कहें तो, प्रत्येक चिह्नित नोड के लिए, रूट की ओर दो लंबाई (प्लस नोड के लिए एक) की शक्ति वाले सभी पथों का सेट संग्रहीत किया जाता है। इसके अलावा, प्रत्येक के लिए , सभी बहुमत उम्मीदवारों का सेट जमा हो जाती है। अधिक विशेष रूप से, सभी का सेट सम्मिलित है -में बहुमत या लेबल जो इससे अधिक दिखाई देते हैं कई बार . यह देखना आसान है कि उम्मीदवारों का सेट ज्यादा से ज्यादा हो सकता है प्रत्येक के लिए अलग-अलग लेबल . गैगी एट अल.[16]फिर ध्यान दें कि सभी का सेट -किसी भी चिह्नित नोड से पथ में प्रमुखताएँ अपने पूर्वजों में से को कुछ में सम्मिलित है (लेम्मा 2 इंच) [16] की लंबाई के बाद से के बराबर है इस प्रकार वहाँ उपस्थित है के लिए जिनकी लंबाई बीच में है जहाँ x और z के बीच की दूरी है. ऐसे का अस्तित्व तात्पर्य यह है कि ए -बहुमत से रास्ते में को होना चाहिए -बहुमत में , और इस प्रकार अवश्य प्रकट होना चाहिए . यह देखना आसान है कि इस डेटा संरचना की आवश्यकता है अंतरिक्ष के शब्द, क्योंकि जैसा कि निर्माण चरण में ऊपर बताया गया है नोड्स चिह्नित किए जाते हैं और प्रत्येक चिह्नित नोड के लिए कुछ उम्मीदवार सेट संग्रहीत किए जाते हैं। परिभाषा के अनुसार, प्रत्येक चिह्नित नोड के लिए ऐसे सेट स्टोर हैं, जिनमें से प्रत्येक में सम्मिलित है उम्मीदवार। इसलिए, इस डेटा संरचना की आवश्यकता है अंतरिक्ष के शब्द. कृपया ध्यान दें कि प्रत्येक नोड भण्डारण भी करता है जो कि उदाहरणों की संख्या के बराबर है से रास्ते पर की जड़ तक , इससे स्थान जटिलता नहीं बढ़ती क्योंकि यह केवल प्रति नोड शब्दों की स्थिर संख्या जोड़ता है।

दो नोड्स के बीच प्रत्येक क्वेरी और रेंज की डीकंपोज़बिलिटी प्रॉपर्टी (जैसा कि ऊपर बताया गया है) का उपयोग करके उत्तर दिया जा सकता है -अधिकांश प्रश्न और बीच में प्रश्न पथ को तोड़कर और चार उपपथों में। होने देना का निम्नतम सामान्य प्राचीन हो और , साथ और के निकटतम चिह्नित प्राचीन हैं और क्रमश। से रास्ता को से पथों में विघटित हो जाता है और को और क्रमशः (इन पथों का आकार छोटा है परिभाषा के अनुसार, इनमें से सभी को उम्मीदवार माना जाता है), और रास्ते और को (उपयुक्त ढूंढकर जैसा कि ऊपर बताया गया है और इसके सभी लेबलों को उम्मीदवार के रूप में माना जा रहा है)। कृपया ध्यान दें कि, सीमा नोड्स को तदनुसार संभाला जाना चाहिए ताकि ये सभी उपपथ असंयुक्त हों और उन सभी से सेट हो उम्मीदवार व्युत्पन्न है. इनमें से प्रत्येक उम्मीदवार को फिर के संयोजन का उपयोग करके सत्यापित किया जाता है क्वेरी जो नोड का निम्नतम प्राचीन लौटाती है उस पर लेबल है और यह प्रत्येक नोड के फ़ील्ड. पर -बिट रैम और आकार का वर्णमाला , द प्रश्न का उत्तर इसमें दिया जा सकता है रैखिक स्थान आवश्यकताओं के साथ समय।[17] इसलिए, प्रत्येक का सत्यापन किया जा रहा है उम्मीदवारों में समय परिणाम देता है सभी का सेट वापस करने के लिए कुल क्वेरी समय -बहुसंख्यक राह पर हैं को .

संबंधित समस्याएँ

ऊपर वर्णित सभी समस्याओं का अध्ययन उच्च आयामों के साथ-साथ उनके गतिशील संस्करणों के लिए भी किया गया है। दूसरी ओर, रेंज क्वेरीज़ को अन्य डेटा संरचनाओं जैसे ट्री (डेटा संरचना) तक बढ़ाया जा सकता है।[8] जैसे कि स्तर प्राचीन समस्या। समस्याओं का समान परिवार श्रेणी खोज क्वेरीज़ हैं, जिन्हें गिनती क्वेरीज़ के रूप में भी जाना जाता है।

यह भी देखें

  • स्तर प्राचीन समस्या
  • निम्नतम सामान्य प्राचीन

संदर्भ

  1. 1.0 1.1 Krizanc, Danny; Morin, Pat; Smid, Michiel H. M. (2003). "सूचियों और पेड़ों पर रेंज मोड और रेंज मेडियन क्वेरीज़". ISAAC: 517–526. arXiv:cs/0307034. Bibcode:2003cs........7034K.
  2. Meng, He; Munro, J. Ian; Nicholson, Patrick K. (2011). "रैखिक अंतरिक्ष में गतिशील रेंज चयन". ISAAC: 160–169. arXiv:1106.5076.
  3. Yao, A. C (1982). "रेंज प्रश्नों का उत्तर देने के लिए स्पेस-टाइम ट्रेडऑफ़". E 14th Annual ACM Symposium on the Theory of Computing: 128–136.
  4. Greve, M; J{\o}rgensen, A.; Larsen, K.; Truelsen, J. (2010). "रेंज मोड के लिए सेल जांच निचली सीमाएं और सन्निकटन". Automata, Languages and Programming: 605–616.
  5. Har-Peled, Sariel; Muthukrishnan, S. (2008). "रेंज माध्यिकाएँ". ESA: 503–514.
  6. Blum, M.; Floyd, R. W.; Pratt, V. R.; Rivest, R. L.; Tarjan, R. E. (August 1973). "चयन के लिए समय सीमा" (PDF). Journal of Computer and System Sciences. 7 (4): 448–461. doi:10.1016/S0022-0000(73)80033-9.
  7. 7.0 7.1 7.2 Beat, Gfeller; Sanders, Peter (2009). "इष्टतम रेंज मध्यस्थों की ओर". Icalp (1): 475–486. arXiv:0901.1761.
  8. 8.0 8.1 Bose, P; Kranakis, E.; Morin, P.; Tang, Y. (2005). "अनुमानित रेंज मोड और रेंज माध्यिका प्रश्न". In Proceedings of the 22nd Symposium on Theoretical Aspects of Computer Science (STACS 2005), Volume 3404 of Lecture Notes in ComputerScience: 377–388.
  9. Boyer, Robert S.; Moore, J. Strother (1991), MJRTY—A Fast Majority Vote Algorithm, Automated Reasoning Series, vol. 1, Dordrecht: Springer Netherlands, pp. 105–117, doi:10.1007/978-94-011-3488-0_5, ISBN 978-94-010-5542-0, retrieved 2021-12-18
  10. Misra, J.; Gries, David (November 1982). "दोहराए गए तत्वों को ढूँढना". Science of Computer Programming. 2 (2): 143–152. doi:10.1016/0167-6423(82)90012-0. ISSN 0167-6423.
  11. 11.0 11.1 Karpiński, Marek. आयतों में बारंबार रंगों की खोज. OCLC 277046650.
  12. Gagie, Travis; He, Meng; Munro, J. Ian; Nicholson, Patrick K. (2011), "Finding Frequent Elements in Compressed 2D Arrays and Strings", String Processing and Information Retrieval, Berlin, Heidelberg: Springer Berlin Heidelberg, pp. 295–300, doi:10.1007/978-3-642-24583-1_29, ISBN 978-3-642-24582-4, retrieved 2021-12-18
  13. 13.0 13.1 13.2 Chan, Timothy M.; Durocher, Stephane; Skala, Matthew; Wilkinson, Bryan T. (2012), "Linear-Space Data Structures for Range Minority Query in Arrays", Algorithm Theory – SWAT 2012, Berlin, Heidelberg: Springer Berlin Heidelberg, pp. 295–306, doi:10.1007/978-3-642-31155-0_26, ISBN 978-3-642-31154-3, retrieved 2021-12-20
  14. Sadakane, Kunihiko; Navarro, Gonzalo (2010-01-17). "पूरी तरह कार्यात्मक संक्षिप्त पेड़". Proceedings of the Twenty-First Annual ACM-SIAM Symposium on Discrete Algorithms. Philadelphia, PA: Society for Industrial and Applied Mathematics: 134–149. doi:10.1137/1.9781611973075.13. ISBN 978-0-89871-701-3. S2CID 3189222.
  15. Chan, Timothy M.; Durocher, Stephane; Larsen, Kasper Green; Morrison, Jason; Wilkinson, Bryan T. (2013-03-08). "एरेज़ में रेंज मोड क्वेरी के लिए रैखिक-स्पेस डेटा संरचनाएं". Theory of Computing Systems. 55 (4): 719–741. doi:10.1007/s00224-013-9455-2. ISSN 1432-4350. S2CID 253747004.
  16. 16.0 16.1 16.2 Gagie, Travis; He, Meng; Navarro, Gonzalo; Ochoa, Carlos (September 2020). "वृक्ष पथ बहुसंख्यक डेटा संरचनाएँ". Theoretical Computer Science. 833: 107–119. doi:10.1016/j.tcs.2020.05.039. ISSN 0304-3975.
  17. He, Meng; Munro, J. Ian; Zhou, Gelin (2014-07-08). "बड़े अक्षरों पर संक्षिप्त लेबल वाले सामान्य वृक्षों के लिए एक रूपरेखा". Algorithmica. 70 (4): 696–717. doi:10.1007/s00453-014-9894-4. ISSN 0178-4617. S2CID 253977813.


बाहरी संबंध