सम्मुच्चय आवरक समस्या
सेट कवर समस्या साहचर्य, कंप्यूटर विज्ञान, संचालन अनुसंधान और कम्प्यूटेशनल जटिलता सिद्धांत में एक शास्त्रीय प्रश्न है। यह कार्प की 21 एनपी-पूर्ण समस्याओं में से एक है जिसे 1972 में एनपी-पूर्ण दिखाया गया था।
तत्वों का एक सेट (गणित) दिया गया है {1, 2, …, n} (ब्रह्मांड (गणित) कहा जाता है) और एक संग्रह S का m ऐसे सेट जिनका संघ (सेट सिद्धांत) ब्रह्मांड के बराबर है, सेट कवर समस्या सबसे छोटे उप-संग्रह की पहचान करना है Sजिसका मिलन ब्रह्माण्ड के बराबर है। उदाहरण के लिए, ब्रह्माण्ड पर विचार करें U = {1, 2, 3, 4, 5} और सेट का संग्रह S = { {1, 2, 3}, {2, 4}, {3, 4}, {4, 5} }.स्पष्ट रूप से का मिलन S है U. हालाँकि, हम सभी तत्वों को निम्नलिखित, कम संख्या में सेट के साथ कवर कर सकते हैं: { {1, 2, 3}, {4, 5} }.
अधिक औपचारिक रूप से, एक ब्रह्मांड दिया गया और एक परिवार के उपसमुच्चय , एक आवरण एक उपपरिवार है उन समुच्चयों का जिनका मिलन है . निर्णय समस्या को कवर करने वाले सेट में, इनपुट एक जोड़ी है और एक पूर्णांक ; प्रश्न यह है कि क्या आकार का कोई निर्धारित आवरण है या कम। अनुकूलन समस्या को कवर करने वाले सेट में, इनपुट एक जोड़ी है , और कार्य एक ऐसा सेट कवर ढूंढना है जो सबसे कम सेट का उपयोग करता हो।
सेट कवरिंग का निर्णय संस्करण एनपी-पूर्ण है, और सेट कवर का अनुकूलन/खोज संस्करण एनपी कठिन है।[1] यह एक ऐसी समस्या है जिसके अध्ययन से सन्निकटन एल्गोरिदम के पूरे क्षेत्र के लिए मौलिक तकनीकों का विकास हुआ है।[2] यदि प्रत्येक सेट को एक भार सौंपा गया है, तो यह एक भारित सेट कवर समस्या बन जाती है।
पूर्णांक रैखिक कार्यक्रम सूत्रीकरण
न्यूनतम सेट कवर समस्या को निम्नलिखित पूर्णांक रैखिक कार्यक्रम (ILP) के रूप में तैयार किया जा सकता है।[3]
minimize | (minimize the number of sets) | ||
subject to | for all | (cover every element of the universe) | |
for all . | (every set is either in the set cover or not) |
यह आईएलपी समस्याओं को कवर करने के लिए आईएलपी के अधिक सामान्य वर्ग से संबंधित है। इस ILP का रैखिक प्रोग्रामिंग विश्राम#अनुमान और अभिन्नता अंतर अधिकतम है . यह दिखाया गया है कि इसकी रैखिक प्रोग्रामिंग छूट वास्तव में एक कारक देती है- न्यूनतम सेट कवर समस्या के लिए सन्निकटन एल्गोरिदम (जहाँ ब्रह्मांड का आकार है)।[4] भारित सेट कवर में, सेट को वजन दिया जाता है। सेट के वजन को निरूपित करें द्वारा . फिर भारित सेट कवर का वर्णन करने वाला पूर्णांक रैखिक कार्यक्रम ऊपर दिए गए के समान है, सिवाय इसके कि न्यूनतम करने का उद्देश्य कार्य है .
हिटिंग सेट फॉर्मूलेशन
सेट कवरिंग हिटिंग सेट समस्या के बराबर है। यह देखने से पता चलता है कि सेट कवरिंग कैन का एक उदाहरण है इसे एक मनमाना द्विदलीय ग्राफ के रूप में देखा जा सकता है, जिसमें ब्रह्मांड को बाईं ओर शीर्षों द्वारा दर्शाया गया है, सेटों को शीर्षों द्वारा दर्शाया गया है दाईं ओर, और किनारे सेट में तत्वों को शामिल करने का प्रतिनिधित्व करते हैं। फिर कार्य दाएं-शीर्षों का एक न्यूनतम कार्डिनैलिटी उपसमुच्चय ढूंढना है जो सभी बाएं-शीर्षों को कवर करता है, जो वास्तव में हिटिंग सेट समस्या है।
लालची एल्गोरिदम
सेट कवरिंग के बहुपद समय सन्निकटन के लिए एक लालची एल्गोरिदम है जो एक नियम के अनुसार सेट चुनता है: प्रत्येक चरण में, वह सेट चुनें जिसमें सबसे बड़ी संख्या में शामिल न हों। सेट को प्राथमिकता देने के लिए बकेट कतार का उपयोग करके, इस पद्धति को इनपुट सेट के आकार के योग में समय रैखिक में लागू किया जा सकता है।[5] यह का अनुमानित अनुपात प्राप्त करता है , कहाँ कवर किए जाने वाले सेट का आकार है.[6] दूसरे शब्दों में, यह एक ऐसा आवरण ढूंढ लेता है जो हो सकता है न्यूनतम एक से गुना बड़ा, जहाँ है -वें हार्मोनिक संख्या:
एक मानक उदाहरण है जिस पर लालची एल्गोरिदम अनुमानित अनुपात प्राप्त करता है .
ब्रह्माण्ड से मिलकर बना है तत्व. सेट प्रणाली में शामिल हैं जोड़ीवार असंयुक्त सेट
आकार के साथ क्रमशः, साथ ही दो अतिरिक्त असंयुक्त सेट ,
जिनमें से प्रत्येक में आधे-आधे तत्व शामिल हैं . इस इनपुट पर, लालची एल्गोरिदम सेट लेता है , उस क्रम में, जबकि इष्टतम समाधान में केवल शामिल हैं और . ऐसे इनपुट का एक उदाहरण दाईं ओर चित्रित है.
अनुपयुक्तता परिणाम दर्शाते हैं कि लालची एल्गोरिदम अनिवार्य रूप से निचले क्रम की शर्तों तक सेट कवर के लिए सर्वोत्तम-संभव बहुपद समय सन्निकटन एल्गोरिदम है। (प्रशंसनीय जटिलता धारणाओं के तहत, सेट कवर समस्या # अनुपयुक्तता परिणाम नीचे देखें)। लालची एल्गोरिथ्म के लिए एक सख्त विश्लेषण से पता चलता है कि सन्निकटन अनुपात बिल्कुल सही है .[8]
कम आवृत्ति प्रणाली
यदि प्रत्येक तत्व अधिकतम में होता है f सेट करता है, तो बहुपद समय में एक समाधान पाया जा सकता है जो कि एक कारक के भीतर इष्टतम का अनुमान लगाता है f रैखिक प्रोग्रामिंग विश्राम का उपयोग करना।
यदि बाधा द्वारा प्रतिस्थापित किया जाता है सभी के लिए S में पूर्णांक रैखिक कार्यक्रम में #पूर्णांक रैखिक कार्यक्रम सूत्रीकरण दिखाया गया है, तो यह एक (गैर-पूर्णांक) रैखिक कार्यक्रम बन जाता है L. एल्गोरिथ्म को इस प्रकार वर्णित किया जा सकता है:
- एक इष्टतम समाधान खोजें O कार्यक्रम के लिए L रैखिक कार्यक्रमों को हल करने के लिए कुछ बहुपद-समय पद्धति का उपयोग करना।
- सभी सेट चुनें S जिसके लिए संगत चर xS इसका मूल्य कम से कम 1/ हैf समाधान में O.[9]
अनुपयुक्तता परिणाम
कब ब्रह्माण्ड के आकार को दर्शाता है, Lund & Yannakakis (1994) ने दिखाया कि सेट कवरिंग को बहुपद समय में एक कारक के भीतर अनुमानित नहीं किया जा सकता है , जब तक कि एनपी में अर्ध-बहुपद समय एल्गोरिदम न हो। उरीएल फीगे (1998) ने इस निचली सीमा में सुधार किया समान धारणाओं के तहत, जो अनिवार्य रूप से लालची एल्गोरिथ्म द्वारा प्राप्त सन्निकटन अनुपात से मेल खाता है। Raz & Safra (1997) एक निचली सीमा स्थापित की का , कहाँ एक निश्चित स्थिरांक है, इस कमज़ोर धारणा के तहत कि Pएन.पी. के उच्च मूल्य के साथ एक समान परिणाम द्वारा हाल ही में सिद्ध किया गया Alon, Moshkovitz & Safra (2006). Dinur & Steurer (2013) ने यह साबित करके इष्टतम अनुपयुक्तता दिखाई कि इसका अनुमान नहीं लगाया जा सकता जब तक पीई.जी.
भारित सेट कवर
This section needs expansion. You can help by adding to it. (November 2017) |
रैखिक प्रोग्रामिंग विश्राम भारित सेट कवर के लिए पूर्णांक रैखिक कार्यक्रम में कहा गया है # पूर्णांक रैखिक कार्यक्रम सूत्रीकरण, कोई भी प्राप्त करने के लिए यादृच्छिक गोलाई का उपयोग कर सकता है -कारक सन्निकटन. गैर भारित सेट कवर को भारित केस के अनुसार अनुकूलित किया जा सकता है।[10]
संबंधित समस्याएँ
- हिटिंग सेट, सेट कवर का समतुल्य पुनर्रचना है।
- वर्टेक्स कवर समस्या हिटिंग सेट का एक विशेष मामला है।
- एज कवर समस्या सेट कवर का एक विशेष मामला है।
- ज्यामितीय सेट कवर समस्या सेट कवर का एक विशेष मामला है जब ब्रह्मांड बिंदुओं का एक सेट होता है और सेट ब्रह्मांड और ज्यामितीय आकृतियों (जैसे, डिस्क, आयत) के प्रतिच्छेदन से प्रेरित होते हैं।
- पैकिंग सेट करें
- अधिकतम कवरेज समस्या अधिक से अधिक तत्वों को कवर करने के लिए अधिकतम k सेट चुनना है।
- डोमिनेटिंग सेट एक ग्राफ़ में शीर्षों के एक सेट (डोमिनेटिंग सेट) को इस प्रकार चुनने की समस्या है कि अन्य सभी शीर्ष सेट पर दबदबा में कम से कम एक शीर्ष के निकट हों। डोमिनेटिंग सेट समस्या को सेट कवर से कमी के माध्यम से एनपी पूर्ण दिखाया गया था।
- सटीक कवर समस्या एक ऐसे सेट कवर को चुनना है जिसमें एक से अधिक कवरिंग सेट में कोई तत्व शामिल न हो।
- लाल नीला सेट कवर।[11]
- सेट-कवर अपहरण.
टिप्पणियाँ
- ↑ Korte & Vygen 2012, p. 414.
- ↑ Vazirani (2001, p. 15)
- ↑ Vazirani (2001, p. 108)
- ↑ Vazirani (2001, pp. 110–112)
- ↑ Cormen, Thomas H.; Leiserson, Charles E.; Rivest, Ronald L.; Stein, Clifford (2009) [1990], "Exercise 35.3-3", Introduction to Algorithms (3rd ed.), MIT Press and McGraw-Hill, p. 1122, ISBN 0-262-03384-4
- ↑ Chvatal, V. A Greedy Heuristic for the Set-Covering Problem. Mathematics of Operations Research Vol. 4, No. 3 (Aug., 1979), pp. 233-235
- ↑ Karpinski & Zelikovsky 1998
- ↑ Slavík Petr A tight analysis of the greedy algorithm for set cover. STOC'96, Pages 435-441, doi:10.1145/237814.237991
- ↑ Vazirani (2001, pp. 118–119)
- ↑ Vazirani (2001, Chapter 14)
- ↑ Information., Sandia National Laboratories. United States. Department of Energy. United States. Department of Energy. Office of Scientific and Technical (1999). लाल-नीले सेट कवर समस्या पर।. United States. Dept. of Energy. OCLC 68396743.
संदर्भ
- Alon, Noga; Moshkovitz, Dana; Safra, Shmuel (2006), "Algorithmic construction of sets for k-restrictions", ACM Trans. Algorithms, 2 (2): 153–177, CiteSeerX 10.1.1.138.8682, doi:10.1145/1150334.1150336, ISSN 1549-6325, S2CID 11922650.
- Cormen, Thomas H.; Leiserson, Charles E.; Rivest, Ronald L.; Stein, Clifford (2001), Introduction to Algorithms, Cambridge, Mass.: MIT Press and McGraw-Hill, pp. 1033–1038, ISBN 978-0-262-03293-3
- Feige, Uriel (1998), "A threshold of ln n for approximating set cover", Journal of the ACM, 45 (4): 634–652, CiteSeerX 10.1.1.70.5014, doi:10.1145/285055.285059, ISSN 0004-5411, S2CID 52827488.
- Karpinski, Marek; Zelikovsky, Alexander (1998), "Approximating dense cases of covering problems", Proceedings of the DIMACS Workshop on Network Design: Connectivity and Facilities Location, vol. 40, pp. 169–178, ISBN 9780821870846
- Lund, Carsten; Yannakakis, Mihalis (1994), "On the hardness of approximating minimization problems", Journal of the ACM, 41 (5): 960–981, doi:10.1145/185675.306789, ISSN 0004-5411, S2CID 9021065.
- Raz, Ran; Safra, Shmuel (1997), "A sub-constant error-probability low-degree test, and a sub-constant error-probability PCP characterization of NP", STOC '97: Proceedings of the twenty-ninth annual ACM symposium on Theory of computing, ACM, pp. 475–484, ISBN 978-0-89791-888-6.
- Dinur, Irit; Steurer, David (2013), "Analytical approach to parallel repetition", STOC '14: Proceedings of the forty-sixth annual ACM symposium on Theory of computing, ACM, pp. 624–633.
- Vazirani, Vijay V. (2001), Approximation Algorithms (PDF), Springer-Verlag, ISBN 978-3-540-65367-7
- Korte, Bernhard; Vygen, Jens (2012), Combinatorial Optimization: Theory and Algorithms (5 ed.), Springer, ISBN 978-3-642-24487-2
- Cardoso, Nuno; Abreu, Rui (2014), "An Efficient Distributed Algorithm for Computing Minimal Hitting Sets" (PDF), Proceedings of the 25th International Workshop on Principles of Diagnosis, Graz, Austria, doi:10.5281/zenodo.10037
{{citation}}
: CS1 maint: location missing publisher (link)