मैट्रिक्स पूर्णता: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
[[File:Rank-1-matrix-completion.png|thumbnail|रैंक-1 के साथ आंशिक रूप से प्रकट 5x5 आव्यूह का आव्यूह समापन। बाएँ: अपूर्ण आव्यूह का अवलोकन किया गया; दाएं: आव्यूह पूर्णता परिणाम.|440x440px]]'''आव्यूह पूर्णता''' आंशिक रूप से देखे गए आव्यूह की लुप्त प्रविष्टियों को | [[File:Rank-1-matrix-completion.png|thumbnail|रैंक-1 के साथ आंशिक रूप से प्रकट 5x5 आव्यूह का आव्यूह समापन। बाएँ: अपूर्ण आव्यूह का अवलोकन किया गया; दाएं: आव्यूह पूर्णता परिणाम.|440x440px]]'''आव्यूह पूर्णता''' आंशिक रूप से देखे गए आव्यूह की लुप्त प्रविष्टियों को एकत्रित करने का कार्य है, जो आंकड़ों में डेटा प्रतिरूपण (सांख्यिकी) करने के समान है। डेटासमुच्चय की विस्तृत श्रृंखला स्वाभाविक रूप से आव्यूह रूप में व्यवस्थित होती है। उदाहरण मूवी-रेटिंग आव्यूह है, जैसा कि [[नेटफ्लिक्स पुरस्कार|नेटफ्लिक्स प्रॉब्लम]] में दिखाई देता है: रेटिंग आव्यूह दिया जाता है जिसमें प्रत्येक प्रविष्टि <math>(i,j) </math> ग्राहक <math>i</math> द्वारा मूवी <math>j</math> की रेटिंग का प्रतिनिधित्व करती है, यदि ग्राहक <math>i</math> मूवी <math>j</math> ने देखा है जो कि विलुप्त है, हम ग्राहकों को आगे क्या देखना है इसके बारे में अच्छी सिफारिशें करने के लिए शेष प्रविष्टियों की भविष्यवाणी करना चाहेंगे। अन्य उदाहरण डाक्यूमेंट्स -शब्द आव्यूह है: डाक्यूमेंट्स के संग्रह में उपयोग किए गए शब्दों की आवृत्तियों को आव्यूह के रूप में दर्शाया जा सकता है, जहां प्रत्येक प्रविष्टि संकेतित डाक्यूमेंट्स में संबंधित शब्द के प्रकट होने की संख्या से मेल खाती है। | ||
उदाहरण के लिए, कोई यह मान सकता है कि आव्यूह में निम्न-रैंक संरचना है, और फिर निम्नतम [[रैंक (रैखिक बीजगणित)]] आव्यूह खोजने की प्रयास करें या, यदि पूर्ण आव्यूह की रैंक ज्ञात है, तो रैंक का आव्यूह (रैखिक बीजगणित) <math>r</math> है जो ज्ञात प्रविष्टियों से मेल खाता है। चित्रण से पता चलता है कि आंशिक रूप से प्रकट रैंक -1 आव्यूह (बाईं ओर) को शून्य-त्रुटि (दाहिनी ओर) के साथ पूरा किया जा सकता है क्योंकि लापता प्रविष्टियों वाली सभी पंक्तियाँ तीसरी पंक्ति के समान होनी चाहिए। नेटफ्लिक्स समस्या के स्तिथियाँ में रेटिंग आव्यूह निम्न-रैंक होने की अपेक्षित है क्योंकि उपयोगकर्ता की प्राथमिकताओं को अधिकांशतः कुछ कारकों द्वारा वर्णित किया जा सकता है, जैसे कि फिल्म की शैली और रिलीज का समय अन्य अनुप्रयोगों में कंप्यूटर विज़न सम्मिलित है, जहां छवियों में विलुप्त पिक्सेल को फिर से बनाने की आवश्यकता होती है, आंशिक दूरी की जानकारी से नेटवर्क में सेंसर की वैश्विक स्थिति का पता लगाना और मल्टीक्लास वर्गीकरण आव्यूह पूर्णता समस्या सामान्य रूप से [[ एनपी कठिन |एनपी | पूर्ण आव्यूह में स्वतंत्रता की डिग्री की संख्या पर किसी भी प्रतिबंध के बिना यह समस्या [[अनिर्धारित प्रणाली]] है क्योंकि छिपी हुई प्रविष्टियों को इच्छानुसार मान दिए जा सकते हैं। इस प्रकार हमें [[अच्छी तरह से प्रस्तुत समस्या|वेल-पोस्ड समस्या]] बनाने के लिए आव्यूह पर कुछ धारणा की आवश्यकता होती है, जैसे कि यह मान लेना कि इसमें अधिकतम निर्धारक है, या तो धनात्मक निश्चित है, या तो निम्न-रैंक है।<ref name="johnson" /><ref name="laurent" /> | ||
उदाहरण के लिए, कोई यह मान सकता है कि आव्यूह में निम्न-रैंक संरचना है, और फिर निम्नतम [[रैंक (रैखिक बीजगणित)]] आव्यूह खोजने की प्रयास करें या, यदि पूर्ण आव्यूह की रैंक ज्ञात है, तो रैंक का आव्यूह (रैखिक बीजगणित) <math>r</math> है जो ज्ञात प्रविष्टियों से मेल खाता है। चित्रण से पता चलता है कि आंशिक रूप से प्रकट रैंक -1 आव्यूह (बाईं ओर) को शून्य-त्रुटि (दाहिनी ओर) के साथ पूरा किया जा सकता है क्योंकि लापता प्रविष्टियों वाली सभी पंक्तियाँ तीसरी पंक्ति के समान होनी चाहिए। नेटफ्लिक्स समस्या के स्तिथियाँ में रेटिंग आव्यूह निम्न-रैंक होने की अपेक्षित है क्योंकि उपयोगकर्ता की प्राथमिकताओं को अधिकांशतः कुछ कारकों द्वारा वर्णित किया जा सकता है, जैसे कि फिल्म की शैली और रिलीज का समय अन्य अनुप्रयोगों में कंप्यूटर विज़न सम्मिलित है, जहां छवियों में विलुप्त पिक्सेल को फिर से बनाने की आवश्यकता होती है, आंशिक दूरी की जानकारी से नेटवर्क में सेंसर की वैश्विक स्थिति का पता लगाना और मल्टीक्लास वर्गीकरण आव्यूह पूर्णता समस्या सामान्य रूप से [[ एनपी कठिन |एनपी हार्ड]] है, किन्तु अतिरिक्त मान्यताओं के तहत कुशल एल्गोरिदम हैं जो उच्च संभावना के साथ स्पष्ट पुनर्निर्माण प्राप्त करते हैं। | |||
सांख्यिकीय सीखने के दृष्टिकोण से, आव्यूह पूर्णता समस्या [[मैट्रिक्स नियमितीकरण|आव्यूह नियमितीकरण]] का अनुप्रयोग है जो सदिश [[नियमितीकरण (गणित)]] का सामान्यीकरण है। उदाहरण के लिए, निम्न-रैंक आव्यूह पूर्णता समस्या में कोई परमाणु मानदंड <math>R(X) = \lambda\|X\|_* </math> का रूप लेते हुए नियमितीकरण जुर्माना प्रयुक्त कर सकता है | सांख्यिकीय सीखने के दृष्टिकोण से, आव्यूह पूर्णता समस्या [[मैट्रिक्स नियमितीकरण|आव्यूह नियमितीकरण]] का अनुप्रयोग है जो सदिश [[नियमितीकरण (गणित)]] का सामान्यीकरण है। उदाहरण के लिए, निम्न-रैंक आव्यूह पूर्णता समस्या में कोई परमाणु मानदंड <math>R(X) = \lambda\|X\|_* </math> का रूप लेते हुए नियमितीकरण जुर्माना प्रयुक्त कर सकता है | ||
Line 13: | Line 14: | ||
== निम्न रैंक आव्यूह पूर्णता == | == निम्न रैंक आव्यूह पूर्णता == | ||
आव्यूह पूर्णता समस्या के प्रकारों में से निम्नतम रैंक (रैखिक बीजगणित) आव्यूह <math>X</math> को ढूंढना है जो आव्यूह <math>M</math> से मेल खाता है, जिसे हम समुच्चय <math>E</math> में सभी | आव्यूह पूर्णता समस्या के प्रकारों में से निम्नतम रैंक (रैखिक बीजगणित) आव्यूह <math>X</math> को ढूंढना है जो आव्यूह <math>M</math> से मेल खाता है, जिसे हम समुच्चय <math>E</math> में सभी देखी गई प्रविष्टियों के लिए पुनर्प्राप्त करना चाहते हैं इस समस्या का गणितीय सूत्रीकरण इस प्रकार है: | ||
:<math>\begin{align} | :<math>\begin{align} | ||
& \underset{X}{\text{min}} & \text{rank} (X) \\ | & \underset{X}{\text{min}} & \text{rank} (X) \\ | ||
Line 20: | Line 21: | ||
कैंडेस और रेख्त<ref name="candesrecht" /> सिद्ध हुआ कि प्रेक्षित प्रविष्टियों के नमूने और पर्याप्त रूप से अनेक नमूना प्रविष्टियों पर धारणाओं के साथ इस समस्या का उच्च संभावना वाला अनूठा समाधान है। | कैंडेस और रेख्त<ref name="candesrecht" /> सिद्ध हुआ कि प्रेक्षित प्रविष्टियों के नमूने और पर्याप्त रूप से अनेक नमूना प्रविष्टियों पर धारणाओं के साथ इस समस्या का उच्च संभावना वाला अनूठा समाधान है। | ||
ऐसा समतुल्य सूत्रीकरण, यह देखते हुए कि आव्यूह <math>M</math> पुनर्प्राप्त किया जाना रैंक (रैखिक बीजगणित) <math>r</math> के रूप में जाना जाता है, जहाँ <math>X</math> के लिए हल करना है | ऐसा समतुल्य सूत्रीकरण, यह देखते हुए कि आव्यूह <math>M</math> पुनर्प्राप्त किया जाना रैंक (रैखिक बीजगणित) <math>r</math> के रूप में जाना जाता है, जहाँ <math>X</math> के लिए हल करना है <math>X_{ij} = M_{ij} \;\; \forall i,j \in E </math> | ||
=== धारणाएँ === | === धारणाएँ === | ||
Line 26: | Line 27: | ||
==== प्रेक्षित प्रविष्टियों का एकसमान नमूना ==== | ==== प्रेक्षित प्रविष्टियों का एकसमान नमूना ==== | ||
विश्लेषण को सुव्यवस्थित बनाने के लिए, अधिकांशतः यह मान लिया जाता है कि समुच्चय <math>E</math> देखी गई प्रविष्टियों और निश्चित [[प्रमुखता]] को कार्डिनैलिटी <math>|E| </math> की प्रविष्टियों के सभी सबसमुच्चय के संग्रह से यादृच्छिक रूप से समान रूप से नमूना लिया जाता है . विश्लेषण को और सरल बनाने के लिए, इसके अतिरिक्त यह मान लिया गया है कि <math>E</math> [[बर्नौली नमूनाकरण]] द्वारा निर्मित किया गया है, अर्थात प्रत्येक प्रविष्टि को संभाव्यता <math> p </math> के साथ देखा जाता है. यदि | विश्लेषण को सुव्यवस्थित बनाने के लिए, अधिकांशतः यह मान लिया जाता है कि समुच्चय <math>E</math> देखी गई प्रविष्टियों और निश्चित [[प्रमुखता]] को कार्डिनैलिटी <math>|E| </math> की प्रविष्टियों के सभी सबसमुच्चय के संग्रह से यादृच्छिक रूप से समान रूप से नमूना लिया जाता है . विश्लेषण को और सरल बनाने के लिए, इसके अतिरिक्त यह मान लिया गया है कि <math>E</math> [[बर्नौली नमूनाकरण]] द्वारा निर्मित किया गया है, अर्थात प्रत्येक प्रविष्टि को संभाव्यता <math> p </math> के साथ देखा जाता है. यदि <math>p</math> को <math>\frac{N}{mn}</math> इसके लिए समुच्चय है जहाँ <math>N</math>, <math>E</math> की वांछित अपेक्षित कार्डिनैलिटी है, और <math>m,\;n</math> आव्यूह के आयाम हैं (मान लीजिए <math>m < n</math> व्यापकता के नुकसान के बिना), <math>|E|</math> उच्च संभावना के साथ <math>N</math> के <math>O(n \log n)</math> के अंदर है, इस प्रकार बर्नौली नमूनाकरण एकसमान नमूने के लिए अच्छा सन्निकटन है।<ref name="candesrecht" /> और सरलीकरण यह मान लेना है कि प्रविष्टियाँ स्वतंत्र रूप से और प्रतिस्थापन के साथ नमूनाकृत की जाती हैं।<ref name="recht" /> | ||
==== प्रेक्षित प्रविष्टियों की संख्या की निचली सीमा ==== | ==== प्रेक्षित प्रविष्टियों की संख्या की निचली सीमा ==== | ||
मान लीजिए कि | मान लीजिए कि <math>m</math> द्वारा <math>n</math> आव्यूह <math>M</math> (साथ <math>m < n</math>) जिसे हम (रैखिक बीजगणित) पुनर्प्राप्त करने का प्रयास कर रहे हैं उसकी रैंक <math>r</math> है। यदि <math>M</math> को विशिष्ट रूप से पुनर्निर्मित करने से पहले कितनी प्रविष्टियों को देखा जाना चाहिए, इस पर एक सूचना सैद्धांतिक निचली सीमा है। जहाँ <math>r</math> से कम या उसके समान रैंक वाले <math>n</math> आव्यूहों द्वारा <math>m</math> का समुच्चय <math>{\mathbb C}^{m\times n}</math> आयाम <math>(n+m)r - r^2</math> के साथ एक बीजगणितीय किस्म है। इस परिणाम का उपयोग करके, कोई यह दिखा सकता है कि <math> r \leq n/2 </math> होने पर अद्वितीय समाधान प्राप्त करने के लिए <math> {\mathbb C}^{n \times n} </math> में आव्यूह पूर्णता के लिए कम से कम <math>4nr - 4r^2</math> प्रविष्टियाँ देखी जानी चाहिए<ref name = "xu"/> | ||
दूसरे, प्रति पंक्ति और स्तंभ में कम से कम प्रेक्षित प्रविष्टि <math>M</math> होनी चाहिए . <math>M</math> का एकवचन मान अपघटन <math>U\Sigma V^\dagger </math> द्वारा दिया गया है यदि पंक्ति <math>i</math> अप्राप्य है, इसे देखना आसान है तथा | दूसरे, प्रति पंक्ति और स्तंभ में कम से कम प्रेक्षित प्रविष्टि <math>M</math> होनी चाहिए . <math>M</math> का एकवचन मान अपघटन <math>U\Sigma V^\dagger </math> द्वारा दिया गया है यदि पंक्ति <math>i</math> अप्राप्य है, इसे देखना आसान है तथा <math>i^{\text{th}}</math> का दायां एकवचन सदिश <math>M</math> है, और <math>v_i</math> का कुछ इच्छानुसार मान में बदला जा सकता है और फिर भी आव्यूह मिलान प्राप्त हो सकता है इसी प्रकार, <math>M</math> प्रेक्षित प्रविष्टियों के समुच्चय पर यदि स्तम्भ <math>j</math> अवलोकित <math>j^{\text{th}}</math> है, <math>M</math> का बायां एकवचन सदिश <math>u_i</math> इच्छानुसार हो सकता है. यदि हम प्रेक्षित प्रविष्टियों के समुच्चय का बर्नौली नमूनाकरण मानते हैं, तो कूपन कलेक्टर की समस्या का तात्पर्य है कि प्रविष्टियाँ के क्रम पर <math>O(n\log n)</math> होता है यह सुनिश्चित करने के लिए अवश्य देखा जाना चाहिए कि उच्च संभावना के साथ प्रत्येक पंक्ति और स्तंभ से अवलोकन हो।<ref name="candestao" /> | ||
आवश्यक नियमों को संयोजित करना और यह मान लेना कि <math>r \ll m, n</math> (अनेक व्यावहारिक अनुप्रयोगों के लिए वैध धारणा), आव्यूह पूर्णता की समस्या को कम निर्धारित होने से रोकने के लिए आवश्यक देखी गई प्रविष्टियों की संख्या की निचली सीमा <math>nr\log n </math> के क्रम पर होती है | | आवश्यक नियमों को संयोजित करना और यह मान लेना कि <math>r \ll m, n</math> (अनेक व्यावहारिक अनुप्रयोगों के लिए वैध धारणा), आव्यूह पूर्णता की समस्या को कम निर्धारित होने से रोकने के लिए आवश्यक देखी गई प्रविष्टियों की संख्या की निचली सीमा <math>nr\log n </math> के क्रम पर होती है | | ||
====असंगति ==== | ====असंगति ==== | ||
संपीडित संवेदन में असंगति की अवधारणा उत्पन्न हुई। इसे एकवचन सदिश सुनिश्चित करने के लिए आव्यूह पूर्णता के संदर्भ में <math>M</math> प्रस्तुत किया गया है इस अर्थ में बहुत विरल नहीं हैं कि प्रत्येक एकवचन सदिश के सभी निर्देशांक तुलनीय परिमाण के होते हैं, न कि केवल कुछ निर्देशांक जिनमें काफी बड़े परिमाण होते हैं।<ref name="tao" /><ref name="nguyenkimshim" /> मानक आधार सदिश तब एकवचन सदिश और सदिश के रूप में अवांछनीय होते हैं और | संपीडित संवेदन में असंगति की अवधारणा उत्पन्न हुई। इसे एकवचन सदिश सुनिश्चित करने के लिए आव्यूह पूर्णता के संदर्भ में <math>M</math> प्रस्तुत किया गया है इस अर्थ में बहुत विरल नहीं हैं कि प्रत्येक एकवचन सदिश के सभी निर्देशांक तुलनीय परिमाण के होते हैं, न कि केवल कुछ निर्देशांक जिनमें काफी बड़े परिमाण होते हैं।<ref name="tao" /><ref name="nguyenkimshim" /> मानक आधार सदिश तब एकवचन सदिश और सदिश के रूप में अवांछनीय होते हैं और <math>\mathbb{R}^n</math> में सदिश <math> \frac{1}{\sqrt{n}} \begin{bmatrix} 1 \\ 1 \\ \vdots \\ 1 \end{bmatrix} </math>वांछनीय है। यदि एकवचन सदिश पर्याप्त रूप से विरल हों तो क्या असत्य हो सकता है, इसके उदाहरण के रूप में, एकवचन मान अपघटन <math>I_m \begin{bmatrix} 1 & 0 & \cdots & 0 \\ \vdots & & \vdots \\ 0 & 0 & 0 & 0 \end{bmatrix} I_n</math> के साथ <math>m</math> द्वारा <math>n</math> आव्यूह <math>\begin{bmatrix} 1 & 0 & \cdots & 0 \\ \vdots & & \vdots \\ 0 & 0 & 0 & 0 \end{bmatrix}</math> इस पर विचार करें तथा इसका पुनर्निर्माण करने से पहले <math>M</math> की लगभग सभी प्रविष्टियाँ इसका नमूना लिया जाना चाहिए। | ||
कैंडेस और रेख्त<ref name="candesrecht" /> आव्यूह <math>U</math> की सुसंगतता को [[स्तंभ स्थान|स्तम्भ स्थान]] के साथ <math>\mu (U) = \frac{n}{r} \max_{i < n} \|P_U e_i\|^2 </math> <math>r-</math>का आयामी उप-स्थान <math>\mathbb{R}^n</math> के रूप में परिभाषित करते है जैसा <math>P_U</math>, <math> U </math> ओर्थोगोनल प्रोजेक्शन (गणित) है. असंगतता तब प्रस्तुत करती है कि <math>n</math> आव्यूह <math>M</math> द्वारा <math>m</math> का एकवचन मान अपघटन <math>U\Sigma V^\dagger</math> दिया गया है, | |||
कैंडेस और रेख्त<ref name="candesrecht" /> | |||
# <math>\mu (U), \; \mu (V) \leq \mu_0 </math> | # <math>\mu (U), \; \mu (V) \leq \mu_0 </math> | ||
Line 56: | Line 56: | ||
<math> P_\Omega(Y) = P_\Omega(M) + P_\Omega(Z), </math> | <math> P_\Omega(Y) = P_\Omega(M) + P_\Omega(Z), </math> | ||
जहाँ | जहाँ <math>Z</math> <math>n \times n</math> आव्यूह है जिसमें <math>(i,j) \in \Omega</math> के लिए प्रविष्टियाँ <math>Z_{ij}</math> हैं, यह मानते हुए कि कुछ <math>\delta > 0 </math> के लिए <math>\|P_\Omega(Z)\|_F\leq\delta </math>। अपूर्ण आव्यूह को पुनर्प्राप्त करने के लिए, हम निम्नलिखित अनुकूलन समस्या को हल करने का प्रयास करते हैं: | ||
<math> | <math> | ||
Line 76: | Line 76: | ||
सामान्यतः उच्च रैंक वाले आव्यूह पूर्णता [[ एनपी हार्ड |एनपी हार्ड]] है। चूँकि, कुछ मान्यताओं के साथ, कुछ अधूरे उच्च रैंक आव्यूह या यहाँ तक कि पूर्ण रैंक आव्यूह को भी पूरा किया जा सकता है। | सामान्यतः उच्च रैंक वाले आव्यूह पूर्णता [[ एनपी हार्ड |एनपी हार्ड]] है। चूँकि, कुछ मान्यताओं के साथ, कुछ अधूरे उच्च रैंक आव्यूह या यहाँ तक कि पूर्ण रैंक आव्यूह को भी पूरा किया जा सकता है। | ||
एरिक्सन, बाल्ज़ानो और नोवाक <ref name="erikssonbalzano" /> ने आव्यूह को पूरा करने की समस्या पर इस धारणा के साथ विचार किया है कि आव्यूह के स्तम्भ अनेक निम्न-रैंक उप-स्थानों के संघ से संबंधित हैं। चूंकि स्तम्भ उप-स्थानों के संघ से संबंधित हैं, इसलिए समस्या को क्लस्टरिंग उच्च-आयामी डेटा समस्या के लापता-डेटा संस्करण के रूप में देखा जा सकता है। मान लीजिये <math>X</math> सेम <math>n \times N</math> आव्यूह है जिसके (पूर्ण) स्तम्भ अधिक से अधिक <math>k</math> उप-स्थान के संघ में स्थित हैं प्रत्येक <math>rank \leq r < n</math>, और <math>N \gg kn</math> मान लीजिये . एरिक्सन, बाल्ज़ानो और नोवाक <ref name="erikssonbalzano" /> दिखाया गया है कि हल्की धारणाओं के तहत प्रत्येक स्तम्भ <math>X</math> कम से कम लंबे समय तक अपूर्ण संस्करण से उच्च संभावना के साथ पूरी तरह से पुनर्प्राप्त किया जा सकता है जब तक <math>X</math> कि की कम से कम <math>CrN\log^2(n) </math> की प्रविष्टियाँ <math>C>1</math> यादृच्छिक रूप से समान रूप से देखे जाते हैं | एरिक्सन, बाल्ज़ानो और नोवाक <ref name="erikssonbalzano" /> ने आव्यूह को पूरा करने की समस्या पर इस धारणा के साथ विचार किया है कि आव्यूह के स्तम्भ अनेक निम्न-रैंक उप-स्थानों के संघ से संबंधित हैं। चूंकि स्तम्भ उप-स्थानों के संघ से संबंधित हैं, इसलिए समस्या को क्लस्टरिंग उच्च-आयामी डेटा समस्या के लापता-डेटा संस्करण के रूप में देखा जा सकता है। मान लीजिये <math>X</math> सेम <math>n \times N</math> आव्यूह है जिसके (पूर्ण) स्तम्भ अधिक से अधिक <math>k</math> उप-स्थान के संघ में स्थित हैं प्रत्येक <math>rank \leq r < n</math>, और <math>N \gg kn</math> मान लीजिये . एरिक्सन, बाल्ज़ानो और नोवाक <ref name="erikssonbalzano" /> दिखाया गया है कि हल्की धारणाओं के तहत प्रत्येक स्तम्भ <math>X</math> कम से कम लंबे समय तक अपूर्ण संस्करण से उच्च संभावना के साथ पूरी तरह से पुनर्प्राप्त किया जा सकता है जब तक <math>X</math> कि की कम से कम <math>CrN\log^2(n) </math> की प्रविष्टियाँ <math>C>1</math> यादृच्छिक रूप से समान रूप से देखे जाते हैं सामान्य असंगति स्थितियों, उप-स्थानों की ज्यामितीय व्यवस्था और उप-स्थानों पर स्तंभों के वितरण के आधार पर स्थिरांक होता है | | ||
एल्गोरिदम में अनेक चरण सम्मिलित हैं: (1) स्थानीय नेबरहुड ; (2) स्थानीय उपस्थान; (3) उपस्थान परिशोधन; (4) पूर्ण आव्यूह पूर्णता। इस पद्धति को इंटरनेट दूरी आव्यूह पूर्णता और टोपोलॉजी पहचान पर प्रयुक्त किया जा सकता है। | एल्गोरिदम में अनेक चरण सम्मिलित हैं: (1) स्थानीय नेबरहुड ; (2) स्थानीय उपस्थान; (3) उपस्थान परिशोधन; (4) पूर्ण आव्यूह पूर्णता। इस पद्धति को इंटरनेट दूरी आव्यूह पूर्णता और टोपोलॉजी पहचान पर प्रयुक्त किया जा सकता है। | ||
Line 82: | Line 82: | ||
== निम्न-रैंक आव्यूह समापन के लिए एल्गोरिदम == | == निम्न-रैंक आव्यूह समापन के लिए एल्गोरिदम == | ||
विभिन्न आव्यूह पूर्णता एल्गोरिदम प्रस्तावित किए गए हैं।<ref name="nguyenkimshim" /> इनमें उत्तल विश्राम-आधारित एल्गोरिदम सम्मिलित है,<ref name="candesrecht" /> ग्रेडिएंट-आधारित एल्गोरिदम,<ref name="keshavan" /> और वैकल्पिक न्यूनतमकरण-आधारित एल्गोरिदम।<ref name="jainnetrapalli" /> | विभिन्न आव्यूह पूर्णता एल्गोरिदम प्रस्तावित किए गए हैं।<ref name="nguyenkimshim" /> इनमें उत्तल विश्राम-आधारित एल्गोरिदम सम्मिलित है,<ref name="candesrecht" /> ग्रेडिएंट-आधारित एल्गोरिदम,<ref name="keshavan" /> और वैकल्पिक न्यूनतमकरण-आधारित एल्गोरिदम।<ref name="jainnetrapalli" /> | ||
=== उत्तल विश्राम === | === उत्तल विश्राम === | ||
रैंक न्यूनीकरण समस्या एनपी-हार्ड है। कैंडेस और रेचट द्वारा प्रस्तावित दृष्टिकोण, समस्या का उत्तल फलन विश्राम बनाना और परमाणु मानदंड <math>\|M\|_*</math> (जो <math>M</math> के एकवचन मानों का योग देता है ) को कम करना है तथा <math>M</math> के शून्य एकवचन मान के अतिरिक्त <math>\text{rank}(M)</math> है (जो गैर की संख्या की गणना करता है).<ref name="candesrecht" /> यह सदिश के लिए L0-मानदंड (गणित) के अतिरिक्त L1-मानदंड (गणित) को न्यूनतम करने के समान है। उत्तल फलन विश्राम को [[अर्धनिश्चित प्रोग्रामिंग]] (एसडीपी) का उपयोग करके हल किया जा सकता है, यह देखते हुए कि अनुकूलन समस्या इसके समान | रैंक न्यूनीकरण समस्या एनपी-हार्ड है। कैंडेस और रेचट द्वारा प्रस्तावित दृष्टिकोण, समस्या का उत्तल फलन विश्राम बनाना और परमाणु मानदंड <math>\|M\|_*</math> (जो <math>M</math> के एकवचन मानों का योग देता है ) को कम करना है तथा <math>M</math> के शून्य एकवचन मान के अतिरिक्त <math>\text{rank}(M)</math> है (जो गैर की संख्या की गणना करता है).<ref name="candesrecht" /> यह सदिश के लिए L0-मानदंड (गणित) के अतिरिक्त L1-मानदंड (गणित) को न्यूनतम करने के समान है। उत्तल फलन विश्राम को [[अर्धनिश्चित प्रोग्रामिंग]] (एसडीपी) का उपयोग करके हल किया जा सकता है, यह देखते हुए कि अनुकूलन समस्या इसके समान है | ||
<math>\begin{align} | <math>\begin{align} | ||
Line 96: | Line 93: | ||
उत्तल विश्राम को हल करने के लिए अर्धनिश्चित प्रोग्रामिंग का उपयोग करने की सम्मिश्रता <math>O(\text{max}(m,n)^4)</math> है. एसडीपीटी3 जैसे अत्याधुनिक सॉल्वर केवल 100 गुणा 100 तक के आकार के आव्यूह को संभाल सकते हैं <ref name="caicandesshen" /> तथा वैकल्पिक प्रथम क्रम विधि जो उत्तल विश्राम को लगभग हल करती है वह काई, कैंडेस और शेन द्वारा प्रस्तुत सिंगुलर वैल्यू थ्रेशोल्डिंग एल्गोरिदम है।<ref name="caicandesshen" /> | उत्तल विश्राम को हल करने के लिए अर्धनिश्चित प्रोग्रामिंग का उपयोग करने की सम्मिश्रता <math>O(\text{max}(m,n)^4)</math> है. एसडीपीटी3 जैसे अत्याधुनिक सॉल्वर केवल 100 गुणा 100 तक के आकार के आव्यूह को संभाल सकते हैं <ref name="caicandesshen" /> तथा वैकल्पिक प्रथम क्रम विधि जो उत्तल विश्राम को लगभग हल करती है वह काई, कैंडेस और शेन द्वारा प्रस्तुत सिंगुलर वैल्यू थ्रेशोल्डिंग एल्गोरिदम है।<ref name="caicandesshen" /> | ||
कैंडेस और रेख्त बैनाच स्थानों पर यादृच्छिक चर के अध्ययन का उपयोग करके दिखाते हैं कि यदि देखी गई प्रविष्टियों की संख्या <math>\max{\{\mu_1^2, \sqrt{\mu_0}\mu_1, \mu_0 n^{0.25}\}}nr \log n </math> के क्रम पर है | कैंडेस और रेख्त बैनाच स्थानों पर यादृच्छिक चर के अध्ययन का उपयोग करके दिखाते हैं कि यदि देखी गई प्रविष्टियों की संख्या <math>\max{\{\mu_1^2, \sqrt{\mu_0}\mu_1, \mu_0 n^{0.25}\}}nr \log n </math> के क्रम पर है (सामान्यता <math>m < n</math> की हानि के बिना मान लें ), रैंक न्यूनीकरण समस्या का अनूठा समाधान है जो कुछ स्थिरांक <math>c</math> के लिए संभाव्यता <math>1-\frac{c}{n^3}</math> के साथ इसके उत्तल विश्राम का समाधान भी होता है. यदि <math>M</math> की रैंक छोटा (<math> r \leq \frac{n^{0.2}}{\mu_0} </math>) है ,तब प्रेक्षणों के समुच्चय का आकार <math>\mu_0 n^{1.2} r \log n</math> के क्रम में कम हो जाता है . ये परिणाम अधिकता के समीप हैं, क्योंकि आव्यूह पूर्णता समस्या को कम निर्धारित न करने के लिए देखी जाने वाली प्रविष्टियों की न्यूनतम संख्या <math>nr \log n</math> के क्रम पर है . | ||
कैंडेस और ताओ द्वारा इस परिणाम में सुधार किया गया है।<ref name="candestao" />वह ऐसी सीमाएँ प्राप्त करते हैं जो मान्यताओं को शक्तिशाली करके केवल पॉलीलॉगरिदमिक कार्यात्मक कारकों द्वारा अधिकतम सीमाओं से भिन्न होती हैं। असंगति | कैंडेस और ताओ द्वारा इस परिणाम में सुधार किया गया है।<ref name="candestao" />वह ऐसी सीमाएँ प्राप्त करते हैं जो मान्यताओं को शक्तिशाली करके केवल पॉलीलॉगरिदमिक कार्यात्मक कारकों द्वारा अधिकतम सीमाओं से भिन्न होती हैं। असंगति गुण के अतिरिक्त ,वह पैरामीटर <math>\mu_3</math> के साथ शक्तिशाली असंगति गुण मानते हैं . यह गुण दर्शाती है कि: | ||
# <math>| \langle e_a, P_U e_{a'} \rangle - \frac{r}{m} 1_{a = a'} | \leq \mu_3 \frac{\sqrt{r}}{m} </math> के लिए <math>a, a' \leq m</math> और <math>| \langle e_b, P_U e_{b'} \rangle - \frac{r}{n} 1_{b = b'} | \leq \mu_3 \frac{\sqrt{r}}{n} </math> के लिए <math>b, b' \leq n </math> | # <math>| \langle e_a, P_U e_{a'} \rangle - \frac{r}{m} 1_{a = a'} | \leq \mu_3 \frac{\sqrt{r}}{m} </math> के लिए <math>a, a' \leq m</math> और <math>| \langle e_b, P_U e_{b'} \rangle - \frac{r}{n} 1_{b = b'} | \leq \mu_3 \frac{\sqrt{r}}{n} </math> के लिए <math>b, b' \leq n </math> | ||
# <math>\sum_i u_i v_i^\dagger </math> की प्रविष्टियाँ <math>\mu_3 \sqrt{\frac{r}{mn}}</math> द्वारा परिमाण में बंधे हैं | # <math>\sum_i u_i v_i^\dagger </math> की प्रविष्टियाँ <math>\mu_3 \sqrt{\frac{r}{mn}}</math> द्वारा परिमाण में बंधे हैं | ||
सहज रूप से, आव्यूह <math>U</math> की शक्तिशाली असंगति यह | सहज रूप से, आव्यूह <math>U</math> की शक्तिशाली असंगति यह प्रस्तुत करता है कि <math>U</math> के मानक आधार सदिश के ऑर्थोगोनल अनुमान में ऐसे परिमाण होते हैं जिनकी संभावना अधिक होती है। यदि एकवचन सदिशों को यादृच्छिक रूप से वितरित किया जाता है |<ref name="tao" /> | ||
कैंडेस और ताओ को वह जब | कैंडेस और ताओ को वह जब <math>r</math> <math>O(1)</math> मिला है और प्रेक्षित प्रविष्टियों की संख्या <math>\mu_3^4 n(\log n)^2</math> के क्रम पर है, तब रैंक न्यूनीकरण समस्या का अनूठा समाधान है जो संभाव्यता <math>1-\frac{c}{n^3}</math> के साथ इसके उत्तल विश्राम का समाधान भी होता है कुछ स्थिरांक <math>c</math> के लिए इच्छानुसार <math>r</math> के लिए , इस दावे के लिए पर्याप्त प्रेक्षित प्रविष्टियों की संख्या सत्य है जी कि <math>\mu_3^2 nr (\log n)^6</math> के क्रम पर होती है | | ||
और उत्तल विश्राम दृष्टिकोण <ref name="bertsimas2021mixed" /> रैंक बाधा के तहत फ्रोबेनियस वर्ग मानदंड को कम करना है। यह हल करने के समान | और उत्तल विश्राम दृष्टिकोण <ref name="bertsimas2021mixed" /> रैंक बाधा के तहत फ्रोबेनियस वर्ग मानदंड को कम करना है। यह हल करने के समान है | ||
<math> | <math> | ||
Line 116: | Line 113: | ||
</math> | </math> | ||
<math>X=YX, \text{trace}(Y)\leq k</math> के माध्यम से <math>X</math> की रैंक को मॉडल करने के लिए ऑर्थोगोनल प्रोजेक्शन आव्यूह <math>Y</math> (अर्थ <math>Y^2=Y, Y=Y'</math>) प्रस्तुत करके और इस समस्या का उत्तल विश्राम लेते हुए, हम निम्नलिखित अर्धनिश्चित | <math>X=YX, \text{trace}(Y)\leq k</math> के माध्यम से <math>X</math> की रैंक को मॉडल करने के लिए ऑर्थोगोनल प्रोजेक्शन आव्यूह <math>Y</math> (अर्थ <math>Y^2=Y, Y=Y'</math>) प्रस्तुत करके और इस समस्या का उत्तल विश्राम लेते हुए, हम निम्नलिखित अर्धनिश्चित फलन प्राप्त करते हैं | ||
<math> | <math> | ||
Line 134: | Line 131: | ||
=== क्रमिक अवतरण === | === क्रमिक अवतरण === | ||
केशवन, मोंटानारी और ओह<ref name="keshavan" /> आव्यूह पूर्णता के प्रकार पर विचार करें जहां | केशवन, मोंटानारी और ओह<ref name="keshavan" /> आव्यूह पूर्णता के प्रकार पर विचार करें जहां <math>m</math> द्वारा <math>n</math> आव्यूह <math>M</math> की रैंक (रैखिक बीजगणित) जिसे पुनर्प्राप्त किया जाना है, <math>r</math> के रूप जाना जाता है. वह प्रविष्टियों के बर्नौली नमूने, निरंतर भाग अनुपात <math>\frac{m}{n}</math>, <math>M</math> की प्रविष्टियों का परिबद्ध परिमाण (ऊपरी सीमा <math>M_{\text{max}}</math> रहने दें ), और स्थिर स्थिति संख्या <math>\frac{\sigma_1}{\sigma_r}</math> (जहाँ <math>\sigma_1</math> और <math>\sigma_r</math> के अधिक उच्च और अधिक लघु एकवचन मान हैं जहाँ <math>M</math> क्रमश मानते है)। इसके अतरिक्त ,वह मानते हैं कि दो असंगति स्थितियाँ <math>\mu_0</math> और <math>\mu_1 \frac{\sigma_1}{\sigma_r}</math> से संतुष्ट हैं जहाँ <math>\mu_0</math> और <math>\mu_1</math> स्थिरांक हैं. मान लीजिये कि <math>M^E</math> ऐसा आव्यूह बनें जो प्रेक्षित प्रविष्टियों के मंच <math>E</math> पर <math>M</math> से मेल खाता हो और संख्या अन्यत्र 0 है। फिर वह निम्नलिखित एल्गोरिथम प्रस्तावित करते हैं: | ||
# स्तम्भ में प्रविष्टियों को 0 पर समुच्चय करके | # स्तम्भ में प्रविष्टियों को 0 पर समुच्चय करके <math>\frac{2|E|}{n}</math> से अधिक डिग्री वाले स्तंभों से सभी अवलोकनों को हटाकर <math>M^E</math> को ट्रिम करें। इसी प्रकार के <math>\frac{2|E|}{n}</math>इससे बड़ी डिग्री वाली पंक्तियों से सभी अवलोकन हटा दें . | ||
#परियोजना <math>M^E</math> इसके पहले पर <math>r</math> [[प्रमुख कंपोनेंट विश्लेषण]]। परिणामी आव्यूह <math>\text{Tr}(M^E)</math> पर कॉल करें . | #परियोजना <math>M^E</math> इसके पहले पर <math>r</math> [[प्रमुख कंपोनेंट विश्लेषण]]। परिणामी आव्यूह <math>\text{Tr}(M^E)</math> पर कॉल करें . | ||
#[[ पंक्ति खोज |लाइन सर्च]] के साथ [[ ढतला हुआ वंश |ग्रेडिएंट डिसेंट]] द्वारा <math> \min_{X,Y} \min_{S \in \mathbb{R}^{r \times r}} \frac{1}{2} \sum_{i,j \in E} (M_{ij} - (XSY^\dagger)_{ij})^2 + \rho G(X,Y)</math> को हल करे जहाँ <math>G(X,Y)</math> कुछ नियमितीकरण (गणित) फलन है। <math>X,\;Y</math> पर प्रारंभ करें <math>X_0,\;Y_0</math> जहाँ <math>\text{Tr}(M_E) = X_0 S_0 Y_0^\dagger</math>. | #[[ पंक्ति खोज |लाइन सर्च]] के साथ [[ ढतला हुआ वंश |ग्रेडिएंट डिसेंट]] द्वारा <math> \min_{X,Y} \min_{S \in \mathbb{R}^{r \times r}} \frac{1}{2} \sum_{i,j \in E} (M_{ij} - (XSY^\dagger)_{ij})^2 + \rho G(X,Y)</math> को हल करे जहाँ <math>G(X,Y)</math> कुछ नियमितीकरण (गणित) फलन है। <math>X,\;Y</math> पर प्रारंभ करें <math>X_0,\;Y_0</math> जहाँ <math>\text{Tr}(M_E) = X_0 S_0 Y_0^\dagger</math>. यदि <math>X_0</math> और <math>Y_0</math> असंगत हैं. तब <math>G(X,Y)</math> को कुछ फ़ंक्शन के रूप में सेट करें, जो <math>X, \; Y</math> को ग्रेडिएंट डिसेंट के समय असंगत रहने के लिए बाध्य करता है। | ||
#आव्यूह <math>XSY^\dagger</math> लौटाएं . | #आव्यूह <math>XSY^\dagger</math> लौटाएं . | ||
एल्गोरिथम के चरण 1 और 2 उच्च संभावना के साथ से आव्यूह <math>\text{Tr}(M^E)</math> प्राप्त होता है जो वास्तविक आव्यूह <math>M</math> के बहुत समीप है| (जैसा कि [[मूल माध्य वर्ग विचलन]] | मूल माध्य वर्ग त्रुटि (आरएमएसई) द्वारा मापा जाता है) विशेषकर कुछ स्थिरांक <math>C</math> के लिए संभाव्यता <math>1-\frac{1}{n^3}</math>, <math>\frac{1}{mnM_{\text{max}}^2} \| M - \text{Tr}(M^E) \|_F^2 \leq C \frac{r}{m|E|} \sqrt{\frac{m}{n}} </math> | एल्गोरिथम के चरण 1 और 2 उच्च संभावना के साथ से आव्यूह <math>\text{Tr}(M^E)</math> प्राप्त होता है जो वास्तविक आव्यूह <math>M</math> के बहुत समीप है| (जैसा कि [[मूल माध्य वर्ग विचलन]] | मूल माध्य वर्ग त्रुटि (आरएमएसई) द्वारा मापा जाता है) विशेषकर कुछ स्थिरांक <math>C</math> के लिए संभाव्यता <math>1-\frac{1}{n^3}</math>, <math>\frac{1}{mnM_{\text{max}}^2} \| M - \text{Tr}(M^E) \|_F^2 \leq C \frac{r}{m|E|} \sqrt{\frac{m}{n}} </math> के साथ <math>\| \cdot \|_F</math> फ्रोबेनियस [[मैट्रिक्स मानदंड|आव्यूह मानदंड]] को दर्शाता है। ध्यान दें कि इस परिणाम को धारण करने के लिए मान्यताओं के पूरे समुच्चय की आवश्यकता नहीं है। उदाहरण के लिए, असंगति की स्थिति केवल स्पष्ट पुनर्निर्माण में ही प्रयुक्त होती है। अंत में, चूँकि ट्रिमिंग काउंटर सहज ज्ञान युक्त लग सकती है क्योंकि इसमें जानकारी को बाहर फेंकना सम्मिलित है, यह प्रोजेक्टिंग सुनिश्चित करता है इसके पहले <math>r</math> को प्रमुख घटक पर <math>M^E</math>को विश्लेषण अंतर्निहित आव्यूह <math>M</math> के बारे में देखी गई प्रविष्टियों की तुलना में अधिक जानकारी मिलती है। | ||
चरण 3 में, उम्मीदवार आव्यूह <math>X,\;Y</math> का स्थान को यह ध्यान देकर कम किया जा सकता है कि आंतरिक न्यूनतमकरण समस्या का <math>(X,Y)</math> के लिए वही समाधान | चरण 3 में, उम्मीदवार आव्यूह <math>X,\;Y</math> का स्थान को यह ध्यान देकर कम किया जा सकता है कि आंतरिक न्यूनतमकरण समस्या का <math>(X,Y)</math> के लिए वही समाधान है जो कि <math>(XQ,YR)</math> से संबंधित है जहाँ <math>Q</math> और <math>R</math> ऑर्थोनॉर्मल <math>r</math> है तथा <math>r</math> मैट्रिसेस द्वारा फिर दो [[ग्रासमैनियन]] के क्रॉस उत्पाद पर ग्रेडिएंट डिसेंट का प्रदर्शन किया जा सकता है। यदि <math>r \ll m,\;n</math> और प्रेक्षित प्रविष्टि समुच्चय <math>nr\log n</math> के क्रम में है तब चरण 3 द्वारा लौटाया गया आव्यूह बिल्कुल <math>M</math> सही है. तब एल्गोरिथ्म ऑर्डर अधिकतम है, क्योंकि हम जानते हैं कि आव्यूह पूर्णता समस्या के लिए प्रणाली को कम निर्धारित नहीं किया जाना चाहिए, प्रविष्टियों की संख्या <math>nr\log n</math> के क्रम में होनी चाहिए . | ||
=== वैकल्पिक न्यूनतम वर्ग न्यूनतमकरण === | === वैकल्पिक न्यूनतम वर्ग न्यूनतमकरण === | ||
Line 149: | Line 146: | ||
<math>X= UV^T </math>; | <math>X= UV^T </math>; | ||
फिर एल्गोरिदम सर्वश्रेष्ठ <math>U</math> और सबसे अच्छा <math>V</math> को खोजने के बीच वैकल्पिक होता है. जबकि समग्र समस्या गैर-उत्तल है, प्रत्येक उप-समस्या आम तौर पर उत्तल होती है और इसे कुशलता से हल किया जा सकता है। जैन, नेत्रपल्ली और संघवी <ref name="jainnetrapalli" />आव्यूह पूर्णता और आव्यूह सेंसिंग दोनों के लिए वैकल्पिक न्यूनतमकरण के प्रदर्शन के लिए | फिर एल्गोरिदम सर्वश्रेष्ठ <math>U</math> और सबसे अच्छा <math>V</math> को खोजने के बीच वैकल्पिक होता है. जबकि समग्र समस्या गैर-उत्तल है, प्रत्येक उप-समस्या आम तौर पर उत्तल होती है और इसे कुशलता से हल किया जा सकता है। जैन, नेत्रपल्ली और संघवी <ref name="jainnetrapalli" /> आव्यूह पूर्णता और आव्यूह सेंसिंग दोनों के लिए वैकल्पिक न्यूनतमकरण के प्रदर्शन के लिए प्रथम प्रमाण दीया गया है। | ||
वैकल्पिक न्यूनतमकरण एल्गोरिथ्म को निम्नलिखित गैर-उत्तल समस्या को हल करने के अनुमानित विधि के रूप में देखा जा सकता है: | वैकल्पिक न्यूनतमकरण एल्गोरिथ्म को निम्नलिखित गैर-उत्तल समस्या को हल करने के अनुमानित विधि के रूप में देखा जा सकता है: | ||
Line 161: | Line 158: | ||
जैन, नेत्रपल्ली और सांघवी द्वारा प्रस्तावित ऑल्ट मिन कम्पलीट एल्गोरिदम यहां सूचीबद्ध है:<ref name="jainnetrapalli" /> | जैन, नेत्रपल्ली और सांघवी द्वारा प्रस्तावित ऑल्ट मिन कम्पलीट एल्गोरिदम यहां सूचीबद्ध है:<ref name="jainnetrapalli" /> | ||
#इनपुट: अवलोकित समुच्चय <math>\Omega</math>, मान <math>P_\Omega(M)</math> | #इनपुट: अवलोकित समुच्चय <math>\Omega</math>, मान <math>P_\Omega(M)</math> | ||
#<math>\Omega</math> को | #<math>\Omega</math> को <math>2T+1</math> उपसमुच्चय <math>\Omega_0,\cdots,\Omega_{2T}</math> में विभाजित करें <math>\Omega</math> के प्रत्येक अवयव समान संभावना के साथ <math>\Omega_t</math> में से किसी से संबंधित करे (प्रतिस्थापन के साथ नमूनाकरण) | ||
# <math>\hat{U}^0 = SVD(\frac{1}{p}P_{\Omega_0}(M), k)</math> अर्थात, <math>\frac{1}{p}P_{\Omega_0}(M)</math> के शीर्ष-<math>k</math> के बाएँ एकवचन सदिश होते है | | # <math>\hat{U}^0 = SVD(\frac{1}{p}P_{\Omega_0}(M), k)</math> अर्थात, <math>\frac{1}{p}P_{\Omega_0}(M)</math> के शीर्ष-<math>k</math> के बाएँ एकवचन सदिश होते है | | ||
# क्लिपिंग: <math>\hat{U}^0</math> के सभी | # क्लिपिंग: <math>\hat{U}^0</math> के सभी अवयव को, जिसका परिमाण <math>\frac{2\mu\sqrt{k}}{\sqrt{n}} </math> इससे भी अधिक है को शून्य पर स्थापित करें और <math>\hat{U}^0</math> के स्तंभों को लम्बवत करें | ||
#<math>t = 0, \cdots, T-1 </math> के लिए करना है | #<math>t = 0, \cdots, T-1 </math> के लिए करना है | ||
# <math>\quad \hat{V}^{t+1}\leftarrow \text{argmin}_{V\in \mathbb{R}^{n\times k}}\|P_{\Omega_{t+1}}(\hat{U}V^T-M)\|^2_F | # <math>\quad \hat{V}^{t+1}\leftarrow \text{argmin}_{V\in \mathbb{R}^{n\times k}}\|P_{\Omega_{t+1}}(\hat{U}V^T-M)\|^2_F | ||
Line 171: | Line 168: | ||
#के लिए समाप्त | #के लिए समाप्त | ||
# <math>X= \hat{U}^T(\hat{V}^T)^T</math> को वापस करना | # <math>X= \hat{U}^T(\hat{V}^T)^T</math> को वापस करना | ||
उन्होंने दिखाया कि असंगत आव्यूह <math>M</math> की <math>|\Omega| = O((\frac{\sigma_1^*}{\sigma_k^*})^6k^7\log n \log (k \|M\|_F/\epsilon))</math> यादृच्छिक प्रविष्टियाँ को देखकर, ऑल्ट मिन कम्पलीट एल्गोरिदम | उन्होंने दिखाया कि असंगत आव्यूह <math>M</math> की <math>|\Omega| = O((\frac{\sigma_1^*}{\sigma_k^*})^6k^7\log n \log (k \|M\|_F/\epsilon))</math> यादृच्छिक प्रविष्टियाँ को देखकर, ऑल्ट मिन कम्पलीट एल्गोरिदम <math>O(\log(1/\epsilon))</math> चरण में <math>M</math> को पुनर्प्राप्त कर सकता है। नमूना सम्मिश्रता (<math>|\Omega|</math>), के संदर्भ में सैद्धांतिक रूप से, वैकल्पिक न्यूनतमकरण के लिए उत्तल विश्राम की तुलना में बड़े <math>\Omega</math> कीआवश्यकता हो सकती है. चूँकि अनुभवजन्य रूप से ऐसा नहीं लगता है जिसका तात्पर्य यह है कि नमूना सम्मिश्रता सीमा को और कड़ा किया जा सकता है। समय की सम्मिश्रता के संदर्भ में, उन्होंने दिखाया कि ऑल्ट मिन कम्पलीट को समय की आवश्यकता है | ||
<math>O(|\Omega|k^2\log(1/\epsilon)) </math>. | <math>O(|\Omega|k^2\log(1/\epsilon)) </math>. | ||
Line 191: | Line 188: | ||
\end{align} </math> | \end{align} </math> | ||
इनपुट | इनपुट <math>u(t) \in \mathbb{R}^m</math> और आउटपुट <math>y(t) \in \mathbb{R}^p, t = 0, \ldots, N </math> के अनुक्रम के लिए सदिश <math>x(t) \in \mathbb{R}^n</math> समय <math>t</math> पर प्रणाली की स्थिति है और <math>n</math> प्रणाली मॉडल का क्रम है. इनपुट/आउटपुट जोड़ी से, कोई मैट्रिस <math>A,B,C,D</math> और प्रारंभिक अवस्था <math>x(0)</math> को पुनर्प्राप्त करना चाहेगा. इस समस्या को निम्न-रैंक आव्यूह पूर्णता समस्या के रूप में भी देखा जा सकता है। | ||
===इंटरनेट ऑफ थिंग्स (IoT) स्थानीयकरण=== | ===इंटरनेट ऑफ थिंग्स (IoT) स्थानीयकरण=== | ||
Line 203: | Line 200: | ||
==यह भी देखें== | ==यह भी देखें== | ||
{{Div col|colwidth=25em}} | {{Div col|colwidth=25em}} | ||
* | *आव्यूह नियमितीकरण | ||
*नेटफ्लिक्स पुरस्कार | *नेटफ्लिक्स पुरस्कार | ||
*सहयोगी | *सहयोगी फ़िल्टरिंग | ||
*[[सिस्टम पहचान]] | *[[सिस्टम पहचान]] | ||
*[[उत्तल अनुकूलन]] | *[[उत्तल अनुकूलन]] |
Revision as of 12:35, 7 August 2023
आव्यूह पूर्णता आंशिक रूप से देखे गए आव्यूह की लुप्त प्रविष्टियों को एकत्रित करने का कार्य है, जो आंकड़ों में डेटा प्रतिरूपण (सांख्यिकी) करने के समान है। डेटासमुच्चय की विस्तृत श्रृंखला स्वाभाविक रूप से आव्यूह रूप में व्यवस्थित होती है। उदाहरण मूवी-रेटिंग आव्यूह है, जैसा कि नेटफ्लिक्स प्रॉब्लम में दिखाई देता है: रेटिंग आव्यूह दिया जाता है जिसमें प्रत्येक प्रविष्टि ग्राहक द्वारा मूवी की रेटिंग का प्रतिनिधित्व करती है, यदि ग्राहक मूवी ने देखा है जो कि विलुप्त है, हम ग्राहकों को आगे क्या देखना है इसके बारे में अच्छी सिफारिशें करने के लिए शेष प्रविष्टियों की भविष्यवाणी करना चाहेंगे। अन्य उदाहरण डाक्यूमेंट्स -शब्द आव्यूह है: डाक्यूमेंट्स के संग्रह में उपयोग किए गए शब्दों की आवृत्तियों को आव्यूह के रूप में दर्शाया जा सकता है, जहां प्रत्येक प्रविष्टि संकेतित डाक्यूमेंट्स में संबंधित शब्द के प्रकट होने की संख्या से मेल खाती है।
पूर्ण आव्यूह में स्वतंत्रता की डिग्री की संख्या पर किसी भी प्रतिबंध के बिना यह समस्या अनिर्धारित प्रणाली है क्योंकि छिपी हुई प्रविष्टियों को इच्छानुसार मान दिए जा सकते हैं। इस प्रकार हमें वेल-पोस्ड समस्या बनाने के लिए आव्यूह पर कुछ धारणा की आवश्यकता होती है, जैसे कि यह मान लेना कि इसमें अधिकतम निर्धारक है, या तो धनात्मक निश्चित है, या तो निम्न-रैंक है।[1][2]
उदाहरण के लिए, कोई यह मान सकता है कि आव्यूह में निम्न-रैंक संरचना है, और फिर निम्नतम रैंक (रैखिक बीजगणित) आव्यूह खोजने की प्रयास करें या, यदि पूर्ण आव्यूह की रैंक ज्ञात है, तो रैंक का आव्यूह (रैखिक बीजगणित) है जो ज्ञात प्रविष्टियों से मेल खाता है। चित्रण से पता चलता है कि आंशिक रूप से प्रकट रैंक -1 आव्यूह (बाईं ओर) को शून्य-त्रुटि (दाहिनी ओर) के साथ पूरा किया जा सकता है क्योंकि लापता प्रविष्टियों वाली सभी पंक्तियाँ तीसरी पंक्ति के समान होनी चाहिए। नेटफ्लिक्स समस्या के स्तिथियाँ में रेटिंग आव्यूह निम्न-रैंक होने की अपेक्षित है क्योंकि उपयोगकर्ता की प्राथमिकताओं को अधिकांशतः कुछ कारकों द्वारा वर्णित किया जा सकता है, जैसे कि फिल्म की शैली और रिलीज का समय अन्य अनुप्रयोगों में कंप्यूटर विज़न सम्मिलित है, जहां छवियों में विलुप्त पिक्सेल को फिर से बनाने की आवश्यकता होती है, आंशिक दूरी की जानकारी से नेटवर्क में सेंसर की वैश्विक स्थिति का पता लगाना और मल्टीक्लास वर्गीकरण आव्यूह पूर्णता समस्या सामान्य रूप से एनपी हार्ड है, किन्तु अतिरिक्त मान्यताओं के तहत कुशल एल्गोरिदम हैं जो उच्च संभावना के साथ स्पष्ट पुनर्निर्माण प्राप्त करते हैं।
सांख्यिकीय सीखने के दृष्टिकोण से, आव्यूह पूर्णता समस्या आव्यूह नियमितीकरण का अनुप्रयोग है जो सदिश नियमितीकरण (गणित) का सामान्यीकरण है। उदाहरण के लिए, निम्न-रैंक आव्यूह पूर्णता समस्या में कोई परमाणु मानदंड का रूप लेते हुए नियमितीकरण जुर्माना प्रयुक्त कर सकता है
निम्न रैंक आव्यूह पूर्णता
आव्यूह पूर्णता समस्या के प्रकारों में से निम्नतम रैंक (रैखिक बीजगणित) आव्यूह को ढूंढना है जो आव्यूह से मेल खाता है, जिसे हम समुच्चय में सभी देखी गई प्रविष्टियों के लिए पुनर्प्राप्त करना चाहते हैं इस समस्या का गणितीय सूत्रीकरण इस प्रकार है:
कैंडेस और रेख्त[3] सिद्ध हुआ कि प्रेक्षित प्रविष्टियों के नमूने और पर्याप्त रूप से अनेक नमूना प्रविष्टियों पर धारणाओं के साथ इस समस्या का उच्च संभावना वाला अनूठा समाधान है।
ऐसा समतुल्य सूत्रीकरण, यह देखते हुए कि आव्यूह पुनर्प्राप्त किया जाना रैंक (रैखिक बीजगणित) के रूप में जाना जाता है, जहाँ के लिए हल करना है
धारणाएँ
विश्लेषण को सरल बनाने और यह सुनिश्चित करने के लिए कि समस्या कम निर्धारित नहीं है, अवलोकन की गई प्रविष्टियों के नमूने और नमूना प्रविष्टियों की संख्या पर अनेक धारणाएँ अधिकांशतः बनाई जाती हैं।
प्रेक्षित प्रविष्टियों का एकसमान नमूना
विश्लेषण को सुव्यवस्थित बनाने के लिए, अधिकांशतः यह मान लिया जाता है कि समुच्चय देखी गई प्रविष्टियों और निश्चित प्रमुखता को कार्डिनैलिटी की प्रविष्टियों के सभी सबसमुच्चय के संग्रह से यादृच्छिक रूप से समान रूप से नमूना लिया जाता है . विश्लेषण को और सरल बनाने के लिए, इसके अतिरिक्त यह मान लिया गया है कि बर्नौली नमूनाकरण द्वारा निर्मित किया गया है, अर्थात प्रत्येक प्रविष्टि को संभाव्यता के साथ देखा जाता है. यदि को इसके लिए समुच्चय है जहाँ , की वांछित अपेक्षित कार्डिनैलिटी है, और आव्यूह के आयाम हैं (मान लीजिए व्यापकता के नुकसान के बिना), उच्च संभावना के साथ के के अंदर है, इस प्रकार बर्नौली नमूनाकरण एकसमान नमूने के लिए अच्छा सन्निकटन है।[3] और सरलीकरण यह मान लेना है कि प्रविष्टियाँ स्वतंत्र रूप से और प्रतिस्थापन के साथ नमूनाकृत की जाती हैं।[4]
प्रेक्षित प्रविष्टियों की संख्या की निचली सीमा
मान लीजिए कि द्वारा आव्यूह (साथ ) जिसे हम (रैखिक बीजगणित) पुनर्प्राप्त करने का प्रयास कर रहे हैं उसकी रैंक है। यदि को विशिष्ट रूप से पुनर्निर्मित करने से पहले कितनी प्रविष्टियों को देखा जाना चाहिए, इस पर एक सूचना सैद्धांतिक निचली सीमा है। जहाँ से कम या उसके समान रैंक वाले आव्यूहों द्वारा का समुच्चय आयाम के साथ एक बीजगणितीय किस्म है। इस परिणाम का उपयोग करके, कोई यह दिखा सकता है कि होने पर अद्वितीय समाधान प्राप्त करने के लिए में आव्यूह पूर्णता के लिए कम से कम प्रविष्टियाँ देखी जानी चाहिए[5]
दूसरे, प्रति पंक्ति और स्तंभ में कम से कम प्रेक्षित प्रविष्टि होनी चाहिए . का एकवचन मान अपघटन द्वारा दिया गया है यदि पंक्ति अप्राप्य है, इसे देखना आसान है तथा का दायां एकवचन सदिश है, और का कुछ इच्छानुसार मान में बदला जा सकता है और फिर भी आव्यूह मिलान प्राप्त हो सकता है इसी प्रकार, प्रेक्षित प्रविष्टियों के समुच्चय पर यदि स्तम्भ अवलोकित है, का बायां एकवचन सदिश इच्छानुसार हो सकता है. यदि हम प्रेक्षित प्रविष्टियों के समुच्चय का बर्नौली नमूनाकरण मानते हैं, तो कूपन कलेक्टर की समस्या का तात्पर्य है कि प्रविष्टियाँ के क्रम पर होता है यह सुनिश्चित करने के लिए अवश्य देखा जाना चाहिए कि उच्च संभावना के साथ प्रत्येक पंक्ति और स्तंभ से अवलोकन हो।[6]
आवश्यक नियमों को संयोजित करना और यह मान लेना कि (अनेक व्यावहारिक अनुप्रयोगों के लिए वैध धारणा), आव्यूह पूर्णता की समस्या को कम निर्धारित होने से रोकने के लिए आवश्यक देखी गई प्रविष्टियों की संख्या की निचली सीमा के क्रम पर होती है |
असंगति
संपीडित संवेदन में असंगति की अवधारणा उत्पन्न हुई। इसे एकवचन सदिश सुनिश्चित करने के लिए आव्यूह पूर्णता के संदर्भ में प्रस्तुत किया गया है इस अर्थ में बहुत विरल नहीं हैं कि प्रत्येक एकवचन सदिश के सभी निर्देशांक तुलनीय परिमाण के होते हैं, न कि केवल कुछ निर्देशांक जिनमें काफी बड़े परिमाण होते हैं।[7][8] मानक आधार सदिश तब एकवचन सदिश और सदिश के रूप में अवांछनीय होते हैं और में सदिश वांछनीय है। यदि एकवचन सदिश पर्याप्त रूप से विरल हों तो क्या असत्य हो सकता है, इसके उदाहरण के रूप में, एकवचन मान अपघटन के साथ द्वारा आव्यूह इस पर विचार करें तथा इसका पुनर्निर्माण करने से पहले की लगभग सभी प्रविष्टियाँ इसका नमूना लिया जाना चाहिए।
कैंडेस और रेख्त[3] आव्यूह की सुसंगतता को स्तम्भ स्थान के साथ का आयामी उप-स्थान के रूप में परिभाषित करते है जैसा , ओर्थोगोनल प्रोजेक्शन (गणित) है. असंगतता तब प्रस्तुत करती है कि आव्यूह द्वारा का एकवचन मान अपघटन दिया गया है,
- की प्रविष्टियाँ परिमाण ऊपरी सीमा से घिरा है
कुछ के लिए है .
ध्वनि के साथ निम्न रैंक आव्यूह पूर्णता
वास्तविक दुनिया के अनुप्रयोग में, अधिकांशतः केवल कुछ ही प्रविष्टियाँ देखी जाती हैं जो कम से कम थोड़ी मात्रा में ध्वनि से दूषित हो जाती हैं। उदाहरण के लिए, नेटफ्लिक्स समस्या में, रेटिंग अनिश्चित हैं। कैंडेस और योजना [9] में दिखाया गया कि परमाणु मानक न्यूनतमकरण द्वारा केवल कुछ ध्वनि वाले नमूनों से बड़े निम्न-रैंक आव्यूह की अनेक लापता प्रविष्टियों को भरना संभव है। ध्वनि मॉडल यह मानता है कि हम निरीक्षण करते हैं
जहाँ ध्वनि शब्द है. ध्यान दें कि ध्वनि या तो स्टोकेस्टिक या नियतात्मक हो सकता है। वैकल्पिक रूप से मॉडल को इस प्रकार व्यक्त किया जा सकता है
जहाँ आव्यूह है जिसमें के लिए प्रविष्टियाँ हैं, यह मानते हुए कि कुछ के लिए । अपूर्ण आव्यूह को पुनर्प्राप्त करने के लिए, हम निम्नलिखित अनुकूलन समस्या को हल करने का प्रयास करते हैं:
डेटा के अनुरूप सभी आव्यूह में से, न्यूनतम परमाणु मानदंड वाला ढूंढें। कैंडेस और योजना [9] में दिखाया है कि यह पुनर्निर्माण स्पष्ट है। उन्होंने यह सिद्ध कर दिया है कि जब पूर्ण ध्वनि रहित पुनर्प्राप्ति होती है, तो अस्तव्यस्तता की तुलना में आव्यूह पूर्णता स्थिर होती है। त्रुटि ध्वनि स्तर के समानुपाती होती है. इसलिए, जब ध्वनि का स्तर छोटा होता है, तो त्रुटि छोटी होती है। यहां आव्यूह पूर्णता समस्या प्रतिबंधित आइसोमेट्री प्रॉपर्टी (आरआईपी) का पालन नहीं करती है। मैट्रिसेस के लिए, आरआईपी यह मान लेगा कि सैंपलिंग ऑपरेटर उसका पालन करता है
सभी आव्यूह के लिए पर्याप्त रूप से छोटी रैंक के साथ और पर्याप्त रूप से छोटा. विधियाँ विरल सिग्नल पुनर्प्राप्ति समस्याओं पर भी प्रयुक्त होती हैं जिनमें RIP पकड़ में नहीं आता है।
उच्च रैंक आव्यूह पूर्णता
सामान्यतः उच्च रैंक वाले आव्यूह पूर्णता एनपी हार्ड है। चूँकि, कुछ मान्यताओं के साथ, कुछ अधूरे उच्च रैंक आव्यूह या यहाँ तक कि पूर्ण रैंक आव्यूह को भी पूरा किया जा सकता है।
एरिक्सन, बाल्ज़ानो और नोवाक [10] ने आव्यूह को पूरा करने की समस्या पर इस धारणा के साथ विचार किया है कि आव्यूह के स्तम्भ अनेक निम्न-रैंक उप-स्थानों के संघ से संबंधित हैं। चूंकि स्तम्भ उप-स्थानों के संघ से संबंधित हैं, इसलिए समस्या को क्लस्टरिंग उच्च-आयामी डेटा समस्या के लापता-डेटा संस्करण के रूप में देखा जा सकता है। मान लीजिये सेम आव्यूह है जिसके (पूर्ण) स्तम्भ अधिक से अधिक उप-स्थान के संघ में स्थित हैं प्रत्येक , और मान लीजिये . एरिक्सन, बाल्ज़ानो और नोवाक [10] दिखाया गया है कि हल्की धारणाओं के तहत प्रत्येक स्तम्भ कम से कम लंबे समय तक अपूर्ण संस्करण से उच्च संभावना के साथ पूरी तरह से पुनर्प्राप्त किया जा सकता है जब तक कि की कम से कम की प्रविष्टियाँ यादृच्छिक रूप से समान रूप से देखे जाते हैं सामान्य असंगति स्थितियों, उप-स्थानों की ज्यामितीय व्यवस्था और उप-स्थानों पर स्तंभों के वितरण के आधार पर स्थिरांक होता है |
एल्गोरिदम में अनेक चरण सम्मिलित हैं: (1) स्थानीय नेबरहुड ; (2) स्थानीय उपस्थान; (3) उपस्थान परिशोधन; (4) पूर्ण आव्यूह पूर्णता। इस पद्धति को इंटरनेट दूरी आव्यूह पूर्णता और टोपोलॉजी पहचान पर प्रयुक्त किया जा सकता है।
निम्न-रैंक आव्यूह समापन के लिए एल्गोरिदम
विभिन्न आव्यूह पूर्णता एल्गोरिदम प्रस्तावित किए गए हैं।[8] इनमें उत्तल विश्राम-आधारित एल्गोरिदम सम्मिलित है,[3] ग्रेडिएंट-आधारित एल्गोरिदम,[11] और वैकल्पिक न्यूनतमकरण-आधारित एल्गोरिदम।[12]
उत्तल विश्राम
रैंक न्यूनीकरण समस्या एनपी-हार्ड है। कैंडेस और रेचट द्वारा प्रस्तावित दृष्टिकोण, समस्या का उत्तल फलन विश्राम बनाना और परमाणु मानदंड (जो के एकवचन मानों का योग देता है ) को कम करना है तथा के शून्य एकवचन मान के अतिरिक्त है (जो गैर की संख्या की गणना करता है).[3] यह सदिश के लिए L0-मानदंड (गणित) के अतिरिक्त L1-मानदंड (गणित) को न्यूनतम करने के समान है। उत्तल फलन विश्राम को अर्धनिश्चित प्रोग्रामिंग (एसडीपी) का उपयोग करके हल किया जा सकता है, यह देखते हुए कि अनुकूलन समस्या इसके समान है
उत्तल विश्राम को हल करने के लिए अर्धनिश्चित प्रोग्रामिंग का उपयोग करने की सम्मिश्रता है. एसडीपीटी3 जैसे अत्याधुनिक सॉल्वर केवल 100 गुणा 100 तक के आकार के आव्यूह को संभाल सकते हैं [13] तथा वैकल्पिक प्रथम क्रम विधि जो उत्तल विश्राम को लगभग हल करती है वह काई, कैंडेस और शेन द्वारा प्रस्तुत सिंगुलर वैल्यू थ्रेशोल्डिंग एल्गोरिदम है।[13]
कैंडेस और रेख्त बैनाच स्थानों पर यादृच्छिक चर के अध्ययन का उपयोग करके दिखाते हैं कि यदि देखी गई प्रविष्टियों की संख्या के क्रम पर है (सामान्यता की हानि के बिना मान लें ), रैंक न्यूनीकरण समस्या का अनूठा समाधान है जो कुछ स्थिरांक के लिए संभाव्यता के साथ इसके उत्तल विश्राम का समाधान भी होता है. यदि की रैंक छोटा () है ,तब प्रेक्षणों के समुच्चय का आकार के क्रम में कम हो जाता है . ये परिणाम अधिकता के समीप हैं, क्योंकि आव्यूह पूर्णता समस्या को कम निर्धारित न करने के लिए देखी जाने वाली प्रविष्टियों की न्यूनतम संख्या के क्रम पर है .
कैंडेस और ताओ द्वारा इस परिणाम में सुधार किया गया है।[6]वह ऐसी सीमाएँ प्राप्त करते हैं जो मान्यताओं को शक्तिशाली करके केवल पॉलीलॉगरिदमिक कार्यात्मक कारकों द्वारा अधिकतम सीमाओं से भिन्न होती हैं। असंगति गुण के अतिरिक्त ,वह पैरामीटर के साथ शक्तिशाली असंगति गुण मानते हैं . यह गुण दर्शाती है कि:
- के लिए और के लिए
- की प्रविष्टियाँ द्वारा परिमाण में बंधे हैं
सहज रूप से, आव्यूह की शक्तिशाली असंगति यह प्रस्तुत करता है कि के मानक आधार सदिश के ऑर्थोगोनल अनुमान में ऐसे परिमाण होते हैं जिनकी संभावना अधिक होती है। यदि एकवचन सदिशों को यादृच्छिक रूप से वितरित किया जाता है |[7]
कैंडेस और ताओ को वह जब मिला है और प्रेक्षित प्रविष्टियों की संख्या के क्रम पर है, तब रैंक न्यूनीकरण समस्या का अनूठा समाधान है जो संभाव्यता के साथ इसके उत्तल विश्राम का समाधान भी होता है कुछ स्थिरांक के लिए इच्छानुसार के लिए , इस दावे के लिए पर्याप्त प्रेक्षित प्रविष्टियों की संख्या सत्य है जी कि के क्रम पर होती है |
और उत्तल विश्राम दृष्टिकोण [14] रैंक बाधा के तहत फ्रोबेनियस वर्ग मानदंड को कम करना है। यह हल करने के समान है
के माध्यम से की रैंक को मॉडल करने के लिए ऑर्थोगोनल प्रोजेक्शन आव्यूह (अर्थ ) प्रस्तुत करके और इस समस्या का उत्तल विश्राम लेते हुए, हम निम्नलिखित अर्धनिश्चित फलन प्राप्त करते हैं
यदि इस विश्राम में Y प्रक्षेपण आव्यूह है (अर्थात, इसमें बाइनरी आइजेनवैल्यू है), तो विश्राम तंग है। अन्यथा, यह समग्र उद्देश्य पर वैध निचली सीमा देता है। इसके अतरिक्त, इसे Y के आइजेनवैल्यू को लालचपूर्वक पूर्णांकित करके (थोड़े) बड़े उद्देश्य के साथ व्यवहार्य समाधान में परिवर्तित किया जा सकता है।[14] उल्लेखनीय रूप से, इस उत्तल विश्राम को किसी भी एसडीपी को हल किए बिना X और Y पर वैकल्पिक न्यूनतमकरण द्वारा हल किया जा सकता है, और इस प्रकार यह एसडीपीटी 3 या मोसेक जैसे अत्याधुनिक एसडीपी सॉल्वरों की विशिष्ट संख्यात्मक सीमाओं से परे है।
यह दृष्टिकोण अधिक सामान्य सुधार तकनीक का विशेष स्तिथि है, जिसे ट्रेस-मैट्रिक्स-उत्तल उद्देश्य के साथ किसी भी निम्न-रैंक समस्या पर वैध निचली सीमा प्राप्त करने के लिए प्रयुक्त किया जा सकता है।[15]
क्रमिक अवतरण
केशवन, मोंटानारी और ओह[11] आव्यूह पूर्णता के प्रकार पर विचार करें जहां द्वारा आव्यूह की रैंक (रैखिक बीजगणित) जिसे पुनर्प्राप्त किया जाना है, के रूप जाना जाता है. वह प्रविष्टियों के बर्नौली नमूने, निरंतर भाग अनुपात , की प्रविष्टियों का परिबद्ध परिमाण (ऊपरी सीमा रहने दें ), और स्थिर स्थिति संख्या (जहाँ और के अधिक उच्च और अधिक लघु एकवचन मान हैं जहाँ क्रमश मानते है)। इसके अतरिक्त ,वह मानते हैं कि दो असंगति स्थितियाँ और से संतुष्ट हैं जहाँ और स्थिरांक हैं. मान लीजिये कि ऐसा आव्यूह बनें जो प्रेक्षित प्रविष्टियों के मंच पर से मेल खाता हो और संख्या अन्यत्र 0 है। फिर वह निम्नलिखित एल्गोरिथम प्रस्तावित करते हैं:
- स्तम्भ में प्रविष्टियों को 0 पर समुच्चय करके से अधिक डिग्री वाले स्तंभों से सभी अवलोकनों को हटाकर को ट्रिम करें। इसी प्रकार के इससे बड़ी डिग्री वाली पंक्तियों से सभी अवलोकन हटा दें .
- परियोजना इसके पहले पर प्रमुख कंपोनेंट विश्लेषण। परिणामी आव्यूह पर कॉल करें .
- लाइन सर्च के साथ ग्रेडिएंट डिसेंट द्वारा को हल करे जहाँ कुछ नियमितीकरण (गणित) फलन है। पर प्रारंभ करें जहाँ . यदि और असंगत हैं. तब को कुछ फ़ंक्शन के रूप में सेट करें, जो को ग्रेडिएंट डिसेंट के समय असंगत रहने के लिए बाध्य करता है।
- आव्यूह लौटाएं .
एल्गोरिथम के चरण 1 और 2 उच्च संभावना के साथ से आव्यूह प्राप्त होता है जो वास्तविक आव्यूह के बहुत समीप है| (जैसा कि मूल माध्य वर्ग विचलन | मूल माध्य वर्ग त्रुटि (आरएमएसई) द्वारा मापा जाता है) विशेषकर कुछ स्थिरांक के लिए संभाव्यता , के साथ फ्रोबेनियस आव्यूह मानदंड को दर्शाता है। ध्यान दें कि इस परिणाम को धारण करने के लिए मान्यताओं के पूरे समुच्चय की आवश्यकता नहीं है। उदाहरण के लिए, असंगति की स्थिति केवल स्पष्ट पुनर्निर्माण में ही प्रयुक्त होती है। अंत में, चूँकि ट्रिमिंग काउंटर सहज ज्ञान युक्त लग सकती है क्योंकि इसमें जानकारी को बाहर फेंकना सम्मिलित है, यह प्रोजेक्टिंग सुनिश्चित करता है इसके पहले को प्रमुख घटक पर को विश्लेषण अंतर्निहित आव्यूह के बारे में देखी गई प्रविष्टियों की तुलना में अधिक जानकारी मिलती है।
चरण 3 में, उम्मीदवार आव्यूह का स्थान को यह ध्यान देकर कम किया जा सकता है कि आंतरिक न्यूनतमकरण समस्या का के लिए वही समाधान है जो कि से संबंधित है जहाँ और ऑर्थोनॉर्मल है तथा मैट्रिसेस द्वारा फिर दो ग्रासमैनियन के क्रॉस उत्पाद पर ग्रेडिएंट डिसेंट का प्रदर्शन किया जा सकता है। यदि और प्रेक्षित प्रविष्टि समुच्चय के क्रम में है तब चरण 3 द्वारा लौटाया गया आव्यूह बिल्कुल सही है. तब एल्गोरिथ्म ऑर्डर अधिकतम है, क्योंकि हम जानते हैं कि आव्यूह पूर्णता समस्या के लिए प्रणाली को कम निर्धारित नहीं किया जाना चाहिए, प्रविष्टियों की संख्या के क्रम में होनी चाहिए .
वैकल्पिक न्यूनतम वर्ग न्यूनतमकरण
वैकल्पिक न्यूनीकरण निम्न-रैंक आव्यूह खोजने के लिए व्यापक रूप से प्रयुक्त और अनुभवजन्य रूप से सफल दृष्टिकोण का प्रतिनिधित्व करता है जो दिए गए डेटा के लिए सबसे उपयुक्त है। उदाहरण के लिए, निम्न-रैंक आव्यूह पूर्णता की समस्या के लिए, इस विधि को सबसे स्पष्ट और कुशल में से माना जाता है, और नेटफ्लिक्स समस्या में विजेता प्रविष्टि का प्रमुख घटक बनता है। वैकल्पिक न्यूनतमकरण दृष्टिकोण में, निम्न-रैंक लक्ष्य आव्यूह को द्विरेखीय रूप में लिखा जाता है:
;
फिर एल्गोरिदम सर्वश्रेष्ठ और सबसे अच्छा को खोजने के बीच वैकल्पिक होता है. जबकि समग्र समस्या गैर-उत्तल है, प्रत्येक उप-समस्या आम तौर पर उत्तल होती है और इसे कुशलता से हल किया जा सकता है। जैन, नेत्रपल्ली और संघवी [12] आव्यूह पूर्णता और आव्यूह सेंसिंग दोनों के लिए वैकल्पिक न्यूनतमकरण के प्रदर्शन के लिए प्रथम प्रमाण दीया गया है।
वैकल्पिक न्यूनतमकरण एल्गोरिथ्म को निम्नलिखित गैर-उत्तल समस्या को हल करने के अनुमानित विधि के रूप में देखा जा सकता है:
जैन, नेत्रपल्ली और सांघवी द्वारा प्रस्तावित ऑल्ट मिन कम्पलीट एल्गोरिदम यहां सूचीबद्ध है:[12]
- इनपुट: अवलोकित समुच्चय , मान
- को उपसमुच्चय में विभाजित करें के प्रत्येक अवयव समान संभावना के साथ में से किसी से संबंधित करे (प्रतिस्थापन के साथ नमूनाकरण)
- अर्थात, के शीर्ष- के बाएँ एकवचन सदिश होते है |
- क्लिपिंग: के सभी अवयव को, जिसका परिमाण इससे भी अधिक है को शून्य पर स्थापित करें और के स्तंभों को लम्बवत करें
- के लिए करना है
- के लिए समाप्त
- को वापस करना
उन्होंने दिखाया कि असंगत आव्यूह की यादृच्छिक प्रविष्टियाँ को देखकर, ऑल्ट मिन कम्पलीट एल्गोरिदम चरण में को पुनर्प्राप्त कर सकता है। नमूना सम्मिश्रता (), के संदर्भ में सैद्धांतिक रूप से, वैकल्पिक न्यूनतमकरण के लिए उत्तल विश्राम की तुलना में बड़े कीआवश्यकता हो सकती है. चूँकि अनुभवजन्य रूप से ऐसा नहीं लगता है जिसका तात्पर्य यह है कि नमूना सम्मिश्रता सीमा को और कड़ा किया जा सकता है। समय की सम्मिश्रता के संदर्भ में, उन्होंने दिखाया कि ऑल्ट मिन कम्पलीट को समय की आवश्यकता है
.
यह ध्यान देने योग्य है कि, चूँकि उत्तल विश्राम आधारित विधियों का कठोर विश्लेषण होता है, तथा वैकल्पिक न्यूनतमकरण आधारित एल्गोरिदम व्यवहार में अधिक सफल होते हैं।
अनुप्रयोग
आव्यूह पूर्णता के अनेक अनुप्रयोगों को कैंडेस और प्लान द्वारा संक्षेपित किया गया है[9] निम्नलिखित नुसार:
सहयोगात्मक फ़िल्टरिंग
सहयोगात्मक फ़िल्टरिंग अनेक उपयोगकर्ताओं से स्वाद संबंधी जानकारी एकत्र करके उपयोगकर्ता की रुचियों के बारे में स्वचालित पूर्वानुमान लगाने का कार्य है। ऐप्पल, अमेज़ॅन, बार्न्स एंड नोबल और नेटफ्लिक्स जैसी कंपनियां आंशिक ज्ञान से अपने उपयोगकर्ता की प्राथमिकताओं का अनुमान लगाने की प्रयास कर रही हैं। इस प्रकार की आव्यूह पूर्णता समस्या में, अज्ञात पूर्ण आव्यूह को अधिकांशतः निम्न रैंक माना जाता है क्योंकि केवल कुछ कारक ही सामान्यतः किसी व्यक्ति के स्वाद या पसंद में योगदान करते हैं।
प्रणाली पहचान
नियंत्रण में, कोई व्यक्ति असतत-समय रैखिक समय-अपरिवर्तनीय राज्य-अंतरिक्ष मॉडल को फिट करना चाहेगा
इनपुट और आउटपुट के अनुक्रम के लिए सदिश समय पर प्रणाली की स्थिति है और प्रणाली मॉडल का क्रम है. इनपुट/आउटपुट जोड़ी से, कोई मैट्रिस और प्रारंभिक अवस्था को पुनर्प्राप्त करना चाहेगा. इस समस्या को निम्न-रैंक आव्यूह पूर्णता समस्या के रूप में भी देखा जा सकता है।
इंटरनेट ऑफ थिंग्स (IoT) स्थानीयकरण
IoT सेंसर नेटवर्क में स्थानीयकरण (या वैश्विक स्थिति) समस्या स्वाभाविक रूप से उभरती है। समस्या यूक्लिडियन अंतरिक्ष में स्थानीय या जोड़ीदार दूरियों के आंशिक समुच्चय से सेंसर मानचित्र को पुनर्प्राप्त करना है। इस प्रकार यह रैंक दो के साथ आव्यूह पूर्णता समस्या है यदि सेंसर 2-डी विमान में स्थित हैं और तीन यदिवह 3-डी समिष्ट में हैं।[16]
सामाजिक नेटवर्क पुनर्प्राप्ति
वास्तविक दुनिया के अधिकांश सामाजिक नेटवर्क में निम्न-रैंक दूरी वाले मैट्रिसेस होते हैं। जब हम पूरे नेटवर्क को मापने में सक्षम नहीं होते हैं, जो निजी नोड्स, सीमित संग्रहण या गणना संसाधनों जैसे कारणों से हो सकता है, तो हमारे पास ज्ञात दूरी प्रविष्टियों का केवल अंश होता है। आपराधिक नेटवर्क ऐसे नेटवर्क का अच्छा उदाहरण हैं। इन न देखी गई दूरियों को पुनर्प्राप्त करने के लिए निम्न-रैंक आव्यूह पूर्णता का उपयोग किया जा सकता है।[17]
यह भी देखें
- आव्यूह नियमितीकरण
- नेटफ्लिक्स पुरस्कार
- सहयोगी फ़िल्टरिंग
- सिस्टम पहचान
- उत्तल अनुकूलन
- प्रतिरूपण (सांख्यिकी)
संदर्भ
- ↑ Johnson, Charles R. (1990). "Matrix completion problems: a survey". Matrix Theory and Applications. Proceedings of Symposia in Applied Mathematics. 40: 171–198. doi:10.1090/psapm/040/1059486. ISBN 9780821801543.
- ↑ Laurent, Monique (2008). "Matrix Completion Problems". Encyclopedia of Optimization. 3: 221–229. doi:10.1007/978-0-387-74759-0_355. ISBN 978-0-387-74758-3.
- ↑ 3.0 3.1 3.2 3.3 3.4 Candès, E. J.; Recht, B. (2009). "Exact Matrix Completion via Convex Optimization". Foundations of Computational Mathematics. 9 (6): 717–772. arXiv:0805.4471. doi:10.1007/s10208-009-9045-5.
- ↑ Recht, B. (2009). "A Simpler Approach to Matrix Completion" (PDF). Journal of Machine Learning Research. 12: 3413–3430. arXiv:0910.0651. Bibcode:2009arXiv0910.0651R.
- ↑ Xu, Zhiqiang (2018). "The minimal measurement number for low-rank matrix recovery". Applied and Computational Harmonic Analysis. 44 (2): 497–508. arXiv:1505.07204. doi:10.1016/j.acha.2017.01.005. S2CID 11990443.
- ↑ 6.0 6.1 Candès, E. J.; Tao, T. (2010). "The Power of Convex Relaxation: Near-Optimal Matrix Completion". IEEE Transactions on Information Theory. 56 (5): 2053–2080. arXiv:0903.1476. doi:10.1109/TIT.2010.2044061. S2CID 1255437.
- ↑ 7.0 7.1 Tao, T. (10 March 2009). "The power of convex relaxation: near-optimal matrix completion". What's new.
- ↑ 8.0 8.1 Nguyen, L.T.; Kim, J.; Shim, B. (10 July 2019). "Low-Rank Matrix Completion: A Contemporary Survey". IEEE Access. 7 (1): 94215–94237. arXiv:1907.11705. Bibcode:2019arXiv190711705N. doi:10.1109/ACCESS.2019.2928130. S2CID 198930899.
- ↑ 9.0 9.1 9.2 Candès, E. J.; Plan, Y. (2010). "Matrix Completion with Noise". Proceedings of the IEEE. 98 (6): 925–936. arXiv:0903.3131. doi:10.1109/JPROC.2009.2035722. S2CID 109721.
- ↑ 10.0 10.1 Eriksson, B.; Balzano, L.; Nowak, R. (2011). "High-Rank Matrix Completion and Subspace Clustering with Missing Data". arXiv:1112.5629 [cs.IT].
- ↑ 11.0 11.1 Keshavan, R. H.; Montanari, A.; Oh, S. (2010). "Matrix Completion from a Few Entries". IEEE Transactions on Information Theory. 56 (6): 2980–2998. arXiv:0901.3150. doi:10.1109/TIT.2010.2046205. S2CID 53504.
- ↑ 12.0 12.1 12.2 Jain, P.; Netrapalli, P.; Sanghavi, S. (2013). "Low-rank Matrix Completion using Alternating Minimization". Proceedings of the 45th annual ACM symposium on Symposium on theory of computing. ACM. pp. 665–674. arXiv:1212.0467. doi:10.1145/2488608.2488693. ISBN 978-1-4503-2029-0. S2CID 447011.
- ↑ 13.0 13.1 Cai, J.-F.; Candès, E. J.; Shen, Z. (2010). "A Singular Value Thresholding Algorithm for Matrix Completion". SIAM Journal on Optimization. 20 (4): 1956–1982. arXiv:0810.3286. doi:10.1137/080738970. S2CID 1254778.
- ↑ 14.0 14.1 Bertsimas, Dimitris; Cory-Wright, Ryan; Pauphilet, Jean (2021). "Mixed-Projection Conic Optimization: A New Paradigm for Modeling Rank Constraints". Operations Research. 70 (6): 3321–3344. arXiv:2009.10395. doi:10.1287/opre.2021.2182. S2CID 221836263.
- ↑ Bertsimas, Dimitris; Cory-Wright, Ryan; Pauphilet, Jean (2021). "A New Perspective on Low-Rank Optimization". Optimization Online. arXiv:2105.05947.
- ↑ Nguyen, L.T.; Kim, J.; Kim, S.; Shim, B. (2019). "Localization of IoT Networks Via Low-Rank Matrix Completion". IEEE Transactions on Communications. 67 (8): 5833–5847. doi:10.1109/TCOMM.2019.2915226. S2CID 164605437.
- ↑ Mahindre, G.; Jayasumana, A.P.; Gajamannage, K.; Paffenroth, R. (2019). "On Sampling and Recovery of Topology of Directed Social Networks – A Low-Rank Matrix Completion Based Approach". 2019 IEEE 44th Conference on Local Computer Networks (LCN). IEEE. pp. 324–331. doi:10.1109/LCN44214.2019.8990707. ISBN 978-1-7281-1028-8. S2CID 211206354.