मैट्रिक्स पूर्णता: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
[[File:Rank-1-matrix-completion.png|thumbnail|रैंक-1 के साथ आंशिक रूप से प्रकट 5 बाय 5 | [[File:Rank-1-matrix-completion.png|thumbnail|रैंक-1 के साथ आंशिक रूप से प्रकट 5 बाय 5 आव्यूह का आव्यूह समापन। बाएँ: अपूर्ण आव्यूह का अवलोकन किया गया; दाएं: आव्यूह पूर्णता परिणाम.|440x440px]]'''आव्यूह पूर्णता''' आंशिक रूप से देखे गए आव्यूह की लुप्त प्रविष्टियों को भरने का कार्य है, जो आंकड़ों में डेटा प्रतिरूपण (सांख्यिकी) करने के बराबर है। डेटासेट की विस्तृत श्रृंखला स्वाभाविक रूप से आव्यूह रूप में व्यवस्थित होती है। उदाहरण मूवी-रेटिंग आव्यूह है, जैसा कि [[नेटफ्लिक्स पुरस्कार]] में दिखाई देता है: रेटिंग आव्यूह दिया जाता है जिसमें प्रत्येक प्रविष्टि होती है <math>(i,j)</math> फिल्म की रेटिंग का प्रतिनिधित्व करता है <math>j</math> ग्राहक के द्वारा <math>i</math>, यदि ग्राहक <math>i</math> फिल्म देखी है <math>j</math> और अन्यथा गायब है, हम ग्राहकों को आगे क्या देखना है इसके बारे में अच्छी सिफारिशें करने के लिए शेष प्रविष्टियों की भविष्यवाणी करना चाहेंगे। अन्य उदाहरण दस्तावेज़-शब्द आव्यूह है: दस्तावेज़ों के संग्रह में उपयोग किए गए शब्दों की आवृत्तियों को आव्यूह के रूप में दर्शाया जा सकता है, जहां प्रत्येक प्रविष्टि संकेतित दस्तावेज़ में संबंधित शब्द के प्रकट होने की संख्या से मेल खाती है। | ||
पूर्ण आव्यूह में स्वतंत्रता की डिग्री की संख्या पर किसी भी प्रतिबंध के बिना यह समस्या [[अनिर्धारित प्रणाली]] है क्योंकि छिपी हुई प्रविष्टियों को मनमाने ढंग से मान दिए जा सकते हैं। इस प्रकार हमें [[अच्छी तरह से प्रस्तुत समस्या]] बनाने के लिए आव्यूह पर कुछ धारणा की आवश्यकता होती है, जैसे कि यह मान लेना कि इसमें अधिकतम निर्धारक है, सकारात्मक निश्चित है, या निम्न-रैंक है।<ref name="johnson" /><ref name="laurent" /> | |||
उदाहरण के लिए, कोई यह मान सकता है कि आव्यूह में निम्न-रैंक संरचना है, और फिर निम्नतम [[रैंक (रैखिक बीजगणित)]] आव्यूह खोजने की कोशिश करें या, यदि पूर्ण आव्यूह की रैंक ज्ञात है, तो रैंक का आव्यूह (रैखिक बीजगणित) <math>r</math> जो ज्ञात प्रविष्टियों से मेल खाता है। चित्रण से पता चलता है कि आंशिक रूप से प्रकट रैंक -1 आव्यूह (बाईं ओर) को शून्य-त्रुटि (दाहिनी ओर) के साथ पूरा किया जा सकता है क्योंकि लापता प्रविष्टियों वाली सभी पंक्तियाँ तीसरी पंक्ति के समान होनी चाहिए। नेटफ्लिक्स समस्या के मामले में रेटिंग आव्यूह निम्न-रैंक होने की उम्मीद है क्योंकि उपयोगकर्ता की प्राथमिकताओं को अक्सर कुछ कारकों द्वारा वर्णित किया जा सकता है, जैसे कि फिल्म की शैली और रिलीज का समय। अन्य अनुप्रयोगों में कंप्यूटर विज़न शामिल है, जहां छवियों में गायब पिक्सेल को फिर से बनाने की आवश्यकता होती है, आंशिक दूरी की जानकारी से नेटवर्क में सेंसर की वैश्विक स्थिति का पता लगाना और मल्टीक्लास वर्गीकरण। आव्यूह पूर्णता समस्या सामान्य रूप से [[ एनपी कठिन |एनपी कठिन]] है, लेकिन अतिरिक्त मान्यताओं के तहत कुशल एल्गोरिदम हैं जो उच्च संभावना के साथ सटीक पुनर्निर्माण प्राप्त करते हैं। | |||
सांख्यिकीय सीखने के दृष्टिकोण से, आव्यूह पूर्णता समस्या [[मैट्रिक्स नियमितीकरण|आव्यूह नियमितीकरण]] का अनुप्रयोग है जो वेक्टर [[नियमितीकरण (गणित)]] का सामान्यीकरण है। उदाहरण के लिए, निम्न-रैंक आव्यूह पूर्णता समस्या में कोई परमाणु मानदंड का रूप लेते हुए नियमितीकरण जुर्माना लागू कर सकता है <math>R(X) = \lambda\|X\|_*</math> | |||
== निम्न रैंक | |||
== निम्न रैंक आव्यूह पूर्णता == | |||
आव्यूह पूर्णता समस्या के प्रकारों में से निम्नतम रैंक (रैखिक बीजगणित) आव्यूह को ढूंढना है <math>X</math> जो आव्यूह से मेल खाता है <math>M</math>, जिसे हम सेट में सभी प्रविष्टियों के लिए पुनर्प्राप्त करना चाहते हैं <math>E</math> देखी गई प्रविष्टियों की. इस समस्या का गणितीय सूत्रीकरण इस प्रकार है: | |||
:<math>\begin{align} | :<math>\begin{align} | ||
& \underset{X}{\text{min}} & \text{rank} (X) \\ | & \underset{X}{\text{min}} & \text{rank} (X) \\ | ||
Line 16: | Line 18: | ||
कैंडेस और रेख्त<ref name="candesrecht" />साबित हुआ कि प्रेक्षित प्रविष्टियों के नमूने और पर्याप्त रूप से कई नमूना प्रविष्टियों पर धारणाओं के साथ इस समस्या का उच्च संभावना वाला अनूठा समाधान है। | कैंडेस और रेख्त<ref name="candesrecht" />साबित हुआ कि प्रेक्षित प्रविष्टियों के नमूने और पर्याप्त रूप से कई नमूना प्रविष्टियों पर धारणाओं के साथ इस समस्या का उच्च संभावना वाला अनूठा समाधान है। | ||
एक समतुल्य सूत्रीकरण, यह देखते हुए कि | एक समतुल्य सूत्रीकरण, यह देखते हुए कि आव्यूह <math>M</math> पुनर्प्राप्त किया जाना रैंक (रैखिक बीजगणित) के रूप में जाना जाता है <math>r</math>, के लिए हल करना है <math>X</math> कहाँ <math>X_{ij} = M_{ij} \;\; \forall i,j \in E</math> | ||
Line 23: | Line 25: | ||
==== प्रेक्षित प्रविष्टियों का एकसमान नमूना ==== | ==== प्रेक्षित प्रविष्टियों का एकसमान नमूना ==== | ||
विश्लेषण को सुव्यवस्थित बनाने के लिए, अक्सर यह मान लिया जाता है कि सेट <math>E</math> देखी गई प्रविष्टियों और निश्चित [[प्रमुखता]] को कार्डिनैलिटी की प्रविष्टियों के सभी सबसेट के संग्रह से यादृच्छिक रूप से समान रूप से नमूना लिया जाता है <math>|E|</math>. विश्लेषण को और सरल बनाने के लिए, इसके बजाय यह मान लिया गया है <math>E</math> [[बर्नौली नमूनाकरण]] द्वारा निर्मित किया गया है, अर्थात प्रत्येक प्रविष्टि को संभाव्यता के साथ देखा जाता है <math> p </math>. अगर <math>p</math> इसके लिए सेट है <math>\frac{N}{mn}</math> कहाँ <math>N</math> की वांछित अपेक्षित कार्डिनैलिटी है <math>E</math>, और <math>m,\;n</math> | विश्लेषण को सुव्यवस्थित बनाने के लिए, अक्सर यह मान लिया जाता है कि सेट <math>E</math> देखी गई प्रविष्टियों और निश्चित [[प्रमुखता]] को कार्डिनैलिटी की प्रविष्टियों के सभी सबसेट के संग्रह से यादृच्छिक रूप से समान रूप से नमूना लिया जाता है <math>|E|</math>. विश्लेषण को और सरल बनाने के लिए, इसके बजाय यह मान लिया गया है <math>E</math> [[बर्नौली नमूनाकरण]] द्वारा निर्मित किया गया है, अर्थात प्रत्येक प्रविष्टि को संभाव्यता के साथ देखा जाता है <math> p </math>. अगर <math>p</math> इसके लिए सेट है <math>\frac{N}{mn}</math> कहाँ <math>N</math> की वांछित अपेक्षित कार्डिनैलिटी है <math>E</math>, और <math>m,\;n</math> आव्यूह के आयाम हैं (मान लीजिए <math>m < n</math> व्यापकता के नुकसान के बिना), <math>|E|</math> भीतर है <math>O(n \log n)</math> का <math>N</math> उच्च संभावना के साथ, इस प्रकार बर्नौली नमूनाकरण एकसमान नमूने के लिए अच्छा सन्निकटन है।<ref name="candesrecht" /> और सरलीकरण यह मान लेना है कि प्रविष्टियाँ स्वतंत्र रूप से और प्रतिस्थापन के साथ नमूनाकृत की जाती हैं।<ref name="recht" /> | ||
==== प्रेक्षित प्रविष्टियों की संख्या की निचली सीमा ==== | ==== प्रेक्षित प्रविष्टियों की संख्या की निचली सीमा ==== | ||
मान लीजिये <math>m</math> द्वारा <math>n</math> आव्यूह <math>M</math> (साथ <math>m < n</math>) हम रैंक (रैखिक बीजगणित) को पुनर्प्राप्त करने का प्रयास कर रहे हैं <math>r</math>. पहले कितनी प्रविष्टियाँ देखी जानी चाहिए, इस पर सूचना सैद्धांतिक निचली सीमा है <math>M</math> विशिष्ट रूप से पुनर्निर्माण किया जा सकता है। के समुच्चय <math>m</math> द्वारा <math>n</math> इससे कम या उसके बराबर रैंक वाले | मान लीजिये <math>m</math> द्वारा <math>n</math> आव्यूह <math>M</math> (साथ <math>m < n</math>) हम रैंक (रैखिक बीजगणित) को पुनर्प्राप्त करने का प्रयास कर रहे हैं <math>r</math>. पहले कितनी प्रविष्टियाँ देखी जानी चाहिए, इस पर सूचना सैद्धांतिक निचली सीमा है <math>M</math> विशिष्ट रूप से पुनर्निर्माण किया जा सकता है। के समुच्चय <math>m</math> द्वारा <math>n</math> इससे कम या उसके बराबर रैंक वाले आव्यूह <math>r</math> में बीजगणितीय किस्म है <math>{\mathbb C}^{m\times n}</math>आयाम के साथ <math>(n+m)r - r^2</math>. | ||
इस परिणाम का उपयोग करते हुए, | इस परिणाम का उपयोग करते हुए, | ||
कोई इसे कम से कम दिखा तो सकता है | कोई इसे कम से कम दिखा तो सकता है | ||
<math>4nr - 4r^2</math> | <math>4nr - 4r^2</math> | ||
आव्यूह पूर्णता के लिए प्रविष्टियों का अवलोकन किया जाना चाहिए | |||
<math> {\mathbb C}^{n \times n} </math> | <math> {\mathbb C}^{n \times n} </math> | ||
एक अनोखा समाधान पाने के लिए | एक अनोखा समाधान पाने के लिए | ||
Line 38: | Line 40: | ||
.<ref name = "xu"/> | .<ref name = "xu"/> | ||
दूसरे, प्रति पंक्ति और स्तंभ में कम से कम प्रेक्षित प्रविष्टि होनी चाहिए <math>M</math>. का एकवचन मूल्य अपघटन <math>M</math> द्वारा दिया गया है <math>U\Sigma V^\dagger</math>. यदि पंक्ति <math>i</math> अप्राप्य है, इसे देखना आसान है <math>i^{\text{th}}</math> का दायां एकवचन सदिश <math>M</math>, <math>v_i</math>, कुछ मनमाने मूल्य में बदला जा सकता है और फिर भी | दूसरे, प्रति पंक्ति और स्तंभ में कम से कम प्रेक्षित प्रविष्टि होनी चाहिए <math>M</math>. का एकवचन मूल्य अपघटन <math>M</math> द्वारा दिया गया है <math>U\Sigma V^\dagger</math>. यदि पंक्ति <math>i</math> अप्राप्य है, इसे देखना आसान है <math>i^{\text{th}}</math> का दायां एकवचन सदिश <math>M</math>, <math>v_i</math>, कुछ मनमाने मूल्य में बदला जा सकता है और फिर भी आव्यूह मिलान प्राप्त हो सकता है <math>M</math> प्रेक्षित प्रविष्टियों के सेट पर। इसी प्रकार, यदि कॉलम <math>j</math> अवलोकित है, <math>j^{\text{th}}</math> का बायां एकवचन सदिश <math>M</math>, <math>u_i</math> मनमाना हो सकता है. यदि हम प्रेक्षित प्रविष्टियों के सेट का बर्नौली नमूनाकरण मानते हैं, तो कूपन कलेक्टर की समस्या का तात्पर्य है कि प्रविष्टियाँ के क्रम पर <math>O(n\log n)</math> यह सुनिश्चित करने के लिए अवश्य देखा जाना चाहिए कि उच्च संभावना के साथ प्रत्येक पंक्ति और स्तंभ से अवलोकन हो।<ref name="candestao" /> | ||
आवश्यक शर्तों को संयोजित करना और यह मान लेना <math>r \ll m, n</math> (कई व्यावहारिक अनुप्रयोगों के लिए वैध धारणा), | आवश्यक शर्तों को संयोजित करना और यह मान लेना <math>r \ll m, n</math> (कई व्यावहारिक अनुप्रयोगों के लिए वैध धारणा), आव्यूह पूर्णता की समस्या को कम निर्धारित होने से रोकने के लिए आवश्यक देखी गई प्रविष्टियों की संख्या की निचली सीमा के क्रम पर है <math>nr\log n </math>. | ||
====असंगति ==== | ====असंगति ==== | ||
संपीडित संवेदन में असंगति की अवधारणा उत्पन्न हुई। इसे एकवचन वैक्टर सुनिश्चित करने के लिए | संपीडित संवेदन में असंगति की अवधारणा उत्पन्न हुई। इसे एकवचन वैक्टर सुनिश्चित करने के लिए आव्यूह पूर्णता के संदर्भ में पेश किया गया है <math>M</math> इस अर्थ में बहुत विरल नहीं हैं कि प्रत्येक एकवचन वेक्टर के सभी निर्देशांक तुलनीय परिमाण के होते हैं, न कि केवल कुछ निर्देशांक जिनमें काफी बड़े परिमाण होते हैं।<ref name="tao" /><ref name="nguyenkimshim" /> मानक आधार वैक्टर तब एकवचन वैक्टर और वेक्टर के रूप में अवांछनीय होते हैं <math> \frac{1}{\sqrt{n}} \begin{bmatrix} 1 \\ 1 \\ \vdots \\ 1 \end{bmatrix} </math> में <math>\mathbb{R}^n</math> ये इच्छित है। यदि एकवचन सदिश पर्याप्त रूप से विरल हों तो क्या गलत हो सकता है, इसके उदाहरण के रूप में, इस पर विचार करें <math>m</math> द्वारा <math>n</math> आव्यूह <math>\begin{bmatrix} 1 & 0 & \cdots & 0 \\ \vdots & & \vdots \\ 0 & 0 & 0 & 0 \end{bmatrix}</math> एकल मूल्य अपघटन के साथ <math>I_m \begin{bmatrix} 1 & 0 & \cdots & 0 \\ \vdots & & \vdots \\ 0 & 0 & 0 & 0 \end{bmatrix} I_n</math>. की लगभग सभी प्रविष्टियाँ <math>M</math> इसका पुनर्निर्माण करने से पहले इसका नमूना लिया जाना चाहिए। | ||
कैंडेस और रेख्त<ref name="candesrecht" /> | कैंडेस और रेख्त<ref name="candesrecht" />आव्यूह की सुसंगतता को परिभाषित करें <math>U</math> [[स्तंभ स्थान]] के साथ ए <math>r-</math>का आयामी उपस्थान <math>\mathbb{R}^n</math> जैसा <math>\mu (U) = \frac{n}{r} \max_{i < n} \|P_U e_i\|^2 </math>, कहाँ <math>P_U</math> ओर्थोगोनल प्रोजेक्शन (गणित) है <math> U </math>. असंगतता तब दावा करती है कि एकवचन मूल्य अपघटन दिया गया है <math>U\Sigma V^\dagger</math> की <math>m</math> द्वारा <math>n</math> आव्यूह <math>M</math>, | ||
# <math>\mu (U), \; \mu (V) \leq \mu_0 </math> | # <math>\mu (U), \; \mu (V) \leq \mu_0 </math> | ||
Line 51: | Line 53: | ||
कुछ के लिए <math>\mu_0, \; \mu_1</math>. | कुछ के लिए <math>\mu_0, \; \mu_1</math>. | ||
== शोर के साथ निम्न रैंक | == शोर के साथ निम्न रैंक आव्यूह पूर्णता == | ||
वास्तविक दुनिया के अनुप्रयोग में, अक्सर केवल कुछ ही प्रविष्टियाँ देखी जाती हैं जो कम से कम थोड़ी मात्रा में शोर से दूषित हो जाती हैं। उदाहरण के लिए, नेटफ्लिक्स समस्या में, रेटिंग अनिश्चित हैं। कैंडेस और योजना <ref name="candesplan"/>दिखाया गया कि परमाणु मानक न्यूनतमकरण द्वारा केवल कुछ शोर वाले नमूनों से बड़े निम्न-रैंक | वास्तविक दुनिया के अनुप्रयोग में, अक्सर केवल कुछ ही प्रविष्टियाँ देखी जाती हैं जो कम से कम थोड़ी मात्रा में शोर से दूषित हो जाती हैं। उदाहरण के लिए, नेटफ्लिक्स समस्या में, रेटिंग अनिश्चित हैं। कैंडेस और योजना <ref name="candesplan"/>दिखाया गया कि परमाणु मानक न्यूनतमकरण द्वारा केवल कुछ शोर वाले नमूनों से बड़े निम्न-रैंक आव्यूह की कई लापता प्रविष्टियों को भरना संभव है। शोर मॉडल मानता है कि हम निरीक्षण करते हैं | ||
<math> Y_{ij} = M_{ij} + Z_{ij}, (i,j) \in \Omega, </math> | <math> Y_{ij} = M_{ij} + Z_{ij}, (i,j) \in \Omega, </math> | ||
Line 58: | Line 60: | ||
<math> P_\Omega(Y) = P_\Omega(M) + P_\Omega(Z), </math> | <math> P_\Omega(Y) = P_\Omega(M) + P_\Omega(Z), </math> | ||
कहाँ <math>Z</math> <math>n \times n</math> प्रविष्टियों के साथ | कहाँ <math>Z</math> <math>n \times n</math> प्रविष्टियों के साथ आव्यूह <math>Z_{ij}</math> के लिए <math>(i,j) \in \Omega</math> ये मानते हुए <math>\|P_\Omega(Z)\|_F\leq\delta </math> कुछ के लिए <math>\delta > 0 </math> अपूर्ण आव्यूह को पुनर्प्राप्त करने के लिए, हम निम्नलिखित अनुकूलन समस्या को हल करने का प्रयास करते हैं: | ||
<math> | <math> | ||
Line 66: | Line 68: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
डेटा के अनुरूप सभी | डेटा के अनुरूप सभी आव्यूह में से, न्यूनतम परमाणु मानदंड वाला ढूंढें। कैंडेस और योजना <ref name="candesplan"/>दिखाया है कि यह पुनर्निर्माण सटीक है। उन्होंने यह साबित कर दिया है कि जब पूर्ण ध्वनि रहित पुनर्प्राप्ति होती है, तो गड़बड़ी की तुलना में आव्यूह पूर्णता स्थिर होती है। त्रुटि शोर स्तर के समानुपाती होती है <math>\delta</math>. इसलिए, जब शोर का स्तर छोटा होता है, तो त्रुटि छोटी होती है। यहां आव्यूह पूर्णता समस्या प्रतिबंधित आइसोमेट्री प्रॉपर्टी (आरआईपी) का पालन नहीं करती है। मैट्रिसेस के लिए, आरआईपी यह मान लेगा कि सैंपलिंग ऑपरेटर उसका पालन करता है | ||
<math> | <math> | ||
(1-\delta)\|X\|^2_F \leq \frac{1}{p}\|P_\Omega(X)\|^2_F \leq (1+\delta)\|X\|^2_F | (1-\delta)\|X\|^2_F \leq \frac{1}{p}\|P_\Omega(X)\|^2_F \leq (1+\delta)\|X\|^2_F | ||
</math> | </math> | ||
सभी | सभी आव्यूह के लिए <math>X</math> पर्याप्त रूप से छोटी रैंक के साथ और <math>\delta<1</math> पर्याप्त रूप से छोटा. | ||
विधियाँ विरल सिग्नल पुनर्प्राप्ति समस्याओं पर भी लागू होती हैं जिनमें RIP पकड़ में नहीं आता है। | विधियाँ विरल सिग्नल पुनर्प्राप्ति समस्याओं पर भी लागू होती हैं जिनमें RIP पकड़ में नहीं आता है। | ||
== उच्च रैंक | == उच्च रैंक आव्यूह पूर्णता == | ||
सामान्य तौर पर उच्च रैंक | सामान्य तौर पर उच्च रैंक आव्यूह पूर्णता [[ एनपी हार्ड |एनपी हार्ड]] है। हालाँकि, कुछ मान्यताओं के साथ, कुछ अधूरे उच्च रैंक आव्यूह या यहाँ तक कि पूर्ण रैंक आव्यूह को भी पूरा किया जा सकता है। | ||
एरिक्सन, बाल्ज़ानो और नोवाक <ref name="erikssonbalzano"/>एक | एरिक्सन, बाल्ज़ानो और नोवाक <ref name="erikssonbalzano"/>एक आव्यूह को पूरा करने की समस्या पर इस धारणा के साथ विचार किया है कि आव्यूह के कॉलम कई निम्न-रैंक उप-स्थानों के संघ से संबंधित हैं। चूंकि कॉलम उप-स्थानों के संघ से संबंधित हैं, इसलिए समस्या को क्लस्टरिंग उच्च-आयामी डेटा समस्या के लापता-डेटा संस्करण के रूप में देखा जा सकता है। होने देना <math>X</math> सेम <math>n \times N</math> आव्यूह जिसके (पूर्ण) कॉलम अधिक से अधिक के संघ में स्थित हैं <math>k</math> उप-स्थान, प्रत्येक <math>rank \leq r < n</math>, और मान लीजिये <math>N \gg kn</math>. एरिक्सन, बाल्ज़ानो और नोवाक <ref name="erikssonbalzano" />दिखाया गया है कि हल्की धारणाओं के तहत प्रत्येक कॉलम <math>X</math> कम से कम लंबे समय तक अपूर्ण संस्करण से उच्च संभावना के साथ पूरी तरह से पुनर्प्राप्त किया जा सकता है <math>CrN\log^2(n)</math> की प्रविष्टियाँ <math>X</math> यादृच्छिक रूप से समान रूप से देखे जाते हैं <math>C>1</math> सामान्य असंगति स्थितियों, उप-स्थानों की ज्यामितीय व्यवस्था और उप-स्थानों पर स्तंभों के वितरण के आधार पर स्थिरांक। | ||
एल्गोरिदम में कई चरण शामिल हैं: (1) स्थानीय पड़ोस; (2) स्थानीय उपस्थान; (3) उपस्थान परिशोधन; (4) पूर्ण | एल्गोरिदम में कई चरण शामिल हैं: (1) स्थानीय पड़ोस; (2) स्थानीय उपस्थान; (3) उपस्थान परिशोधन; (4) पूर्ण आव्यूह पूर्णता। इस पद्धति को इंटरनेट दूरी आव्यूह पूर्णता और टोपोलॉजी पहचान पर लागू किया जा सकता है। | ||
== निम्न-रैंक | == निम्न-रैंक आव्यूह समापन के लिए एल्गोरिदम == | ||
विभिन्न | विभिन्न आव्यूह पूर्णता एल्गोरिदम प्रस्तावित किए गए हैं।<ref name="nguyenkimshim" />इनमें उत्तल विश्राम-आधारित एल्गोरिदम शामिल है,<ref name="candesrecht" />ग्रेडिएंट-आधारित एल्गोरिदम,<ref name="keshavan" />और वैकल्पिक न्यूनतमकरण-आधारित एल्गोरिदम।<ref name="jainnetrapalli" /> | ||
Line 94: | Line 96: | ||
& & & \begin{bmatrix} W_1 & X \\ X^T & W_2 \end{bmatrix} \succeq 0 | & & & \begin{bmatrix} W_1 & X \\ X^T & W_2 \end{bmatrix} \succeq 0 | ||
\end{align}</math> | \end{align}</math> | ||
उत्तल विश्राम को हल करने के लिए अर्धनिश्चित प्रोग्रामिंग का उपयोग करने की जटिलता है <math>O(\text{max}(m,n)^4)</math>. SDPT3 जैसे अत्याधुनिक सॉल्वर केवल 100 गुणा 100 तक के आकार के | उत्तल विश्राम को हल करने के लिए अर्धनिश्चित प्रोग्रामिंग का उपयोग करने की जटिलता है <math>O(\text{max}(m,n)^4)</math>. SDPT3 जैसे अत्याधुनिक सॉल्वर केवल 100 गुणा 100 तक के आकार के आव्यूह को संभाल सकते हैं <ref name = "caicandesshen"/> वैकल्पिक प्रथम क्रम विधि जो उत्तल विश्राम को लगभग हल करती है वह काई, कैंडेस और शेन द्वारा प्रस्तुत सिंगुलर वैल्यू थ्रेशोल्डिंग एल्गोरिदम है।<ref name = "caicandesshen"/> | ||
कैंडेस और रेख्त बैनाच स्थानों पर यादृच्छिक चर के अध्ययन का उपयोग करके दिखाते हैं कि यदि देखी गई प्रविष्टियों की संख्या के क्रम पर है <math>\max{\{\mu_1^2, \sqrt{\mu_0}\mu_1, \mu_0 n^{0.25}\}}nr \log n </math> (सामान्यता की हानि के बिना मान लें <math>m < n</math>), रैंक न्यूनीकरण समस्या का अनूठा समाधान है जो संभाव्यता के साथ इसके उत्तल विश्राम का समाधान भी होता है <math>1-\frac{c}{n^3}</math> कुछ स्थिरांक के लिए <math>c</math>. यदि की रैंक <math>M</math> छोटा है (<math> r \leq \frac{n^{0.2}}{\mu_0}</math>), प्रेक्षणों के सेट का आकार के क्रम में कम हो जाता है <math>\mu_0 n^{1.2} r \log n</math>. ये परिणाम इष्टतम के करीब हैं, क्योंकि | कैंडेस और रेख्त बैनाच स्थानों पर यादृच्छिक चर के अध्ययन का उपयोग करके दिखाते हैं कि यदि देखी गई प्रविष्टियों की संख्या के क्रम पर है <math>\max{\{\mu_1^2, \sqrt{\mu_0}\mu_1, \mu_0 n^{0.25}\}}nr \log n </math> (सामान्यता की हानि के बिना मान लें <math>m < n</math>), रैंक न्यूनीकरण समस्या का अनूठा समाधान है जो संभाव्यता के साथ इसके उत्तल विश्राम का समाधान भी होता है <math>1-\frac{c}{n^3}</math> कुछ स्थिरांक के लिए <math>c</math>. यदि की रैंक <math>M</math> छोटा है (<math> r \leq \frac{n^{0.2}}{\mu_0}</math>), प्रेक्षणों के सेट का आकार के क्रम में कम हो जाता है <math>\mu_0 n^{1.2} r \log n</math>. ये परिणाम इष्टतम के करीब हैं, क्योंकि आव्यूह पूर्णता समस्या को कम निर्धारित न करने के लिए देखी जाने वाली प्रविष्टियों की न्यूनतम संख्या के क्रम पर है <math>nr \log n</math>. | ||
कैंडेस और ताओ द्वारा इस परिणाम में सुधार किया गया है।<ref name="candestao" /> वे ऐसी सीमाएँ प्राप्त करते हैं जो मान्यताओं को मजबूत करके केवल पॉलीलॉगरिदमिक कार्यात्मक कारकों द्वारा इष्टतम सीमाओं से भिन्न होती हैं। असंगति संपत्ति के बजाय, वे पैरामीटर के साथ मजबूत असंगति संपत्ति मानते हैं <math>\mu_3</math>. यह संपत्ति बताती है कि: | कैंडेस और ताओ द्वारा इस परिणाम में सुधार किया गया है।<ref name="candestao" /> वे ऐसी सीमाएँ प्राप्त करते हैं जो मान्यताओं को मजबूत करके केवल पॉलीलॉगरिदमिक कार्यात्मक कारकों द्वारा इष्टतम सीमाओं से भिन्न होती हैं। असंगति संपत्ति के बजाय, वे पैरामीटर के साथ मजबूत असंगति संपत्ति मानते हैं <math>\mu_3</math>. यह संपत्ति बताती है कि: | ||
Line 102: | Line 104: | ||
# <math>| \langle e_a, P_U e_{a'} \rangle - \frac{r}{m} 1_{a = a'} | \leq \mu_3 \frac{\sqrt{r}}{m} </math> के लिए <math>a, a' \leq m</math> और <math>| \langle e_b, P_U e_{b'} \rangle - \frac{r}{n} 1_{b = b'} | \leq \mu_3 \frac{\sqrt{r}}{n} </math> के लिए <math>b, b' \leq n </math> | # <math>| \langle e_a, P_U e_{a'} \rangle - \frac{r}{m} 1_{a = a'} | \leq \mu_3 \frac{\sqrt{r}}{m} </math> के लिए <math>a, a' \leq m</math> और <math>| \langle e_b, P_U e_{b'} \rangle - \frac{r}{n} 1_{b = b'} | \leq \mu_3 \frac{\sqrt{r}}{n} </math> के लिए <math>b, b' \leq n </math> | ||
# की प्रविष्टियाँ <math>\sum_i u_i v_i^\dagger </math> द्वारा परिमाण में बंधे हैं <math>\mu_3 \sqrt{\frac{r}{mn}}</math> | # की प्रविष्टियाँ <math>\sum_i u_i v_i^\dagger </math> द्वारा परिमाण में बंधे हैं <math>\mu_3 \sqrt{\frac{r}{mn}}</math> | ||
सहज रूप से, | सहज रूप से, आव्यूह की मजबूत असंगति <math>U</math> यह दावा करता है कि मानक आधार वैक्टर के ऑर्थोगोनल अनुमान <math>U</math> यदि एकवचन सदिशों को यादृच्छिक रूप से वितरित किया जाए तो ऐसे परिमाण होते हैं जिनकी संभावना अधिक होती है।<ref name="tao" /> | ||
कैंडेस और ताओ को वह कब मिला <math>r</math> है <math>O(1)</math> और प्रेक्षित प्रविष्टियों की संख्या के क्रम पर है <math>\mu_3^4 n(\log n)^2</math>, रैंक न्यूनीकरण समस्या का अनूठा समाधान है जो संभाव्यता के साथ इसके उत्तल विश्राम का समाधान भी होता है <math>1-\frac{c}{n^3}</math> कुछ स्थिरांक के लिए <math>c</math>. मनमानी के लिए <math>r</math>, इस दावे के लिए पर्याप्त प्रेक्षित प्रविष्टियों की संख्या सत्य है <math>\mu_3^2 nr (\log n)^6</math> | कैंडेस और ताओ को वह कब मिला <math>r</math> है <math>O(1)</math> और प्रेक्षित प्रविष्टियों की संख्या के क्रम पर है <math>\mu_3^4 n(\log n)^2</math>, रैंक न्यूनीकरण समस्या का अनूठा समाधान है जो संभाव्यता के साथ इसके उत्तल विश्राम का समाधान भी होता है <math>1-\frac{c}{n^3}</math> कुछ स्थिरांक के लिए <math>c</math>. मनमानी के लिए <math>r</math>, इस दावे के लिए पर्याप्त प्रेक्षित प्रविष्टियों की संख्या सत्य है <math>\mu_3^2 nr (\log n)^6</math> | ||
Line 114: | Line 116: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
एक ऑर्थोगोनल प्रोजेक्शन | एक ऑर्थोगोनल प्रोजेक्शन आव्यूह पेश करके <math>Y</math> (अर्थ <math>Y^2=Y, Y=Y'</math>) के रैंक को मॉडल करने के लिए <math>X</math> के जरिए <math>X=YX, \text{trace}(Y)\leq k</math> और इस समस्या का उत्तल विश्राम लेते हुए, हम निम्नलिखित अर्धनिश्चित कार्यक्रम प्राप्त करते हैं | ||
<math> | <math> | ||
Line 124: | Line 126: | ||
\end{align} | \end{align} | ||
</math> | </math> | ||
यदि इस विश्राम में Y प्रक्षेपण | यदि इस विश्राम में Y प्रक्षेपण आव्यूह है (अर्थात, इसमें द्विआधारी eigenvalues है), तो विश्राम तंग है। अन्यथा, यह समग्र उद्देश्य पर वैध निचली सीमा देता है। इसके अलावा, इसे Y के स्वदेशी मानों को लालचपूर्वक पूर्णांकित करके (थोड़े) बड़े उद्देश्य के साथ व्यवहार्य समाधान में परिवर्तित किया जा सकता है।<ref name="bertsimas2021mixed" />उल्लेखनीय रूप से, इस उत्तल विश्राम को किसी भी एसडीपी को हल किए बिना एक्स और वाई पर वैकल्पिक न्यूनतमकरण द्वारा हल किया जा सकता है, और इस प्रकार यह एसडीपीटी 3 या मोसेक जैसे अत्याधुनिक एसडीपी सॉल्वरों की विशिष्ट संख्यात्मक सीमाओं से परे है। | ||
यह दृष्टिकोण अधिक सामान्य सुधार तकनीक का विशेष मामला है, जिसे ट्रेस-मैट्रिक्स-उत्तल उद्देश्य के साथ किसी भी निम्न-रैंक समस्या पर वैध निचली सीमा प्राप्त करने के लिए लागू किया जा सकता है।<ref name="bertsimas2021perspective" /> | यह दृष्टिकोण अधिक सामान्य सुधार तकनीक का विशेष मामला है, जिसे ट्रेस-मैट्रिक्स-उत्तल उद्देश्य के साथ किसी भी निम्न-रैंक समस्या पर वैध निचली सीमा प्राप्त करने के लिए लागू किया जा सकता है।<ref name="bertsimas2021perspective" /> | ||
Line 130: | Line 132: | ||
=== क्रमिक अवतरण === | === क्रमिक अवतरण === | ||
केशवन, मोंटानारी और ओह<ref name="keshavan" /> | केशवन, मोंटानारी और ओह<ref name="keshavan" />आव्यूह पूर्णता के प्रकार पर विचार करें जहां की रैंक (रैखिक बीजगणित)। <math>m</math> द्वारा <math>n</math> आव्यूह <math>M</math>, जिसे पुनर्प्राप्त किया जाना है, ज्ञात है <math>r</math>. वे प्रविष्टियों के बर्नौली नमूने, निरंतर पहलू अनुपात को मानते हैं <math>\frac{m}{n}</math>, की प्रविष्टियों का परिबद्ध परिमाण <math>M</math> (ऊपरी सीमा रहने दें <math>M_{\text{max}}</math>), और स्थिर स्थिति संख्या <math>\frac{\sigma_1}{\sigma_r}</math> (कहाँ <math>\sigma_1</math> और <math>\sigma_r</math> के सबसे बड़े और सबसे छोटे एकवचन मान हैं <math>M</math> क्रमश)। इसके अलावा, वे मानते हैं कि दो असंगति स्थितियाँ संतुष्ट हैं <math>\mu_0</math> और <math>\mu_1 \frac{\sigma_1}{\sigma_r}</math> कहाँ <math>\mu_0</math> और <math>\mu_1</math> स्थिरांक हैं. होने देना <math>M^E</math> ऐसा आव्यूह बनें जो मेल खाता हो <math>M</math> मंच पर <math>E</math> प्रेक्षित प्रविष्टियों की संख्या अन्यत्र 0 है। फिर वे निम्नलिखित एल्गोरिथम प्रस्तावित करते हैं: | ||
# काट-छांट करना <math>M^E</math> से अधिक डिग्री वाले स्तंभों से सभी अवलोकनों को हटाकर <math>\frac{2|E|}{n}</math> कॉलम में प्रविष्टियों को 0 पर सेट करके। इसी प्रकार इससे बड़ी डिग्री वाली पंक्तियों से सभी अवलोकन हटा दें <math>\frac{2|E|}{n}</math>. | # काट-छांट करना <math>M^E</math> से अधिक डिग्री वाले स्तंभों से सभी अवलोकनों को हटाकर <math>\frac{2|E|}{n}</math> कॉलम में प्रविष्टियों को 0 पर सेट करके। इसी प्रकार इससे बड़ी डिग्री वाली पंक्तियों से सभी अवलोकन हटा दें <math>\frac{2|E|}{n}</math>. | ||
# परियोजना <math>M^E</math> इसके पहले पर <math>r</math> [[प्रमुख कंपोनेंट विश्लेषण]]। परिणामी | # परियोजना <math>M^E</math> इसके पहले पर <math>r</math> [[प्रमुख कंपोनेंट विश्लेषण]]। परिणामी आव्यूह को कॉल करें <math>\text{Tr}(M^E)</math>. | ||
# हल करना <math> \min_{X,Y} \min_{S \in \mathbb{R}^{r \times r}} \frac{1}{2} \sum_{i,j \in E} (M_{ij} - (XSY^\dagger)_{ij})^2 + \rho G(X,Y)</math> कहाँ <math>G(X,Y)</math> [[ पंक्ति खोज |पंक्ति खोज]] के साथ [[ ढतला हुआ वंश |ढतला हुआ वंश]] द्वारा कुछ नियमितीकरण (गणित) फ़ंक्शन है। प्रारंभ <math>X,\;Y</math> पर <math>X_0,\;Y_0</math> कहाँ <math>\text{Tr}(M_E) = X_0 S_0 Y_0^\dagger</math>. तय करना <math>G(X,Y)</math> कुछ फ़ंक्शन फ़ोर्सिंग के रूप में <math>X, \; Y</math> यदि ग्रेडिएंट डिसेंट के दौरान असंगत बने रहें <math>X_0</math> और <math>Y_0</math> असंगत हैं. | # हल करना <math> \min_{X,Y} \min_{S \in \mathbb{R}^{r \times r}} \frac{1}{2} \sum_{i,j \in E} (M_{ij} - (XSY^\dagger)_{ij})^2 + \rho G(X,Y)</math> कहाँ <math>G(X,Y)</math> [[ पंक्ति खोज |पंक्ति खोज]] के साथ [[ ढतला हुआ वंश |ढतला हुआ वंश]] द्वारा कुछ नियमितीकरण (गणित) फ़ंक्शन है। प्रारंभ <math>X,\;Y</math> पर <math>X_0,\;Y_0</math> कहाँ <math>\text{Tr}(M_E) = X_0 S_0 Y_0^\dagger</math>. तय करना <math>G(X,Y)</math> कुछ फ़ंक्शन फ़ोर्सिंग के रूप में <math>X, \; Y</math> यदि ग्रेडिएंट डिसेंट के दौरान असंगत बने रहें <math>X_0</math> और <math>Y_0</math> असंगत हैं. | ||
# | # आव्यूह लौटाएं <math>XSY^\dagger</math>. | ||
एल्गोरिथम के चरण 1 और 2 से | एल्गोरिथम के चरण 1 और 2 से आव्यूह प्राप्त होता है <math>\text{Tr}(M^E)</math> सच्चे आव्यूह के बहुत करीब <math>M</math> (जैसा कि [[मूल माध्य वर्ग विचलन]] | मूल माध्य वर्ग त्रुटि (आरएमएसई) द्वारा मापा जाता है) उच्च संभावना के साथ। विशेषकर, संभाव्यता के साथ <math>1-\frac{1}{n^3}</math>, <math>\frac{1}{mnM_{\text{max}}^2} \| M - \text{Tr}(M^E) \|_F^2 \leq C \frac{r}{m|E|} \sqrt{\frac{m}{n}} </math> कुछ स्थिरांक के लिए <math>C</math>. <math>\| \cdot \|_F</math> फ्रोबेनियस [[मैट्रिक्स मानदंड|आव्यूह मानदंड]] को दर्शाता है। ध्यान दें कि इस परिणाम को धारण करने के लिए मान्यताओं के पूरे सेट की आवश्यकता नहीं है। उदाहरण के लिए, असंगति की स्थिति केवल सटीक पुनर्निर्माण में ही लागू होती है। अंत में, हालाँकि ट्रिमिंग काउंटर सहज ज्ञान युक्त लग सकती है क्योंकि इसमें जानकारी को बाहर फेंकना शामिल है, यह प्रोजेक्टिंग सुनिश्चित करता है <math>M^E</math> इसके पहले पर <math>r</math> प्रमुख घटक विश्लेषण अंतर्निहित आव्यूह के बारे में अधिक जानकारी देता है <math>M</math> देखी गई प्रविष्टियों के बारे में। | ||
चरण 3 में, उम्मीदवार | चरण 3 में, उम्मीदवार आव्यूह का स्थान <math>X,\;Y</math> यह ध्यान देकर कम किया जा सकता है कि आंतरिक न्यूनतमकरण समस्या का समाधान समान है <math>(X,Y)</math> से संबंधित <math>(XQ,YR)</math> कहाँ <math>Q</math> और <math>R</math> आह, रूढ़िवादिता <math>r</math> द्वारा <math>r</math> matrices. फिर दो [[ग्रासमैनियन]] के क्रॉस उत्पाद पर ग्रेडिएंट डिसेंट का प्रदर्शन किया जा सकता है। अगर <math>r \ll m,\;n</math> और प्रेक्षित प्रविष्टि सेट के क्रम में है <math>nr\log n</math>, चरण 3 द्वारा लौटाया गया आव्यूह बिल्कुल सही है <math>M</math>. तब एल्गोरिथ्म ऑर्डर इष्टतम है, क्योंकि हम जानते हैं कि आव्यूह पूर्णता समस्या के लिए सिस्टम को कम निर्धारित नहीं किया जाना चाहिए, प्रविष्टियों की संख्या क्रम में होनी चाहिए <math>nr\log n</math>. | ||
=== वैकल्पिक न्यूनतम वर्ग न्यूनतमकरण === | === वैकल्पिक न्यूनतम वर्ग न्यूनतमकरण === | ||
वैकल्पिक न्यूनीकरण निम्न-रैंक | वैकल्पिक न्यूनीकरण निम्न-रैंक आव्यूह खोजने के लिए व्यापक रूप से लागू और अनुभवजन्य रूप से सफल दृष्टिकोण का प्रतिनिधित्व करता है जो दिए गए डेटा के लिए सबसे उपयुक्त है। उदाहरण के लिए, निम्न-रैंक आव्यूह पूर्णता की समस्या के लिए, इस विधि को सबसे सटीक और कुशल में से माना जाता है, और नेटफ्लिक्स समस्या में विजेता प्रविष्टि का प्रमुख घटक बनता है। वैकल्पिक न्यूनतमकरण दृष्टिकोण में, निम्न-रैंक लक्ष्य आव्यूह को [[द्विरेखीय रूप]] में लिखा जाता है: | ||
<math>X= UV^T</math>; | <math>X= UV^T</math>; | ||
फिर एल्गोरिदम सर्वश्रेष्ठ खोजने के बीच वैकल्पिक होता है <math>U</math> और सबसे अच्छा <math>V</math>. जबकि समग्र समस्या गैर-उत्तल है, प्रत्येक उप-समस्या आम तौर पर उत्तल होती है और इसे कुशलता से हल किया जा सकता है। जैन, नेत्रपल्ली और संघवी <ref name="jainnetrapalli" /> | फिर एल्गोरिदम सर्वश्रेष्ठ खोजने के बीच वैकल्पिक होता है <math>U</math> और सबसे अच्छा <math>V</math>. जबकि समग्र समस्या गैर-उत्तल है, प्रत्येक उप-समस्या आम तौर पर उत्तल होती है और इसे कुशलता से हल किया जा सकता है। जैन, नेत्रपल्ली और संघवी <ref name="jainnetrapalli" />आव्यूह पूर्णता और आव्यूह सेंसिंग दोनों के लिए वैकल्पिक न्यूनतमकरण के प्रदर्शन के लिए पहली गारंटी दी गई है। | ||
वैकल्पिक न्यूनतमकरण एल्गोरिथ्म को निम्नलिखित गैर-उत्तल समस्या को हल करने के अनुमानित तरीके के रूप में देखा जा सकता है: | वैकल्पिक न्यूनतमकरण एल्गोरिथ्म को निम्नलिखित गैर-उत्तल समस्या को हल करने के अनुमानित तरीके के रूप में देखा जा सकता है: | ||
Line 163: | Line 165: | ||
#के लिए समाप्त | #के लिए समाप्त | ||
# वापस करना <math>X= \hat{U}^T(\hat{V}^T)^T</math> | # वापस करना <math>X= \hat{U}^T(\hat{V}^T)^T</math> | ||
उन्होंने देख कर दिखाया <math>|\Omega| = O((\frac{\sigma_1^*}{\sigma_k^*})^6k^7\log n \log (k \|M\|_F/\epsilon))</math> असंगत | उन्होंने देख कर दिखाया <math>|\Omega| = O((\frac{\sigma_1^*}{\sigma_k^*})^6k^7\log n \log (k \|M\|_F/\epsilon))</math> असंगत आव्यूह की यादृच्छिक प्रविष्टियाँ <math>M</math>, AltMinComplete एल्गोरिदम पुनर्प्राप्त कर सकता है <math>M</math> में <math>O(\log(1/\epsilon))</math> कदम। नमूना जटिलता के संदर्भ में (<math>|\Omega|</math>), सैद्धांतिक रूप से, वैकल्पिक न्यूनतमकरण के लिए बड़ी आवश्यकता हो सकती है <math>\Omega</math> उत्तल विश्राम से. हालाँकि अनुभवजन्य रूप से ऐसा नहीं लगता है जिसका तात्पर्य यह है कि नमूना जटिलता सीमा को और कड़ा किया जा सकता है। समय की जटिलता के संदर्भ में, उन्होंने दिखाया कि AltMinComplete को समय की आवश्यकता है | ||
<math>O(|\Omega|k^2\log(1/\epsilon))</math>. | <math>O(|\Omega|k^2\log(1/\epsilon))</math>. | ||
Line 170: | Line 172: | ||
== अनुप्रयोग == | == अनुप्रयोग == | ||
आव्यूह पूर्णता के कई अनुप्रयोगों को कैंडेस और प्लान द्वारा संक्षेपित किया गया है<ref name = "candesplan"/>निम्नलिखित नुसार: | |||
===सहयोगात्मक फ़िल्टरिंग=== | ===सहयोगात्मक फ़िल्टरिंग=== | ||
सहयोगात्मक फ़िल्टरिंग कई उपयोगकर्ताओं से स्वाद संबंधी जानकारी एकत्र करके उपयोगकर्ता की रुचियों के बारे में स्वचालित पूर्वानुमान लगाने का कार्य है। ऐप्पल, अमेज़ॅन, बार्न्स एंड नोबल और नेटफ्लिक्स जैसी कंपनियां आंशिक ज्ञान से अपने उपयोगकर्ता की प्राथमिकताओं का अनुमान लगाने की कोशिश कर रही हैं। इस प्रकार की | सहयोगात्मक फ़िल्टरिंग कई उपयोगकर्ताओं से स्वाद संबंधी जानकारी एकत्र करके उपयोगकर्ता की रुचियों के बारे में स्वचालित पूर्वानुमान लगाने का कार्य है। ऐप्पल, अमेज़ॅन, बार्न्स एंड नोबल और नेटफ्लिक्स जैसी कंपनियां आंशिक ज्ञान से अपने उपयोगकर्ता की प्राथमिकताओं का अनुमान लगाने की कोशिश कर रही हैं। इस प्रकार की आव्यूह पूर्णता समस्या में, अज्ञात पूर्ण आव्यूह को अक्सर निम्न रैंक माना जाता है क्योंकि केवल कुछ कारक ही आमतौर पर किसी व्यक्ति के स्वाद या पसंद में योगदान करते हैं। | ||
===सिस्टम पहचान=== | ===सिस्टम पहचान=== | ||
Line 182: | Line 184: | ||
y(t)&=Cx(t)+Du(t) | y(t)&=Cx(t)+Du(t) | ||
\end{align}</math> | \end{align}</math> | ||
इनपुट के अनुक्रम के लिए <math>u(t) \in \mathbb{R}^m</math> और आउटपुट <math>y(t) \in \mathbb{R}^p, t = 0, \ldots, N</math>. सदिश <math>x(t) \in \mathbb{R}^n</math> समय पर सिस्टम की स्थिति है <math>t</math> और <math>n</math> सिस्टम मॉडल का क्रम है. इनपुट/आउटपुट जोड़ी से, कोई मैट्रिस पुनर्प्राप्त करना चाहेगा <math>A,B,C,D</math> और प्रारंभिक अवस्था <math>x(0)</math>. इस समस्या को निम्न-रैंक | इनपुट के अनुक्रम के लिए <math>u(t) \in \mathbb{R}^m</math> और आउटपुट <math>y(t) \in \mathbb{R}^p, t = 0, \ldots, N</math>. सदिश <math>x(t) \in \mathbb{R}^n</math> समय पर सिस्टम की स्थिति है <math>t</math> और <math>n</math> सिस्टम मॉडल का क्रम है. इनपुट/आउटपुट जोड़ी से, कोई मैट्रिस पुनर्प्राप्त करना चाहेगा <math>A,B,C,D</math> और प्रारंभिक अवस्था <math>x(0)</math>. इस समस्या को निम्न-रैंक आव्यूह पूर्णता समस्या के रूप में भी देखा जा सकता है। | ||
===इंटरनेट ऑफ थिंग्स (IoT) स्थानीयकरण=== | ===इंटरनेट ऑफ थिंग्स (IoT) स्थानीयकरण=== | ||
IoT सेंसर नेटवर्क में स्थानीयकरण (या वैश्विक स्थिति) समस्या स्वाभाविक रूप से उभरती है। समस्या यूक्लिडियन अंतरिक्ष में स्थानीय या जोड़ीदार दूरियों के आंशिक सेट से सेंसर मानचित्र को पुनर्प्राप्त करना है। इस प्रकार यह रैंक दो के साथ | IoT सेंसर नेटवर्क में स्थानीयकरण (या वैश्विक स्थिति) समस्या स्वाभाविक रूप से उभरती है। समस्या यूक्लिडियन अंतरिक्ष में स्थानीय या जोड़ीदार दूरियों के आंशिक सेट से सेंसर मानचित्र को पुनर्प्राप्त करना है। इस प्रकार यह रैंक दो के साथ आव्यूह पूर्णता समस्या है यदि सेंसर 2-डी विमान में स्थित हैं और तीन यदि वे 3-डी अंतरिक्ष में हैं।<ref name = "nguyenkimkimshim"/> | ||
===सामाजिक नेटवर्क पुनर्प्राप्ति=== | ===सामाजिक नेटवर्क पुनर्प्राप्ति=== | ||
वास्तविक दुनिया के अधिकांश सामाजिक नेटवर्क में निम्न-रैंक दूरी वाले मैट्रिसेस होते हैं। जब हम पूरे नेटवर्क को मापने में सक्षम नहीं होते हैं, जो निजी नोड्स, सीमित भंडारण या गणना संसाधनों जैसे कारणों से हो सकता है, तो हमारे पास ज्ञात दूरी प्रविष्टियों का केवल अंश होता है। आपराधिक नेटवर्क ऐसे नेटवर्क का अच्छा उदाहरण हैं। इन न देखी गई दूरियों को पुनर्प्राप्त करने के लिए निम्न-रैंक | वास्तविक दुनिया के अधिकांश सामाजिक नेटवर्क में निम्न-रैंक दूरी वाले मैट्रिसेस होते हैं। जब हम पूरे नेटवर्क को मापने में सक्षम नहीं होते हैं, जो निजी नोड्स, सीमित भंडारण या गणना संसाधनों जैसे कारणों से हो सकता है, तो हमारे पास ज्ञात दूरी प्रविष्टियों का केवल अंश होता है। आपराधिक नेटवर्क ऐसे नेटवर्क का अच्छा उदाहरण हैं। इन न देखी गई दूरियों को पुनर्प्राप्त करने के लिए निम्न-रैंक आव्यूह पूर्णता का उपयोग किया जा सकता है।<ref name = "topologyrecovery"/> | ||
Revision as of 15:18, 6 August 2023
आव्यूह पूर्णता आंशिक रूप से देखे गए आव्यूह की लुप्त प्रविष्टियों को भरने का कार्य है, जो आंकड़ों में डेटा प्रतिरूपण (सांख्यिकी) करने के बराबर है। डेटासेट की विस्तृत श्रृंखला स्वाभाविक रूप से आव्यूह रूप में व्यवस्थित होती है। उदाहरण मूवी-रेटिंग आव्यूह है, जैसा कि नेटफ्लिक्स पुरस्कार में दिखाई देता है: रेटिंग आव्यूह दिया जाता है जिसमें प्रत्येक प्रविष्टि होती है फिल्म की रेटिंग का प्रतिनिधित्व करता है ग्राहक के द्वारा , यदि ग्राहक फिल्म देखी है और अन्यथा गायब है, हम ग्राहकों को आगे क्या देखना है इसके बारे में अच्छी सिफारिशें करने के लिए शेष प्रविष्टियों की भविष्यवाणी करना चाहेंगे। अन्य उदाहरण दस्तावेज़-शब्द आव्यूह है: दस्तावेज़ों के संग्रह में उपयोग किए गए शब्दों की आवृत्तियों को आव्यूह के रूप में दर्शाया जा सकता है, जहां प्रत्येक प्रविष्टि संकेतित दस्तावेज़ में संबंधित शब्द के प्रकट होने की संख्या से मेल खाती है।
पूर्ण आव्यूह में स्वतंत्रता की डिग्री की संख्या पर किसी भी प्रतिबंध के बिना यह समस्या अनिर्धारित प्रणाली है क्योंकि छिपी हुई प्रविष्टियों को मनमाने ढंग से मान दिए जा सकते हैं। इस प्रकार हमें अच्छी तरह से प्रस्तुत समस्या बनाने के लिए आव्यूह पर कुछ धारणा की आवश्यकता होती है, जैसे कि यह मान लेना कि इसमें अधिकतम निर्धारक है, सकारात्मक निश्चित है, या निम्न-रैंक है।[1][2]
उदाहरण के लिए, कोई यह मान सकता है कि आव्यूह में निम्न-रैंक संरचना है, और फिर निम्नतम रैंक (रैखिक बीजगणित) आव्यूह खोजने की कोशिश करें या, यदि पूर्ण आव्यूह की रैंक ज्ञात है, तो रैंक का आव्यूह (रैखिक बीजगणित) जो ज्ञात प्रविष्टियों से मेल खाता है। चित्रण से पता चलता है कि आंशिक रूप से प्रकट रैंक -1 आव्यूह (बाईं ओर) को शून्य-त्रुटि (दाहिनी ओर) के साथ पूरा किया जा सकता है क्योंकि लापता प्रविष्टियों वाली सभी पंक्तियाँ तीसरी पंक्ति के समान होनी चाहिए। नेटफ्लिक्स समस्या के मामले में रेटिंग आव्यूह निम्न-रैंक होने की उम्मीद है क्योंकि उपयोगकर्ता की प्राथमिकताओं को अक्सर कुछ कारकों द्वारा वर्णित किया जा सकता है, जैसे कि फिल्म की शैली और रिलीज का समय। अन्य अनुप्रयोगों में कंप्यूटर विज़न शामिल है, जहां छवियों में गायब पिक्सेल को फिर से बनाने की आवश्यकता होती है, आंशिक दूरी की जानकारी से नेटवर्क में सेंसर की वैश्विक स्थिति का पता लगाना और मल्टीक्लास वर्गीकरण। आव्यूह पूर्णता समस्या सामान्य रूप से एनपी कठिन है, लेकिन अतिरिक्त मान्यताओं के तहत कुशल एल्गोरिदम हैं जो उच्च संभावना के साथ सटीक पुनर्निर्माण प्राप्त करते हैं।
सांख्यिकीय सीखने के दृष्टिकोण से, आव्यूह पूर्णता समस्या आव्यूह नियमितीकरण का अनुप्रयोग है जो वेक्टर नियमितीकरण (गणित) का सामान्यीकरण है। उदाहरण के लिए, निम्न-रैंक आव्यूह पूर्णता समस्या में कोई परमाणु मानदंड का रूप लेते हुए नियमितीकरण जुर्माना लागू कर सकता है
निम्न रैंक आव्यूह पूर्णता
आव्यूह पूर्णता समस्या के प्रकारों में से निम्नतम रैंक (रैखिक बीजगणित) आव्यूह को ढूंढना है जो आव्यूह से मेल खाता है , जिसे हम सेट में सभी प्रविष्टियों के लिए पुनर्प्राप्त करना चाहते हैं देखी गई प्रविष्टियों की. इस समस्या का गणितीय सूत्रीकरण इस प्रकार है:
कैंडेस और रेख्त[3]साबित हुआ कि प्रेक्षित प्रविष्टियों के नमूने और पर्याप्त रूप से कई नमूना प्रविष्टियों पर धारणाओं के साथ इस समस्या का उच्च संभावना वाला अनूठा समाधान है।
एक समतुल्य सूत्रीकरण, यह देखते हुए कि आव्यूह पुनर्प्राप्त किया जाना रैंक (रैखिक बीजगणित) के रूप में जाना जाता है , के लिए हल करना है कहाँ
धारणाएँ
विश्लेषण को सरल बनाने और यह सुनिश्चित करने के लिए कि समस्या कम निर्धारित नहीं है, अवलोकन की गई प्रविष्टियों के नमूने और नमूना प्रविष्टियों की संख्या पर कई धारणाएँ अक्सर बनाई जाती हैं।
प्रेक्षित प्रविष्टियों का एकसमान नमूना
विश्लेषण को सुव्यवस्थित बनाने के लिए, अक्सर यह मान लिया जाता है कि सेट देखी गई प्रविष्टियों और निश्चित प्रमुखता को कार्डिनैलिटी की प्रविष्टियों के सभी सबसेट के संग्रह से यादृच्छिक रूप से समान रूप से नमूना लिया जाता है . विश्लेषण को और सरल बनाने के लिए, इसके बजाय यह मान लिया गया है बर्नौली नमूनाकरण द्वारा निर्मित किया गया है, अर्थात प्रत्येक प्रविष्टि को संभाव्यता के साथ देखा जाता है . अगर इसके लिए सेट है कहाँ की वांछित अपेक्षित कार्डिनैलिटी है , और आव्यूह के आयाम हैं (मान लीजिए व्यापकता के नुकसान के बिना), भीतर है का उच्च संभावना के साथ, इस प्रकार बर्नौली नमूनाकरण एकसमान नमूने के लिए अच्छा सन्निकटन है।[3] और सरलीकरण यह मान लेना है कि प्रविष्टियाँ स्वतंत्र रूप से और प्रतिस्थापन के साथ नमूनाकृत की जाती हैं।[4]
प्रेक्षित प्रविष्टियों की संख्या की निचली सीमा
मान लीजिये द्वारा आव्यूह (साथ ) हम रैंक (रैखिक बीजगणित) को पुनर्प्राप्त करने का प्रयास कर रहे हैं . पहले कितनी प्रविष्टियाँ देखी जानी चाहिए, इस पर सूचना सैद्धांतिक निचली सीमा है विशिष्ट रूप से पुनर्निर्माण किया जा सकता है। के समुच्चय द्वारा इससे कम या उसके बराबर रैंक वाले आव्यूह में बीजगणितीय किस्म है आयाम के साथ . इस परिणाम का उपयोग करते हुए, कोई इसे कम से कम दिखा तो सकता है आव्यूह पूर्णता के लिए प्रविष्टियों का अवलोकन किया जाना चाहिए एक अनोखा समाधान पाने के लिए कब .[5]
दूसरे, प्रति पंक्ति और स्तंभ में कम से कम प्रेक्षित प्रविष्टि होनी चाहिए . का एकवचन मूल्य अपघटन द्वारा दिया गया है . यदि पंक्ति अप्राप्य है, इसे देखना आसान है का दायां एकवचन सदिश , , कुछ मनमाने मूल्य में बदला जा सकता है और फिर भी आव्यूह मिलान प्राप्त हो सकता है प्रेक्षित प्रविष्टियों के सेट पर। इसी प्रकार, यदि कॉलम अवलोकित है, का बायां एकवचन सदिश , मनमाना हो सकता है. यदि हम प्रेक्षित प्रविष्टियों के सेट का बर्नौली नमूनाकरण मानते हैं, तो कूपन कलेक्टर की समस्या का तात्पर्य है कि प्रविष्टियाँ के क्रम पर यह सुनिश्चित करने के लिए अवश्य देखा जाना चाहिए कि उच्च संभावना के साथ प्रत्येक पंक्ति और स्तंभ से अवलोकन हो।[6]
आवश्यक शर्तों को संयोजित करना और यह मान लेना (कई व्यावहारिक अनुप्रयोगों के लिए वैध धारणा), आव्यूह पूर्णता की समस्या को कम निर्धारित होने से रोकने के लिए आवश्यक देखी गई प्रविष्टियों की संख्या की निचली सीमा के क्रम पर है .
असंगति
संपीडित संवेदन में असंगति की अवधारणा उत्पन्न हुई। इसे एकवचन वैक्टर सुनिश्चित करने के लिए आव्यूह पूर्णता के संदर्भ में पेश किया गया है इस अर्थ में बहुत विरल नहीं हैं कि प्रत्येक एकवचन वेक्टर के सभी निर्देशांक तुलनीय परिमाण के होते हैं, न कि केवल कुछ निर्देशांक जिनमें काफी बड़े परिमाण होते हैं।[7][8] मानक आधार वैक्टर तब एकवचन वैक्टर और वेक्टर के रूप में अवांछनीय होते हैं में ये इच्छित है। यदि एकवचन सदिश पर्याप्त रूप से विरल हों तो क्या गलत हो सकता है, इसके उदाहरण के रूप में, इस पर विचार करें द्वारा आव्यूह एकल मूल्य अपघटन के साथ . की लगभग सभी प्रविष्टियाँ इसका पुनर्निर्माण करने से पहले इसका नमूना लिया जाना चाहिए।
कैंडेस और रेख्त[3]आव्यूह की सुसंगतता को परिभाषित करें स्तंभ स्थान के साथ ए का आयामी उपस्थान जैसा , कहाँ ओर्थोगोनल प्रोजेक्शन (गणित) है . असंगतता तब दावा करती है कि एकवचन मूल्य अपघटन दिया गया है की द्वारा आव्यूह ,
- की प्रविष्टियाँ परिमाण ऊपरी सीमा से घिरा है
कुछ के लिए .
शोर के साथ निम्न रैंक आव्यूह पूर्णता
वास्तविक दुनिया के अनुप्रयोग में, अक्सर केवल कुछ ही प्रविष्टियाँ देखी जाती हैं जो कम से कम थोड़ी मात्रा में शोर से दूषित हो जाती हैं। उदाहरण के लिए, नेटफ्लिक्स समस्या में, रेटिंग अनिश्चित हैं। कैंडेस और योजना [9]दिखाया गया कि परमाणु मानक न्यूनतमकरण द्वारा केवल कुछ शोर वाले नमूनों से बड़े निम्न-रैंक आव्यूह की कई लापता प्रविष्टियों को भरना संभव है। शोर मॉडल मानता है कि हम निरीक्षण करते हैं
कहाँ शोर शब्द है. ध्यान दें कि शोर या तो स्टोकेस्टिक या नियतात्मक हो सकता है। वैकल्पिक रूप से मॉडल को इस प्रकार व्यक्त किया जा सकता है
कहाँ प्रविष्टियों के साथ आव्यूह के लिए ये मानते हुए कुछ के लिए अपूर्ण आव्यूह को पुनर्प्राप्त करने के लिए, हम निम्नलिखित अनुकूलन समस्या को हल करने का प्रयास करते हैं:
डेटा के अनुरूप सभी आव्यूह में से, न्यूनतम परमाणु मानदंड वाला ढूंढें। कैंडेस और योजना [9]दिखाया है कि यह पुनर्निर्माण सटीक है। उन्होंने यह साबित कर दिया है कि जब पूर्ण ध्वनि रहित पुनर्प्राप्ति होती है, तो गड़बड़ी की तुलना में आव्यूह पूर्णता स्थिर होती है। त्रुटि शोर स्तर के समानुपाती होती है . इसलिए, जब शोर का स्तर छोटा होता है, तो त्रुटि छोटी होती है। यहां आव्यूह पूर्णता समस्या प्रतिबंधित आइसोमेट्री प्रॉपर्टी (आरआईपी) का पालन नहीं करती है। मैट्रिसेस के लिए, आरआईपी यह मान लेगा कि सैंपलिंग ऑपरेटर उसका पालन करता है
सभी आव्यूह के लिए पर्याप्त रूप से छोटी रैंक के साथ और पर्याप्त रूप से छोटा. विधियाँ विरल सिग्नल पुनर्प्राप्ति समस्याओं पर भी लागू होती हैं जिनमें RIP पकड़ में नहीं आता है।
उच्च रैंक आव्यूह पूर्णता
सामान्य तौर पर उच्च रैंक आव्यूह पूर्णता एनपी हार्ड है। हालाँकि, कुछ मान्यताओं के साथ, कुछ अधूरे उच्च रैंक आव्यूह या यहाँ तक कि पूर्ण रैंक आव्यूह को भी पूरा किया जा सकता है।
एरिक्सन, बाल्ज़ानो और नोवाक [10]एक आव्यूह को पूरा करने की समस्या पर इस धारणा के साथ विचार किया है कि आव्यूह के कॉलम कई निम्न-रैंक उप-स्थानों के संघ से संबंधित हैं। चूंकि कॉलम उप-स्थानों के संघ से संबंधित हैं, इसलिए समस्या को क्लस्टरिंग उच्च-आयामी डेटा समस्या के लापता-डेटा संस्करण के रूप में देखा जा सकता है। होने देना सेम आव्यूह जिसके (पूर्ण) कॉलम अधिक से अधिक के संघ में स्थित हैं उप-स्थान, प्रत्येक , और मान लीजिये . एरिक्सन, बाल्ज़ानो और नोवाक [10]दिखाया गया है कि हल्की धारणाओं के तहत प्रत्येक कॉलम कम से कम लंबे समय तक अपूर्ण संस्करण से उच्च संभावना के साथ पूरी तरह से पुनर्प्राप्त किया जा सकता है की प्रविष्टियाँ यादृच्छिक रूप से समान रूप से देखे जाते हैं सामान्य असंगति स्थितियों, उप-स्थानों की ज्यामितीय व्यवस्था और उप-स्थानों पर स्तंभों के वितरण के आधार पर स्थिरांक।
एल्गोरिदम में कई चरण शामिल हैं: (1) स्थानीय पड़ोस; (2) स्थानीय उपस्थान; (3) उपस्थान परिशोधन; (4) पूर्ण आव्यूह पूर्णता। इस पद्धति को इंटरनेट दूरी आव्यूह पूर्णता और टोपोलॉजी पहचान पर लागू किया जा सकता है।
निम्न-रैंक आव्यूह समापन के लिए एल्गोरिदम
विभिन्न आव्यूह पूर्णता एल्गोरिदम प्रस्तावित किए गए हैं।[8]इनमें उत्तल विश्राम-आधारित एल्गोरिदम शामिल है,[3]ग्रेडिएंट-आधारित एल्गोरिदम,[11]और वैकल्पिक न्यूनतमकरण-आधारित एल्गोरिदम।[12]
उत्तल विश्राम
रैंक न्यूनीकरण समस्या एनपी-हार्ड है। कैंडेस और रेचट द्वारा प्रस्तावित दृष्टिकोण, समस्या का उत्तल फ़ंक्शन विश्राम बनाना और परमाणु मानदंड (गणित) को कम करना है (जो एकवचन मानों का योग देता है ) के बजाय (जो गैर शून्य एकवचन मानों की संख्या की गणना करता है ).[3]यह वैक्टर के लिए L0-मानदंड (गणित) के बजाय L1-मानदंड (गणित) को न्यूनतम करने के समान है। उत्तल फ़ंक्शन विश्राम को अर्धनिश्चित प्रोग्रामिंग (एसडीपी) का उपयोग करके हल किया जा सकता है, यह देखते हुए कि अनुकूलन समस्या इसके बराबर है
उत्तल विश्राम को हल करने के लिए अर्धनिश्चित प्रोग्रामिंग का उपयोग करने की जटिलता है . SDPT3 जैसे अत्याधुनिक सॉल्वर केवल 100 गुणा 100 तक के आकार के आव्यूह को संभाल सकते हैं [13] वैकल्पिक प्रथम क्रम विधि जो उत्तल विश्राम को लगभग हल करती है वह काई, कैंडेस और शेन द्वारा प्रस्तुत सिंगुलर वैल्यू थ्रेशोल्डिंग एल्गोरिदम है।[13]
कैंडेस और रेख्त बैनाच स्थानों पर यादृच्छिक चर के अध्ययन का उपयोग करके दिखाते हैं कि यदि देखी गई प्रविष्टियों की संख्या के क्रम पर है (सामान्यता की हानि के बिना मान लें ), रैंक न्यूनीकरण समस्या का अनूठा समाधान है जो संभाव्यता के साथ इसके उत्तल विश्राम का समाधान भी होता है कुछ स्थिरांक के लिए . यदि की रैंक छोटा है (), प्रेक्षणों के सेट का आकार के क्रम में कम हो जाता है . ये परिणाम इष्टतम के करीब हैं, क्योंकि आव्यूह पूर्णता समस्या को कम निर्धारित न करने के लिए देखी जाने वाली प्रविष्टियों की न्यूनतम संख्या के क्रम पर है .
कैंडेस और ताओ द्वारा इस परिणाम में सुधार किया गया है।[6] वे ऐसी सीमाएँ प्राप्त करते हैं जो मान्यताओं को मजबूत करके केवल पॉलीलॉगरिदमिक कार्यात्मक कारकों द्वारा इष्टतम सीमाओं से भिन्न होती हैं। असंगति संपत्ति के बजाय, वे पैरामीटर के साथ मजबूत असंगति संपत्ति मानते हैं . यह संपत्ति बताती है कि:
- के लिए और के लिए
- की प्रविष्टियाँ द्वारा परिमाण में बंधे हैं
सहज रूप से, आव्यूह की मजबूत असंगति यह दावा करता है कि मानक आधार वैक्टर के ऑर्थोगोनल अनुमान यदि एकवचन सदिशों को यादृच्छिक रूप से वितरित किया जाए तो ऐसे परिमाण होते हैं जिनकी संभावना अधिक होती है।[7]
कैंडेस और ताओ को वह कब मिला है और प्रेक्षित प्रविष्टियों की संख्या के क्रम पर है , रैंक न्यूनीकरण समस्या का अनूठा समाधान है जो संभाव्यता के साथ इसके उत्तल विश्राम का समाधान भी होता है कुछ स्थिरांक के लिए . मनमानी के लिए , इस दावे के लिए पर्याप्त प्रेक्षित प्रविष्टियों की संख्या सत्य है एक और उत्तल विश्राम दृष्टिकोण [14]एक रैंक बाधा के तहत फ्रोबेनियस वर्ग मानदंड को कम करना है। यह हल करने के बराबर है
एक ऑर्थोगोनल प्रोजेक्शन आव्यूह पेश करके (अर्थ ) के रैंक को मॉडल करने के लिए के जरिए और इस समस्या का उत्तल विश्राम लेते हुए, हम निम्नलिखित अर्धनिश्चित कार्यक्रम प्राप्त करते हैं
यदि इस विश्राम में Y प्रक्षेपण आव्यूह है (अर्थात, इसमें द्विआधारी eigenvalues है), तो विश्राम तंग है। अन्यथा, यह समग्र उद्देश्य पर वैध निचली सीमा देता है। इसके अलावा, इसे Y के स्वदेशी मानों को लालचपूर्वक पूर्णांकित करके (थोड़े) बड़े उद्देश्य के साथ व्यवहार्य समाधान में परिवर्तित किया जा सकता है।[14]उल्लेखनीय रूप से, इस उत्तल विश्राम को किसी भी एसडीपी को हल किए बिना एक्स और वाई पर वैकल्पिक न्यूनतमकरण द्वारा हल किया जा सकता है, और इस प्रकार यह एसडीपीटी 3 या मोसेक जैसे अत्याधुनिक एसडीपी सॉल्वरों की विशिष्ट संख्यात्मक सीमाओं से परे है।
यह दृष्टिकोण अधिक सामान्य सुधार तकनीक का विशेष मामला है, जिसे ट्रेस-मैट्रिक्स-उत्तल उद्देश्य के साथ किसी भी निम्न-रैंक समस्या पर वैध निचली सीमा प्राप्त करने के लिए लागू किया जा सकता है।[15]
क्रमिक अवतरण
केशवन, मोंटानारी और ओह[11]आव्यूह पूर्णता के प्रकार पर विचार करें जहां की रैंक (रैखिक बीजगणित)। द्वारा आव्यूह , जिसे पुनर्प्राप्त किया जाना है, ज्ञात है . वे प्रविष्टियों के बर्नौली नमूने, निरंतर पहलू अनुपात को मानते हैं , की प्रविष्टियों का परिबद्ध परिमाण (ऊपरी सीमा रहने दें ), और स्थिर स्थिति संख्या (कहाँ और के सबसे बड़े और सबसे छोटे एकवचन मान हैं क्रमश)। इसके अलावा, वे मानते हैं कि दो असंगति स्थितियाँ संतुष्ट हैं और कहाँ और स्थिरांक हैं. होने देना ऐसा आव्यूह बनें जो मेल खाता हो मंच पर प्रेक्षित प्रविष्टियों की संख्या अन्यत्र 0 है। फिर वे निम्नलिखित एल्गोरिथम प्रस्तावित करते हैं:
- काट-छांट करना से अधिक डिग्री वाले स्तंभों से सभी अवलोकनों को हटाकर कॉलम में प्रविष्टियों को 0 पर सेट करके। इसी प्रकार इससे बड़ी डिग्री वाली पंक्तियों से सभी अवलोकन हटा दें .
- परियोजना इसके पहले पर प्रमुख कंपोनेंट विश्लेषण। परिणामी आव्यूह को कॉल करें .
- हल करना कहाँ पंक्ति खोज के साथ ढतला हुआ वंश द्वारा कुछ नियमितीकरण (गणित) फ़ंक्शन है। प्रारंभ पर कहाँ . तय करना कुछ फ़ंक्शन फ़ोर्सिंग के रूप में यदि ग्रेडिएंट डिसेंट के दौरान असंगत बने रहें और असंगत हैं.
- आव्यूह लौटाएं .
एल्गोरिथम के चरण 1 और 2 से आव्यूह प्राप्त होता है सच्चे आव्यूह के बहुत करीब (जैसा कि मूल माध्य वर्ग विचलन | मूल माध्य वर्ग त्रुटि (आरएमएसई) द्वारा मापा जाता है) उच्च संभावना के साथ। विशेषकर, संभाव्यता के साथ , कुछ स्थिरांक के लिए . फ्रोबेनियस आव्यूह मानदंड को दर्शाता है। ध्यान दें कि इस परिणाम को धारण करने के लिए मान्यताओं के पूरे सेट की आवश्यकता नहीं है। उदाहरण के लिए, असंगति की स्थिति केवल सटीक पुनर्निर्माण में ही लागू होती है। अंत में, हालाँकि ट्रिमिंग काउंटर सहज ज्ञान युक्त लग सकती है क्योंकि इसमें जानकारी को बाहर फेंकना शामिल है, यह प्रोजेक्टिंग सुनिश्चित करता है इसके पहले पर प्रमुख घटक विश्लेषण अंतर्निहित आव्यूह के बारे में अधिक जानकारी देता है देखी गई प्रविष्टियों के बारे में।
चरण 3 में, उम्मीदवार आव्यूह का स्थान यह ध्यान देकर कम किया जा सकता है कि आंतरिक न्यूनतमकरण समस्या का समाधान समान है से संबंधित कहाँ और आह, रूढ़िवादिता द्वारा matrices. फिर दो ग्रासमैनियन के क्रॉस उत्पाद पर ग्रेडिएंट डिसेंट का प्रदर्शन किया जा सकता है। अगर और प्रेक्षित प्रविष्टि सेट के क्रम में है , चरण 3 द्वारा लौटाया गया आव्यूह बिल्कुल सही है . तब एल्गोरिथ्म ऑर्डर इष्टतम है, क्योंकि हम जानते हैं कि आव्यूह पूर्णता समस्या के लिए सिस्टम को कम निर्धारित नहीं किया जाना चाहिए, प्रविष्टियों की संख्या क्रम में होनी चाहिए .
वैकल्पिक न्यूनतम वर्ग न्यूनतमकरण
वैकल्पिक न्यूनीकरण निम्न-रैंक आव्यूह खोजने के लिए व्यापक रूप से लागू और अनुभवजन्य रूप से सफल दृष्टिकोण का प्रतिनिधित्व करता है जो दिए गए डेटा के लिए सबसे उपयुक्त है। उदाहरण के लिए, निम्न-रैंक आव्यूह पूर्णता की समस्या के लिए, इस विधि को सबसे सटीक और कुशल में से माना जाता है, और नेटफ्लिक्स समस्या में विजेता प्रविष्टि का प्रमुख घटक बनता है। वैकल्पिक न्यूनतमकरण दृष्टिकोण में, निम्न-रैंक लक्ष्य आव्यूह को द्विरेखीय रूप में लिखा जाता है:
;
फिर एल्गोरिदम सर्वश्रेष्ठ खोजने के बीच वैकल्पिक होता है और सबसे अच्छा . जबकि समग्र समस्या गैर-उत्तल है, प्रत्येक उप-समस्या आम तौर पर उत्तल होती है और इसे कुशलता से हल किया जा सकता है। जैन, नेत्रपल्ली और संघवी [12]आव्यूह पूर्णता और आव्यूह सेंसिंग दोनों के लिए वैकल्पिक न्यूनतमकरण के प्रदर्शन के लिए पहली गारंटी दी गई है।
वैकल्पिक न्यूनतमकरण एल्गोरिथ्म को निम्नलिखित गैर-उत्तल समस्या को हल करने के अनुमानित तरीके के रूप में देखा जा सकता है:
जैन, नेत्रपल्ली और सांघवी द्वारा प्रस्तावित AltMinComplete एल्गोरिदम यहां सूचीबद्ध है:[12]# इनपुट: अवलोकित सेट , मूल्य
- बंटवारा में सबसेट के प्रत्येक तत्व के साथ में से से संबंधित समान संभावना के साथ (प्रतिस्थापन के साथ नमूनाकरण)
- यानी, शीर्ष- के बाएँ एकवचन सदिश
- क्लिपिंग: के सभी तत्वों को सेट करें जिसका परिमाण इससे भी अधिक है के स्तंभों को शून्य और लंबोसामान्यीकृत करना
- के लिए करना
- के लिए समाप्त
- वापस करना
उन्होंने देख कर दिखाया असंगत आव्यूह की यादृच्छिक प्रविष्टियाँ , AltMinComplete एल्गोरिदम पुनर्प्राप्त कर सकता है में कदम। नमूना जटिलता के संदर्भ में (), सैद्धांतिक रूप से, वैकल्पिक न्यूनतमकरण के लिए बड़ी आवश्यकता हो सकती है उत्तल विश्राम से. हालाँकि अनुभवजन्य रूप से ऐसा नहीं लगता है जिसका तात्पर्य यह है कि नमूना जटिलता सीमा को और कड़ा किया जा सकता है। समय की जटिलता के संदर्भ में, उन्होंने दिखाया कि AltMinComplete को समय की आवश्यकता है
.
यह ध्यान देने योग्य है कि, हालांकि उत्तल विश्राम आधारित तरीकों का कठोर विश्लेषण होता है, वैकल्पिक न्यूनतमकरण आधारित एल्गोरिदम व्यवहार में अधिक सफल होते हैं।
अनुप्रयोग
आव्यूह पूर्णता के कई अनुप्रयोगों को कैंडेस और प्लान द्वारा संक्षेपित किया गया है[9]निम्नलिखित नुसार:
सहयोगात्मक फ़िल्टरिंग
सहयोगात्मक फ़िल्टरिंग कई उपयोगकर्ताओं से स्वाद संबंधी जानकारी एकत्र करके उपयोगकर्ता की रुचियों के बारे में स्वचालित पूर्वानुमान लगाने का कार्य है। ऐप्पल, अमेज़ॅन, बार्न्स एंड नोबल और नेटफ्लिक्स जैसी कंपनियां आंशिक ज्ञान से अपने उपयोगकर्ता की प्राथमिकताओं का अनुमान लगाने की कोशिश कर रही हैं। इस प्रकार की आव्यूह पूर्णता समस्या में, अज्ञात पूर्ण आव्यूह को अक्सर निम्न रैंक माना जाता है क्योंकि केवल कुछ कारक ही आमतौर पर किसी व्यक्ति के स्वाद या पसंद में योगदान करते हैं।
सिस्टम पहचान
नियंत्रण में, कोई व्यक्ति असतत-समय रैखिक समय-अपरिवर्तनीय राज्य-अंतरिक्ष मॉडल को फिट करना चाहेगा
इनपुट के अनुक्रम के लिए और आउटपुट . सदिश समय पर सिस्टम की स्थिति है और सिस्टम मॉडल का क्रम है. इनपुट/आउटपुट जोड़ी से, कोई मैट्रिस पुनर्प्राप्त करना चाहेगा और प्रारंभिक अवस्था . इस समस्या को निम्न-रैंक आव्यूह पूर्णता समस्या के रूप में भी देखा जा सकता है।
इंटरनेट ऑफ थिंग्स (IoT) स्थानीयकरण
IoT सेंसर नेटवर्क में स्थानीयकरण (या वैश्विक स्थिति) समस्या स्वाभाविक रूप से उभरती है। समस्या यूक्लिडियन अंतरिक्ष में स्थानीय या जोड़ीदार दूरियों के आंशिक सेट से सेंसर मानचित्र को पुनर्प्राप्त करना है। इस प्रकार यह रैंक दो के साथ आव्यूह पूर्णता समस्या है यदि सेंसर 2-डी विमान में स्थित हैं और तीन यदि वे 3-डी अंतरिक्ष में हैं।[16]
सामाजिक नेटवर्क पुनर्प्राप्ति
वास्तविक दुनिया के अधिकांश सामाजिक नेटवर्क में निम्न-रैंक दूरी वाले मैट्रिसेस होते हैं। जब हम पूरे नेटवर्क को मापने में सक्षम नहीं होते हैं, जो निजी नोड्स, सीमित भंडारण या गणना संसाधनों जैसे कारणों से हो सकता है, तो हमारे पास ज्ञात दूरी प्रविष्टियों का केवल अंश होता है। आपराधिक नेटवर्क ऐसे नेटवर्क का अच्छा उदाहरण हैं। इन न देखी गई दूरियों को पुनर्प्राप्त करने के लिए निम्न-रैंक आव्यूह पूर्णता का उपयोग किया जा सकता है।[17]
यह भी देखें
- मैट्रिक्स नियमितीकरण
- नेटफ्लिक्स पुरस्कार
- सहयोगी को छानने
- सिस्टम पहचान
- उत्तल अनुकूलन
- प्रतिरूपण (सांख्यिकी)
संदर्भ
- ↑ Johnson, Charles R. (1990). "Matrix completion problems: a survey". Matrix Theory and Applications. Proceedings of Symposia in Applied Mathematics. 40: 171–198. doi:10.1090/psapm/040/1059486. ISBN 9780821801543.
- ↑ Laurent, Monique (2008). "Matrix Completion Problems". Encyclopedia of Optimization. 3: 221–229. doi:10.1007/978-0-387-74759-0_355. ISBN 978-0-387-74758-3.
- ↑ 3.0 3.1 3.2 3.3 3.4 Candès, E. J.; Recht, B. (2009). "Exact Matrix Completion via Convex Optimization". Foundations of Computational Mathematics. 9 (6): 717–772. arXiv:0805.4471. doi:10.1007/s10208-009-9045-5.
- ↑ Recht, B. (2009). "A Simpler Approach to Matrix Completion" (PDF). Journal of Machine Learning Research. 12: 3413–3430. arXiv:0910.0651. Bibcode:2009arXiv0910.0651R.
- ↑ Xu, Zhiqiang (2018). "The minimal measurement number for low-rank matrix recovery". Applied and Computational Harmonic Analysis. 44 (2): 497–508. arXiv:1505.07204. doi:10.1016/j.acha.2017.01.005. S2CID 11990443.
- ↑ 6.0 6.1 Candès, E. J.; Tao, T. (2010). "The Power of Convex Relaxation: Near-Optimal Matrix Completion". IEEE Transactions on Information Theory. 56 (5): 2053–2080. arXiv:0903.1476. doi:10.1109/TIT.2010.2044061. S2CID 1255437.
- ↑ 7.0 7.1 Tao, T. (10 March 2009). "The power of convex relaxation: near-optimal matrix completion". What's new.
- ↑ 8.0 8.1 Nguyen, L.T.; Kim, J.; Shim, B. (10 July 2019). "Low-Rank Matrix Completion: A Contemporary Survey". IEEE Access. 7 (1): 94215–94237. arXiv:1907.11705. Bibcode:2019arXiv190711705N. doi:10.1109/ACCESS.2019.2928130. S2CID 198930899.
- ↑ 9.0 9.1 9.2 Candès, E. J.; Plan, Y. (2010). "Matrix Completion with Noise". Proceedings of the IEEE. 98 (6): 925–936. arXiv:0903.3131. doi:10.1109/JPROC.2009.2035722. S2CID 109721.
- ↑ 10.0 10.1 Eriksson, B.; Balzano, L.; Nowak, R. (2011). "High-Rank Matrix Completion and Subspace Clustering with Missing Data". arXiv:1112.5629 [cs.IT].
- ↑ 11.0 11.1 Keshavan, R. H.; Montanari, A.; Oh, S. (2010). "Matrix Completion from a Few Entries". IEEE Transactions on Information Theory. 56 (6): 2980–2998. arXiv:0901.3150. doi:10.1109/TIT.2010.2046205. S2CID 53504.
- ↑ 12.0 12.1 12.2 Jain, P.; Netrapalli, P.; Sanghavi, S. (2013). "Low-rank Matrix Completion using Alternating Minimization". Proceedings of the 45th annual ACM symposium on Symposium on theory of computing. ACM. pp. 665–674. arXiv:1212.0467. doi:10.1145/2488608.2488693. ISBN 978-1-4503-2029-0. S2CID 447011.
- ↑ 13.0 13.1 Cai, J.-F.; Candès, E. J.; Shen, Z. (2010). "A Singular Value Thresholding Algorithm for Matrix Completion". SIAM Journal on Optimization. 20 (4): 1956–1982. arXiv:0810.3286. doi:10.1137/080738970. S2CID 1254778.
- ↑ 14.0 14.1 Bertsimas, Dimitris; Cory-Wright, Ryan; Pauphilet, Jean (2021). "Mixed-Projection Conic Optimization: A New Paradigm for Modeling Rank Constraints". Operations Research. 70 (6): 3321–3344. arXiv:2009.10395. doi:10.1287/opre.2021.2182. S2CID 221836263.
- ↑ Bertsimas, Dimitris; Cory-Wright, Ryan; Pauphilet, Jean (2021). "A New Perspective on Low-Rank Optimization". Optimization Online. arXiv:2105.05947.
- ↑ Nguyen, L.T.; Kim, J.; Kim, S.; Shim, B. (2019). "Localization of IoT Networks Via Low-Rank Matrix Completion". IEEE Transactions on Communications. 67 (8): 5833–5847. doi:10.1109/TCOMM.2019.2915226. S2CID 164605437.
- ↑ Mahindre, G.; Jayasumana, A.P.; Gajamannage, K.; Paffenroth, R. (2019). "On Sampling and Recovery of Topology of Directed Social Networks – A Low-Rank Matrix Completion Based Approach". 2019 IEEE 44th Conference on Local Computer Networks (LCN). IEEE. pp. 324–331. doi:10.1109/LCN44214.2019.8990707. ISBN 978-1-7281-1028-8. S2CID 211206354.