पी.ए.क्यू.: Difference between revisions
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
{{For| | {{For|डीओएस के लिए असंबंधित <code>PAQ.EXE</code> कंप्रेसर|क्वांटम संपीड़न (बहुविकल्पी){{!}}क्वांटम संपीड़न}} | ||
[[Image:Paq8o Sample Session.png|thumb|500px| | [[Image:Paq8o Sample Session.png|thumb|500px|पी.ए.क्यू.8O का नमूना सत्र]]'''पी.ए.क्यू.''' [[दोषरहित डेटा संपीड़न|लॉसलेस डेटा कंप्रेशन]] अभिलेखों की श्रृंखला है जो सहयोगात्मक विकास के माध्यम से कंप्रेशन अनुपात को मापने वाले अनेक बेंचमार्क पर शीर्ष रैंकिंग तक पहुंच गई है (चूँकि गति और मेमोरी उपयोग की मूल्य पर)। पीएक्यू के विशिष्ट वर्जनो ने [[हटर पुरस्कार]] और [[ कैलगरी चुनौती |कैलगरी चुनौती]] जीता है।<ref>{{cite web|url=http://mailcom.com/challenge/ |title=The Compression/SHA-1 Challenge |publisher=Mailcom.com |access-date=2010-05-19}}</ref> पीएक्यू [[जीएनयू जनरल पब्लिक लाइसेंस]] के अनुसार वितरित [[मुफ्त सॉफ्टवेयर]] है।<ref>{{cite web | ||
|url=http://mattmahoney.net/dc/ | |url=http://mattmahoney.net/dc/ | ||
|title=Homepage of the PAQ compressors | |title=Homepage of the PAQ compressors | ||
Line 9: | Line 9: | ||
==एल्गोरिदम== | ==एल्गोरिदम== | ||
पी.ए.क्यू. संदर्भ मिश्रण एल्गोरिथ्म का उपयोग करता है। संदर्भ मिश्रण आंशिक मिलान (पीपीएम) द्वारा पूर्वानुमान से संबंधित है जिसमें कंप्रेसर को भविष्यवक्ता और अंकगणितीय कोडर में विभाजित किया गया है, किन्तु इसमें भिन्नता है कि अगले-प्रतीक पूर्वानुमान की गणना बड़ी संख्या में मॉडल से संभाव्यता अनुमानों के भारित संयोजन का उपयोग करके की जाती है। विभिन्न सन्दर्भों पर आधारित पीपीएम के विपरीत, किसी संदर्भ को सन्निहित होने की आवश्यकता नहीं है। अधिकांश पी.ए.क्यू. वर्जन निम्नलिखित संदर्भों के लिए अगले-प्रतीक आँकड़े एकत्र करते हैं: | |||
* | |||
* संपूर्ण-शब्द | * ''n'' -ग्राम ; संदर्भअनुमानित प्रतीक से पहले <var>अंतिम '''''n''''' बाइट्स है (जैसा कि पीपीएम में है);</var> | ||
*संपूर्ण-शब्द ''n''-ग्राम, केस और गैर-वर्णमाला वर्णों को अनदेखा करना (टेक्स्ट फ़ाइलों में उपयोगी); | |||
* विरल संदर्भ, उदाहरण के लिए, अनुमानित प्रतीक से पहले के दूसरे और चौथे बाइट्स (कुछ बाइनरी प्रारूपों में उपयोगी); | * विरल संदर्भ, उदाहरण के लिए, अनुमानित प्रतीक से पहले के दूसरे और चौथे बाइट्स (कुछ बाइनरी प्रारूपों में उपयोगी); | ||
* एनालॉग संदर्भ, जिसमें पिछले 8- या 16-बिट शब्दों के उच्च-क्रम बिट्स | * एनालॉग संदर्भ, जिसमें पिछले 8- या 16-बिट शब्दों के उच्च-क्रम बिट्स सम्मिलित हैं (मल्टीमीडिया फ़ाइलों के लिए उपयोगी); | ||
* द्वि-आयामी संदर्भ (छवियों, तालिकाओं और स्प्रेडशीट के लिए उपयोगी); पंक्ति की लंबाई दोहराए जाने वाले बाइट पैटर्न की स्ट्राइड लंबाई ज्ञात करके निर्धारित की जाती है; | * द्वि-आयामी संदर्भ (छवियों, तालिकाओं और स्प्रेडशीट के लिए उपयोगी); पंक्ति की लंबाई दोहराए जाने वाले बाइट पैटर्न की स्ट्राइड लंबाई ज्ञात करके निर्धारित की जाती है; | ||
* विशेष मॉडल, जैसे x[[86]] निष्पादन योग्य, [[ विंडोज़ बिटमैप |विंडोज़ बिटमैप]] , टीआईएफएफ, या [[जेपीईजी]] छवियां; ये मॉडल केवल तभी सक्रिय होते हैं जब विशेष फ़ाइल प्रकार का पता लगाया जाता है। | * विशेष मॉडल, जैसे x[[86]] निष्पादन योग्य, [[ विंडोज़ बिटमैप |विंडोज़ बिटमैप]] , टीआईएफएफ, या [[जेपीईजी]] छवियां; ये मॉडल केवल तभी सक्रिय होते हैं जब विशेष फ़ाइल प्रकार का पता लगाया जाता है। | ||
सभी | सभी पी.ए.क्यू. वर्जन समय में बिट की पूर्वानुमान करते हैं और कंप्रेस करते हैं, किन्तु मॉडल के विवरण और पूर्वानुमानो को संयुक्त और पोस्टप्रोसेस करने के विधियों में भिन्नता होती है। एक बार जब अगली-बिट संभावना निर्धारित हो जाती है, तो इसे [[अंकगणितीय कोडिंग]] द्वारा एन्कोड किया जाता है। वर्जन के आधार पर पूर्वानुमानो के संयोजन की तीन विधियाँ हैं: | ||
* | *पी.ए.क्यू.1 से पी.ए.क्यू.3 तक, प्रत्येक पूर्वानुमान को बिट गणना <math>(n_0, n_1)</math> की एक जोड़ी के रूप में दर्शाया जाता है। इन गणनाओं को भारित योग द्वारा संयोजित किया जाता है, जिसमें लंबे संदर्भों को अधिक महत्व दिया जाता है। | ||
* | * पी.ए.क्यू.4 से पी.ए.क्यू.6 में, पूर्वानुमानों को पहले की तरह संयोजित किया जाता है, किन्तु प्रत्येक मॉडल को दिए गए भार को अधिक स्पष्ट मॉडल के पक्ष में समायोजित किया जाता है। | ||
* | * पी.ए.क्यू.7 और पश्चात् में, प्रत्येक मॉडल गिनती की जोड़ी के अतिरिक्त संभावना को आउटपुट करता है। संभावनाओं को [[कृत्रिम तंत्रिका नेटवर्क|आर्टिफिशल न्यूरल नेटवर्क]] का उपयोग करके संयोजित किया जाता है। | ||
पी.ए.क्यू.1एसएसई और पश्चात् के वर्जन द्वितीयक प्रतीक अनुमान (एसएसई) का उपयोग करके पूर्वानुमान को पोस्टप्रोसेस करते हैं। किसी तालिका में नई पूर्वानुमान देखने के लिए संयुक्त पूर्वानुमान और छोटे संदर्भ का उपयोग किया जाता है। बिट एन्कोड होने के पश्चात् , पूर्वानुमान त्रुटि को कम करने के लिए तालिका प्रविष्टि को समायोजित किया जाता है। एसएसई चरणों को विभिन्न संदर्भों के साथ पाइपलाइन किया जा सकता है या औसत आउटपुट के साथ समानांतर में गणना की जा सकती है। | |||
===अंकगणित कोडिंग=== | ===अंकगणित कोडिंग=== | ||
एक स्ट्रिंग s को सबसे छोटी बाइट स्ट्रिंग में | एक स्ट्रिंग s को सबसे छोटी बाइट स्ट्रिंग में कंप्रेस किया जाता है जो [0, 1] रेंज में बेस-256 बिग-एंडियन नंबर x का प्रतिनिधित्व करता है जैसे कि P(r < s) ≤ x < P(r ≤ s), जहां P(r < s) संभावना है कि एक रैंडम स्ट्रिंग r जिसकी लंबाई s के समान है, शब्दकोष की दृष्टि से s से कम होगी। ऐसा x खोजना सदैव संभव है कि x की लंबाई शैनन सीमा, −log<sub>2</sub>P(''r'' = ''s'') बिट्स से अधिक से अधिक एक बाइट अधिक हो। एस की लंबाई संग्रह शीर्षलेख में संग्रहीत है। | ||
पी.ए.क्यू. में अंकगणित कोडिंग प्रत्येक पूर्वानुमान के लिए x पर निचली और ऊपरी सीमा को बनाए रखते हुए कार्यान्वित की जाती है, प्रारंभ में [0, 1]। प्रत्येक पूर्वानुमान के पश्चात् , वर्तमान सीमा को P(0) और P(1) के अनुपात में दो भागों में विभाजित किया जाता है, संभावना है कि s का अगला बिट क्रमशः 0 या 1 होगा, s के पिछले बिट्स को देखते हुए। फिर अगली बिट को नई श्रेणी के लिए संबंधित उपश्रेणी का चयन करके एन्कोड किया जाता है। | |||
संख्या x को बिट | संख्या x को बिट पूर्वानुमानो की समान श्रृंखला बनाकर वापस स्ट्रिंग s में विघटित किया जाता है (चूंकि s के पिछले बिट्स ज्ञात हैं)। कंप्रेशन के साथ सीमा को विभाजित किया गया है। जो कि x वाला भाग नई श्रेणी बन जाता है, और संबंधित बिट को s से जोड़ दिया जाता है। | ||
पी.ए.क्यू. में, सीमा की निचली और ऊपरी सीमा को 3 भागों में दर्शाया गया है। सबसे महत्वपूर्ण आधार-256 अंक समान हैं, इसलिए उन्हें x के अग्रणी बाइट्स के रूप में लिखा जा सकता है। अगले 4 बाइट्स को मेमोरी में रखा जाता है, जिससे प्रमुख बाइट अलग हो। अनुगामी बिट्स को निचली सीमा के लिए सभी शून्य और ऊपरी सीमा के लिए सभी शून्य माना जाता है। निचली सीमा से और बाइट लिखकर कंप्रेशन समाप्त किया जाता है। | |||
===अनुकूली मॉडल भार=== | ===अनुकूली मॉडल भार=== | ||
पी.ए.क्यू.6 के माध्यम से पी.ए.क्यू. वर्जनो में, प्रत्येक मॉडल गिनती की एक जोड़ी, <math>n_0</math>, शून्य बिट्स की गिनती, और <math>n_1</math>, 1 बिट्स की गिनती के लिए अलग-अलग संदर्भों का एक सेट मैप करता है। वर्तमान के इतिहास का पक्ष लेने के लिए, विपरीत बिट देखे जाने पर 2 से अधिक की आधी गिनती को छोड़ दिया जाता है। उदाहरण के लिए, यदि किसी संदर्भ से जुड़ी वर्तमान स्थिति <math>(n_0,n_1) = (12,3)</math> है और 1 देखा जाता है, तो गिनती (7, 4) में अपडेट की जाती है। | |||
एक बिट को अंकगणितीय रूप से उसकी संभाव्यता के आनुपातिक स्थान के साथ कोडित किया जाता है, या तो P(1) या P(0) = 1 - P(1)। संभावनाओं की गणना 0 और 1 की गणना के भारित योग द्वारा की जाती है: | एक बिट को अंकगणितीय रूप से उसकी संभाव्यता के आनुपातिक स्थान के साथ कोडित किया जाता है, या तो P(1) या P(0) = 1 - P(1)। संभावनाओं की गणना 0 और 1 की गणना के भारित योग द्वारा की जाती है: | ||
* | ** ''S''<sub>0</sub> = Σ<sub>''i''</sub> ''w<sub>i</sub>'' ''n''<sub>0''i''</sub>, | ||
* | ** ''S''<sub>1</sub> = Σ<sub>''i''</sub> ''w<sub>i</sub>'' ''n''<sub>1''i''</sub>, | ||
* | ** ''S'' = ''S''<sub>0</sub> + ''S''<sub>1</sub>, | ||
* | ** P(0) = ''S''<sub>0</sub> / ''S'', | ||
* | ** P(1) = ''S''<sub>1</sub> / ''S'', | ||
जहां ''w<sub>i</sub>'' ''i''-वें मॉडल का वजन है। पी.ए.क्यू.3 के माध्यम से, वजन तय किया गया और तदर्थ विधियों से सेट किया गया। (ऑर्डर-''n'' संदर्भों का वजन n2 था।) पी.ए.क्यू.4 से प्रारंभ करते हुए, वजन को उस दिशा में अनुकूल रूप से समायोजित किया गया था जो समान संदर्भ सेट में भविष्य की त्रुटियों को कम करेगा। यदि कोड किया जाने वाला बिट y है, तो वजन समायोजन है: | |||
* | ** ''n<sub>i</sub>'' = ''n''<sub>0''i''</sub> + ''n''<sub>1''i''</sub>, | ||
* | ** त्रुटि = ''y'' – P(1), | ||
जहां P(1) संभावना है कि अगला बिट 1, P होगा<sub>''i''</sub>(1) | ** ''w<sub>i</sub>'' ← ''w<sub>i</sub>'' + [(''S'' ''n''<sub>1''i''</sub> − ''S''<sub>1</sub> ''n<sub>i</sub>'') / (''S''<sub>0</sub> ''S''<sub>1</sub>)] त्रुटि. | ||
===न्यूरल-नेटवर्क मिश्रण=== | |||
पी.ए.क्यू.7 से प्रारंभ होकर, प्रत्येक मॉडल पूर्वानुमान आउटपुट करता है (गिनती की जोड़ी के अतिरिक्त )। ये पूर्वानुमान लॉजिस्टिक डोमेन में औसत हैं: | |||
* ''x<sub>i</sub>'' = खिंचाव(P<sub>''i''</sub>(1)), | |||
* P(1) = स्क्वैश(Σ<sub>''i''</sub> ''w<sub>i</sub>'' ''x<sub>i</sub>''), | |||
जहां P(1) संभावना है कि अगला बिट 1, P होगा<sub>''i''</sub>(1) i -वें मॉडल द्वारा अनुमानित संभावना है, और | |||
* खिंचाव(x) = ln(x / (1 − x)), | * खिंचाव(x) = ln(x / (1 − x)), | ||
* स्क्वैश(x) = 1 / (1 + | * स्क्वैश(x) = 1 / (1 + ''e''<sup>−''x''</sup>) (खिंचाव का व्युत्क्रम)। | ||
** | |||
** | |||
प्रत्येक | प्रत्येक पूर्वानुमान के पश्चात् , कोडिंग कास्ट को कम करने के लिए वजन को समायोजित करके मॉडल को अपडेट किया जाता है: | ||
* | ** ''w<sub>i</sub>'' ← ''w<sub>i</sub>'' + η ''x<sub>i</sub>'' (''y'' − P(1)), | ||
जहां η [[सीखने की दर]] है (आमतौर पर 0.002 से 0.01), y अनुमानित बिट है, और (y − P(1)) | ** | ||
'''जहां η [[सीखने की दर]] है (आमतौर पर 0.002 से 0.01), y अनुमानित बिट है, और (y − P(1''')) पूर्वानुमान त्रुटि है। वेट अपडेट एल्गोरिदम [[पश्चप्रचार]] से अलग है जिसमें P(1)P(0) शब्द हटा दिए जाते हैं। ऐसा इसलिए है क्योंकि तंत्रिका नेटवर्क का लक्ष्य कोडिंग कास्ट को कम करना है, न कि मूल माध्य वर्ग त्रुटि। | |||
पीएक्यू के अधिकांश | पीएक्यू के अधिकांश वर्जन तंत्रिका नेटवर्क के लिए वजन के सेट के बीच चयन करने के लिए छोटे संदर्भ का उपयोग करते हैं। कुछ वर्जन एकाधिक नेटवर्क का उपयोग करते हैं जिनके आउटपुट एसएसई चरणों से पहले और नेटवर्क के साथ संयुक्त होते हैं। इसके अलावा, प्रत्येक इनपुट पूर्वानुमान के लिए अनेक इनपुट हो सकते हैं जो पी के गैर-रेखीय कार्य हैं<sub>''i''</sub>(1) खिंचाव के अतिरिक्त (पी(1))। | ||
===संदर्भ मॉडलिंग=== | ===संदर्भ मॉडलिंग=== | ||
प्रत्येक मॉडल एस के ज्ञात बिट्स को संदर्भों के सेट में विभाजित करता है और प्रत्येक संदर्भ को 8-बिट स्थिति द्वारा दर्शाए गए बिट इतिहास में मैप करता है। | प्रत्येक मॉडल एस के ज्ञात बिट्स को संदर्भों के सेट में विभाजित करता है और प्रत्येक संदर्भ को 8-बिट स्थिति द्वारा दर्शाए गए बिट इतिहास में मैप करता है। पी.ए.क्यू.6 के माध्यम से वर्जनो में, राज्य काउंटरों की जोड़ी का प्रतिनिधित्व करता है (एन<sub>0</sub>, एन<sub>1</sub>). पी.ए.क्यू.7 और पश्चात् के वर्जनो में कुछ शर्तों के तहत, स्थिति अंतिम बिट या संपूर्ण अनुक्रम के मूल्य का भी प्रतिनिधित्व करती है। प्रत्येक मॉडल के लिए 256-प्रविष्टि तालिका का उपयोग करके राज्यों को संभावनाओं के आधार पर मैप किया जाता है। मॉडल द्वारा पूर्वानुमान के पश्चात् , पूर्वानुमान त्रुटि को कम करने के लिए तालिका प्रविष्टि को थोड़ा (आमतौर पर 0.4%) समायोजित किया जाता है। | ||
सभी | सभी पी.ए.क्यू.8 वर्जनो में, प्रतिनिधित्व योग्य स्थितियाँ इस प्रकार हैं: | ||
* 4 बिट तक के लिए | * 4 बिट तक के लिए स्पष्ट बिट अनुक्रम। | ||
* 5 से 15 बिट्स के अनुक्रमों के लिए गिनती की जोड़ी और नवीनतम बिट का संकेतक। | * 5 से 15 बिट्स के अनुक्रमों के लिए गिनती की जोड़ी और नवीनतम बिट का संकेतक। | ||
* 16 से 41 बिट्स के अनुक्रमों के लिए गिनती की जोड़ी। | * 16 से 41 बिट्स के अनुक्रमों के लिए गिनती की जोड़ी। | ||
Line 77: | Line 84: | ||
अधिकांश संदर्भ मॉडल [[हैश तालिका]]ओं के रूप में कार्यान्वित किए जाते हैं। कुछ छोटे संदर्भों को प्रत्यक्ष लुकअप तालिकाओं के रूप में कार्यान्वित किया जाता है। | अधिकांश संदर्भ मॉडल [[हैश तालिका]]ओं के रूप में कार्यान्वित किए जाते हैं। कुछ छोटे संदर्भों को प्रत्यक्ष लुकअप तालिकाओं के रूप में कार्यान्वित किया जाता है। | ||
=== | ===टेक्स्ट प्रीप्रोसेसिंग=== | ||
पी.ए.क्यू. के कुछ संस्करण, विशेष रूप से PAsQDa, पी.ए.क्यू.AR (दोनों पी.ए.क्यू.6 डेरिवेटिव), और पी.ए.क्यू.8HP1 से पी.ए.क्यू.8HP8 (पी.ए.क्यू.8 डेरिवेटिव और [[हटर पुरस्कार]] प्राप्तकर्ता) बाहरी शब्दकोश में शब्दों को देखकर और उन्हें 1- से 3-बाइट कोड के साथ बदलकर टेक्स्ट फ़ाइलों को प्रीप्रोसेस करते हैं। . इसके अलावा, अपरकेस अक्षरों को विशेष वर्ण के साथ एन्कोड किया जाता है जिसके पश्चात् लोअरकेस अक्षर आते हैं। पी.ए.क्यू.8HP श्रृंखला में, शब्दकोश को वाक्यात्मक और शब्दार्थ संबंधी शब्दों को साथ समूहित करके व्यवस्थित किया जाता है। यह मॉडलों को संदर्भ के रूप में शब्दकोश कोड के सबसे महत्वपूर्ण बिट्स का उपयोग करने की अनुमति देता है। | |||
==तुलना== | ==तुलना== | ||
निम्नलिखित तालिका मैट महोनी द्वारा [http://mattmahoney.net/dc/text.html बड़े टेक्स्ट | निम्नलिखित तालिका मैट महोनी द्वारा [http://mattmahoney.net/dc/text.html बड़े टेक्स्ट कंप्रेशन बेंचमार्क] से नमूना है जिसमें 10 वाली फ़ाइल सम्मिलित है<sup>[[अंग्रेजी विकिपीडिया]] टेक्स्ट के 9</sup> बाइट्स (1 [[गीगाबाइट]], या 0.931 [[GiB]])। | ||
{| class="wikitable" | {| class="wikitable" | ||
!कार्यक्रम | |||
!कंप्रेस आकार (बाइट्स) | |||
!मूल आकार का % | |||
!कंप्रेशन समय ( एनएस / बी ) | |||
!मेमोरी (एमआईबी) | |||
|- | |- | ||
|पीएक्यू8एचपी8 | |||
|133,423,109 | |||
|13.34 | |||
|64 639 | |||
|1849 | |||
| | |||
| 133,423,109 | |||
| | |||
| 64 639 | |||
| 1849 | |||
|- | |- | ||
| | |पी.पी.एम.डी | ||
| 183,976,014 | |183,976,014 | ||
| | |18.4 | ||
| 880 | |880 | ||
| 256 | |256 | ||
|- | |- | ||
| | |बीजेआईपी 2 | ||
| 254,007,875 | |254,007,875 | ||
| | |25.4 | ||
| 379 | |379 | ||
| 8 | |8 | ||
|- | |- | ||
| | |इन्फोज़िप | ||
| 322,649,703 | |322,649,703 | ||
| | |32.26 | ||
| 104 | |104 | ||
| 0.1 | |0.1 | ||
|} | |} | ||
फ़ाइल | फ़ाइल कंप्रेशन बेंचमार्क की सूची के लिए लॉसलेस कंप्रेशन #बेंचमार्क देखें। | ||
==इतिहास== | ==इतिहास== | ||
निम्नलिखित | निम्नलिखित पी.ए.क्यू. एल्गोरिथम के प्रमुख संवर्द्धनों को सूचीबद्ध करता है। इसके अलावा, बड़ी संख्या में वृद्धिशील सुधार हुए हैं, जिन्हें छोड़ दिया गया है। | ||
* | * पी.ए.क्यू.1 को 6 जनवरी 2002 को मैट महोनी द्वारा जारी किया गया था। इसमें निश्चित वजन का उपयोग किया गया था और इसमें एनालॉग या विरल मॉडल सम्मिलित नहीं था। | ||
* | * पी.ए.क्यू.1SSE/पी.ए.क्यू.2 को 11 मई 2003 को सर्ज ओस्नाच द्वारा जारी किया गया था। इसने भविष्यवक्ता और एनकोडर के बीच माध्यमिक प्रतीक अनुमान (एसएसई) चरण जोड़कर कंप्रेशन में उल्लेखनीय सुधार किया। एसएसई संक्षिप्त संदर्भ और वर्तमान पूर्वानुमान इनपुट करता है और तालिका से नई पूर्वानुमान आउटपुट करता है। फिर वास्तविक बिट मान को प्रतिबिंबित करने के लिए तालिका प्रविष्टि को समायोजित किया जाता है। | ||
* 9 अक्टूबर 2003 को जारी | * 9 अक्टूबर 2003 को जारी पी.ए.क्यू.3N ने विरल मॉडल जोड़ा। | ||
* मैट महोनी द्वारा 15 नवंबर 2003 को जारी | * मैट महोनी द्वारा 15 नवंबर 2003 को जारी पी.ए.क्यू.4 में अनुकूली भार का उपयोग किया गया। पी.ए.क्यू.5 (दिसंबर 18, 2003) और पी.ए.क्यू.6 (दिसंबर 30, 2003) नए एनालॉग मॉडल सहित मामूली सुधार थे। इस बिंदु पर, पीएक्यू सर्वश्रेष्ठ पीपीएम कम्प्रेसर के साथ प्रतिस्पर्धी था और उसने डेटा कंप्रेशन समुदाय का ध्यान आकर्षित किया, जिसके परिणामस्वरूप अप्रैल 2004 तक बड़ी संख्या में वृद्धिशील सुधार हुए। बर्टो डेस्टासियो ने मॉडलों को ट्यून किया और बिट काउंट डिस्काउंटिंग शेड्यूल को समायोजित किया। जोहान डी बॉक ने यूजर इंटरफ़ेस में सुधार किया। डेविड ए. स्कॉट ने अंकगणित कोडर में सुधार किया। फैबियो बफोनी ने गति में सुधार किया। | ||
* 20 मई 2004 से 27 जुलाई 2004 की अवधि के दौरान, अलेक्जेंडर रतुश्न्याक ने | * 20 मई 2004 से 27 जुलाई 2004 की अवधि के दौरान, अलेक्जेंडर रतुश्न्याक ने पी.ए.क्यू.AR के सात वर्जन जारी किए, जिसमें अनेक नए मॉडल, संदर्भ द्वारा चयनित वजन के साथ अनेक मिक्सर, प्रत्येक मिक्सर आउटपुट में एसएसई चरण जोड़कर महत्वपूर्ण कंप्रेशन सुधार किए गए। और इंटेल निष्पादन योग्य फ़ाइलों के कंप्रेशन को बेहतर बनाने के लिए प्रीप्रोसेसर जोड़ना। पी.ए.क्यू.AR 2004 के अंत तक शीर्ष रैंक वाले कंप्रेसर के रूप में खड़ा था, किन्तु पिछले पी.ए.क्यू. वर्जनो की तुलना में काफी धीमा था। | ||
* 18 जनवरी 2005 से 7 फरवरी 2005 की अवधि के दौरान, प्रेज़ेमिस्लाव स्किबिंस्की ने अंग्रेजी शब्दकोश प्रीप्रोसेसर के साथ | * 18 जनवरी 2005 से 7 फरवरी 2005 की अवधि के दौरान, प्रेज़ेमिस्लाव स्किबिंस्की ने अंग्रेजी शब्दकोश प्रीप्रोसेसर के साथ पी.ए.क्यू.6 और पी.ए.क्यू.AR पर आधारित PASqDa के चार वर्जन जारी किए। इसने कैलगरी कॉर्पस पर शीर्ष रैंकिंग हासिल की किन्तु अधिकांश अन्य बेंचमार्क पर नहीं। | ||
* | * पी.ए.क्यू.6 के संशोधित वर्जन ने 10 जनवरी 2004 को मैट महोनी द्वारा कैलगरी चैलेंज जीता। अलेक्जेंडर रतुश्न्याक द्वारा पी.ए.क्यू.AR के दस पश्चात् के वर्जनो द्वारा इसे बेहतर बनाया गया। सबसे हालिया 5 जून 2006 को प्रस्तुत किया गया था, जिसमें कुल 589,862 बाइट्स का कंप्रेस डेटा और प्रोग्राम स्रोत कोड सम्मिलित था। | ||
* | * पी.ए.क्यू.7 को दिसंबर 2005 में मैट महोनी द्वारा रिलीज़ किया गया था। पी.ए.क्यू.7, पी.ए.क्यू.6 और वेरिएंट (पी.ए.क्यू.AR, PAsQDa) का पूर्ण पुनर्लेखन है। कंप्रेशन अनुपात पी.ए.क्यू.AR के समान था किन्तु 3 गुना तेज़ था। हालाँकि इसमें x86 और शब्दकोश का अभाव था, इसलिए यह विंडोज़ निष्पादनयोग्य और अंग्रेजी टेक्स्ट फ़ाइलों के साथ-साथ PAsQDa को कंप्रेस नहीं करता था। इसमें रंगीन बीएमपी, टीआईएफएफ और जेपीईजी फाइलों के मॉडल सम्मिलित हैं, इसलिए ये फाइलें बेहतर विधियों से कंप्रेस होती हैं। पी.ए.क्यू.6 से प्राथमिक अंतर यह है कि यह ग्रेडिएंट डिसेंट मिक्सर के अतिरिक्त मॉडलों को संयोजित करने के लिए तंत्रिका नेटवर्क का उपयोग करता है। अन्य विशेषता [[ प्रोग्राम फ़ाइल |प्रोग्राम फ़ाइल]] ेल-, वर्ड- और पीडीएफ-फ़ाइलों में एम्बेडेड जेपीईजी और बिटमैप छवियों को कंप्रेस करने की पी.ए.क्यू.7 की क्षमता है। | ||
* | * पी.ए.क्यू.8A को 27 जनवरी 2006 को, पी.ए.क्यू.8C को 13 फरवरी 2006 को जारी किया गया था। ये प्रत्याशित पी.ए.क्यू.8 के प्रायोगिक प्री-रिलीज़ थे। इसने पी.ए.क्यू.7 (कुछ मामलों में [[खराब]] कंप्रेशन ) में अनेक समस्याओं को ठीक किया। पी.ए.क्यू.8A में (x86) निष्पादनयोग्यों को कंप्रेस करने के लिए मॉडल भी सम्मिलित है। | ||
* | * पी.ए.क्यू.8F को 28 फरवरी, 2006 को जारी किया गया था। पी.ए.क्यू.8F में पी.ए.क्यू.8A की तुलना में 3 सुधार थे: अधिक मेमोरी कुशल संदर्भ मॉडल, कंप्रेशन में सुधार के लिए नया अप्रत्यक्ष संदर्भ मॉडल, और विंडोज़ में ड्रैग और ड्रॉप का समर्थन करने के लिए नया उपयोगकर्ता इंटरफ़ेस। यह पी.ए.क्यू.8B/C/D/E वेरिएंट की तरह अंग्रेजी शब्दकोश का उपयोग नहीं करता है। | ||
* | * पी.ए.क्यू.8G को प्रेज़ेमिस्लाव स्किबिंस्की द्वारा 3 मार्च 2006 को रिलीज़ किया गया था। पी.ए.क्यू.8G पी.ए.क्यू.8F है जिसमें शब्दकोश जोड़े गए हैं और पुन: डिज़ाइन किए गए टेक्स्टफ़िल्टर के रूप में कुछ अन्य सुधार किए गए हैं (जो गैर-पाठ्य फ़ाइलों पर कंप्रेशन प्रदर्शन को कम नहीं करता है) | ||
* | * पी.ए.क्यू.8H को 22 मार्च 2006 को अलेक्जेंडर रतुश्न्याक द्वारा जारी किया गया और 24 मार्च 2006 को अद्यतन किया गया। पी.ए.क्यू.8H हैमॉडल में कुछ सुधारों के साथ पी.ए.क्यू.8G पर आधारित। | ||
* | * पी.ए.क्यू.8I को 18 अगस्त 2006 को पावेल एल. होलोबोरोडको द्वारा 24 अगस्त, 4 सितंबर और 13 सितंबर को बग फिक्स के साथ जारी किया गया था। इसमें पोर्टेबल बिटमैप#पीजीएम उदाहरण फ़ाइलों के लिए ग्रेस्केल छवि मॉडल जोड़ा गया था। | ||
* | * पी.ए.क्यू.8J को बिल पेटिस द्वारा 13 नवंबर 2006 को रिलीज़ किया गया था। यह पी.ए.क्यू.8HP5 से लिए गए कुछ टेक्स्ट मॉडल सुधारों के साथ पी.ए.क्यू.8F पर आधारित था। इस प्रकार, इसमें पी.ए.क्यू.8G से टेक्स्ट शब्दकोश या पी.ए.क्यू.8I से PGM मॉडल सम्मिलित नहीं थे। | ||
*सर्ज ओस्नाच ने मॉडलिंग सुधारों की श्रृंखला जारी की: 16 नवंबर 2006 को | *सर्ज ओस्नाच ने मॉडलिंग सुधारों की श्रृंखला जारी की: 16 नवंबर 2006 को पी.ए.क्यू.8JA, 21 नवंबर को पी.ए.क्यू.8JB और 28 नवंबर को पी.ए.क्यू.8JC। | ||
* | * पी.ए.क्यू.8JD को बिल पेटिस द्वारा 30 दिसंबर 2006 को रिलीज़ किया गया था। तब से इस वर्जन को अनेक प्रोसेसरों के लिए 32 बिट [[ माइक्रोसॉफ़्ट विंडोज़ |माइक्रोसॉफ़्ट विंडोज़]] और 32 और 64 बिट [[लिनक्स]] में पोर्ट किया गया है। | ||
* | * पी.ए.क्यू.8K को बिल पेटिस द्वारा 13 फरवरी 2007 को रिलीज़ किया गया था। इसमें बाइनरी फ़ाइलों के लिए अतिरिक्त मॉडल सम्मिलित हैं। | ||
* | * पी.ए.क्यू.8L को मैट महोनी द्वारा 8 मार्च 2007 को रिलीज़ किया गया था। यह पी.ए.क्यू.8JD पर आधारित है और [[ गतिशील मार्कोव संपीड़न |गतिशील मार्कोव कंप्रेशन]] मॉडल जोड़ता है। | ||
* | * पी.ए.क्यू.8O को 24 अगस्त 2007 को एंड्रियास मॉर्फिस द्वारा जारी किया गया था। इसमें पी.ए.क्यू.8L की तुलना में बेहतर BMP फ़ाइल स्वरूप और JPEG मॉडल सम्मिलित हैं। वैकल्पिक रूप से SSE2 समर्थन और 64-बिट Linux के लिए संकलित किया जा सकता है। 64-बिट ओएस के अनुसार एल्गोरिदम में उल्लेखनीय प्रदर्शन लाभ हैं। | ||
* | * पी.ए.क्यू.8P को एंड्रियास मॉर्फिस द्वारा 25 अगस्त 2008 को जारी किया गया था। इसमें बेहतर BMP मॉडल सम्मिलित है और [[WAV]] मॉडल जोड़ा गया है। | ||
* | * पी.ए.क्यू.8PX को 25 अप्रैल 2009 को जन ओन्ड्रस द्वारा जारी किया गया था। इसमें बेहतर WAV कम्प्रेशन और EXE कम्प्रेशन जैसे विभिन्न सुधार सम्मिलित हैं। | ||
* | * पी.ए.क्यू.8KX को 15 जुलाई 2009 को जन ओन्ड्रस द्वारा जारी किया गया था। यह पी.ए.क्यू.8K के साथ पी.ए.क्यू.8PX का संयोजन है। | ||
* | * पी.ए.क्यू.8PF को लवपिंपल द्वारा 9 सितंबर 2009 को बिना सोर्स कोड (जिसके लिए [[GPL]] लाइसेंस की आवश्यकता होती है) के बिना जारी किया गया था। यह 7% खराब कंप्रेस करता है, किन्तु पी.ए.क्यू.8PX v66 (1 एमबी अंग्रेजी टेक्स्ट से मापा गया) की तुलना में 7 गुना तेज है। | ||
* | * पी.ए.क्यू.9A को मैट महोनी द्वारा 31 दिसंबर 2007 को जारी किया गया था। नया प्रयोगात्मक संस्करण. इसमें विशिष्ट फ़ाइल प्रकारों के लिए मॉडल सम्मिलित नहीं हैं, इसमें LZP प्रीप्रोसेसर है और 2 जीबी से अधिक की फ़ाइलों का समर्थन करता है। | ||
* [[ZPAQ]] को 12 मार्च 2009 को मैट महोनी द्वारा जारी किया गया था। यह नए संग्रह प्रारूप का उपयोग करता है जिसे डिज़ाइन किया गया है | * [[ZPAQ|Z]]पी.ए.क्यू. को 12 मार्च 2009 को मैट महोनी द्वारा जारी किया गया था। यह नए संग्रह प्रारूप का उपयोग करता है जिसे डिज़ाइन किया गया है जिससे वर्तमान Zपी.ए.क्यू. प्रोग्राम भविष्य के Zपी.ए.क्यू. वर्जनो द्वारा बनाए गए अभिलेखागार को डीकंप्रेस करने में सक्षम हो सके।<ref>{{Cite web|url=https://manpages.ubuntu.com/manpages/xenial/en/man1/zpaq.1.html|title=Ubuntu Manpage: zpaq - PAQ open standard maximum compressor|website=manpages.ubuntu.com}}</ref> (ऊपर सूचीबद्ध विभिन्न पीएक्यू वेरिएंट इस तरह से आगे संगत नहीं हैं)। यह बाइटकोड प्रोग्राम में डीकंप्रेसन एल्गोरिदम को निर्दिष्ट करके इसे प्राप्त करता है जो प्रत्येक निर्मित संग्रह फ़ाइल में संग्रहीत होता है।<ref>{{cite web|url=http://mattmahoney.net/dc/zpaq1.pdf |title=ZPAQ स्तर 1 विशिष्टता|format=PDF |access-date=2010-09-03}}</ref> | ||
===हटर पुरस्कार=== | ===हटर पुरस्कार=== | ||
श्रृंखला | श्रृंखला पी.ए.क्यू.8HP1 से पी.ए.क्यू.8HP8 को हटर पुरस्कार प्रस्तुतिकरण के रूप में 21 अगस्त 2006 से 18 जनवरी 2007 तक अलेक्जेंडर रतुश्न्याक द्वारा जारी किया गया था। हटर पुरस्कार विकिपीडिया के स्रोत से प्राप्त 100 एमबी अंग्रेजी और एक्सएमएल डेटा सेट का उपयोग करके टेक्स्ट कंप्रेशन प्रतियोगिता है। पी.ए.क्यू.8HP श्रृंखला को पी.ए.क्यू.8H से फोर्क किया गया था। कार्यक्रमों में टेक्स्ट प्रीप्रोसेसिंग शब्दकोश और विशेष रूप से बेंचमार्क के अनुरूप मॉडल सम्मिलित हैं। सभी गैर-टेक्स्ट मॉडल हटा दिए गए. शब्दकोशों को वाक्य-विन्यास और शब्दार्थ से संबंधित शब्दों को समूहीकृत करने और सामान्य प्रत्यय द्वारा शब्दों को समूहीकृत करने के लिए व्यवस्थित किया गया था। पूर्व रणनीति कंप्रेशन में सुधार करती है क्योंकि संबंधित शब्द (जो समान संदर्भ में प्रकट होने की संभावना है) को उनके शब्दकोश कोड के उच्च क्रम बिट्स पर मॉडल किया जा सकता है। पश्चात् वाली रणनीति शब्दकोश को कंप्रेस करना आसान बनाती है। डीकंप्रेसन प्रोग्राम और कंप्रेस शब्दकोश का आकार प्रतियोगिता रैंकिंग में सम्मिलित है। | ||
27 अक्टूबर 2006 को इसकी घोषणा की गई<ref>James Bowery. [http://groups.google.com/group/Hutter-Prize/browse_frm/thread/3f3f80c76dd14513/ Alexander Ratushnyak Wins First Hutter Prize Payout]. Published October 27, 2006. Retrieved October 30, 2006. {{dead link|date=June 2016|bot=medic}}{{cbignore|bot=medic}}</ref> कि | 27 अक्टूबर 2006 को इसकी घोषणा की गई<ref>James Bowery. [http://groups.google.com/group/Hutter-Prize/browse_frm/thread/3f3f80c76dd14513/ Alexander Ratushnyak Wins First Hutter Prize Payout]. Published October 27, 2006. Retrieved October 30, 2006. {{dead link|date=June 2016|bot=medic}}{{cbignore|bot=medic}}</ref> कि पी.ए.क्यू.8HP5 ने यूरो|€3,416 का हटर पुरस्कार जीता। | ||
30 जून 2007 को, रतुश्न्याक के | 30 जून 2007 को, रतुश्न्याक के पी.ए.क्यू.8HP12 को €1732 के दूसरे हटर पुरस्कार से सम्मानित किया गया,<ref>http://prize.hutter1.net/award2.gif {{Bare URL image|date=March 2022}}</ref> अपने पिछले रिकॉर्ड में 3.46% का सुधार हुआ। | ||
== | ==पी.ए.क्यू. व्युत्पत्तियाँ== | ||
मुफ़्त सॉफ़्टवेयर होने के कारण, | मुफ़्त सॉफ़्टवेयर होने के कारण, पी.ए.क्यू. को किसी भी व्यक्ति द्वारा संशोधित और पुनर्वितरित किया जा सकता है जिसके पास इसकी प्रतिलिपि है। इसने अन्य लेखकों को पीएक्यू कम्प्रेशन इंजन को फोर्क (सॉफ्टवेयर विकास) करने और [[ ग्राफिकल यूज़र इंटरफ़ेस |ग्राफिकल यूज़र इंटरफ़ेस]] या बेहतर गति (कंप्रेशन अनुपात की मूल्य पर) जैसी नई सुविधाएं जोड़ने की अनुमति दी है। उल्लेखनीय पी.ए.क्यू. डेरिवेटिव में सम्मिलित हैं: | ||
* WinUDA 0.291, | * WinUDA 0.291, पी.ए.क्यू.6 पर आधारित किन्तु तेज़<ref name="mycomp.htm">[http://wex.cn/dwing/mycomp.htm dwing's homepage] {{webarchive |url=https://web.archive.org/web/20070224151023/http://wex.cn/dwing/mycomp.htm |date=February 24, 2007 }}</ref> | ||
* UDA 0.301, | * UDA 0.301, पी.ए.क्यू.8I एल्गोरिथम पर आधारित<ref name="mycomp.htm"/>* KGB पुरालेखपाल, पी.ए.क्यू.6 पर आधारित<ref>{{cite web |url=http://kgbarchiver.net/ |title=केजीबी आर्काइवर होमपेज|publisher=Kgbarchiver.net |access-date=2010-05-19 |archive-date=2009-01-05 |archive-url=https://web.archive.org/web/20090105160545/http://kgbarchiver.net/ |url-status=dead }}</ref> (बीटा वर्जन पी.ए.क्यू.7 पर आधारित है)। | ||
* एमिलकॉन्ट | * एमिलकॉन्ट पी.ए.क्यू.6 पर आधारित है<ref>{{cite web |url=http://www.freewebs.com/emilcont/ |title=एमिलकॉन्ट अल्ट्राकम्प्रेशन|publisher=Freewebs.com |access-date=2010-05-19 |url-status=dead |archive-url=https://web.archive.org/web/20100910070903/http://www.freewebs.com/emilcont/ |archive-date=2010-09-10 }}</ref> | ||
* [[पीज़िप]] जीयूआई फ्रंटएंड (विंडोज और लिनक्स के लिए) <abbr title=' लाइट PAQ, सिंगल फाइल कंप्रेसर'> | * [[पीज़िप]] जीयूआई फ्रंटएंड (विंडोज और लिनक्स के लिए) <abbr title=' लाइट PAQ, सिंगल फाइल कंप्रेसर'>L</abbr>पी.ए.क्यू. के लिए,<ref>{{cite web | ||
|url=http://mattmahoney.net/dc/#lpaq | |url=http://mattmahoney.net/dc/#lpaq | ||
|title=LPAQ | |title=LPAQ | ||
|author=Matt Mahoney | |author=Matt Mahoney | ||
|date=2007 | |date=2007 | ||
|access-date=2013-12-29}}</ref> | |access-date=2013-12-29}}</ref> Zपी.ए.क्यू. और विभिन्न पी.ए.क्यू.8* एल्गोरिदम<ref>{{cite web|url=http://peazip.sourceforge.net/peazip-free-archiver.html |title=पीज़िप|publisher=पीज़िप|access-date=2013-10-06}}</ref> | ||
* PWCM ( | * PWCM (पी.ए.क्यू. वेटेड कॉन्टेक्स्ट मिक्सिंग) WinRK में प्रयुक्त पी.ए.क्यू. एल्गोरिदम का स्वतंत्र रूप से विकसित बंद स्रोत कार्यान्वयन है।<ref>{{cite web |url=http://www.maximumcompression.com/data/summary_sf.php |title=एकल फ़ाइल डेटा संपीड़न बेंचमार्क, संपीड़न अनुपात पर क्रमबद्ध|publisher=Maximumcompression.com |date=2007-04-14 |access-date=2010-05-19 |archive-date=2009-04-17 |archive-url=https://web.archive.org/web/20090417042621/http://www.maximumcompression.com/data/summary_sf.php |url-status=dead }}</ref> | ||
* | *पी.ए.क्यू.Compress अनेक नए पी.ए.क्यू. वर्जनो के लिए ग्राफिकल यूजर इंटरफेस है, जिसमें पी.ए.क्यू.8PX, पी.ए.क्यू.8PXD और पी.ए.क्यू.8PXV के नवीनतम रिलीज सम्मिलित हैं। जब भी कोई नया वर्जन जारी होता है तो इसे अपडेट किया जाता है। सॉफ़्टवेयर समझदारी से फ़ाइल नाम में एक्सटेंशन जोड़ता है जिसका उपयोग वह सही पी.ए.क्यू. वर्जन का उपयोग करके फ़ाइल को डीकंप्रेस करने के लिए कर सकता है। सॉफ्टवेयर खुला स्रोत है.<ref>{{Cite web|url=https://moisescardona.me/paqcompress/|title=पीएक्यूकंप्रेस|date=2019-01-10|website=Moisés Cardona|language=en-US|access-date=2019-03-05}}</ref> | ||
* परफेक्ट कंप्रेस<ref>{{cite web|url=http://moises-studios.com/?q=PerfectCompress |title=परफेक्टकंप्रेस आधिकारिक वेबसाइट|publisher=Moises-studios.110mb.com |date=2010-04-03 |access-date=2010-05-19}}</ref>एक कंप्रेशन सॉफ्टवेयर है जिसमें यूसीए (अल्ट्रा कंप्रेस्ड आर्काइव) की सुविधा है। | * परफेक्ट कंप्रेस<ref>{{cite web|url=http://moises-studios.com/?q=PerfectCompress |title=परफेक्टकंप्रेस आधिकारिक वेबसाइट|publisher=Moises-studios.110mb.com |date=2010-04-03 |access-date=2010-05-19}}</ref>एक कंप्रेशन सॉफ्टवेयर है जिसमें यूसीए (अल्ट्रा कंप्रेस्ड आर्काइव) की सुविधा है। कंप्रेशन प्रारूप जिसमें पी.ए.क्यू.8PX v42 से v65 सम्मिलित है और जो अब डिफ़ॉल्ट UCA कंप्रेसर के रूप में पी.ए.क्यू.8PF, पी.ए.क्यू.8KX, या पी.ए.क्यू.8PXPRE का उपयोग कर सकता है। इसके अलावा, परफेक्टकंप्रेस फ़ाइलों को पी.ए.क्यू.8PX v42 से v67, और Zपी.ए.क्यू. में कंप्रेस कर सकता है, और वर्जन 6.0 के अनुसार, फ़ाइलों को Lपी.ए.क्यू. और पी.ए.क्यू.8PF बीटा 1 से बीटा 3 में कंप्रेस कर सकता है। परफेक्टकंप्रेस v6.10 ने वर्तमान ही में जारी पी.ए.क्यू.8PXPRE के लिए समर्थन कंप्रेशन पेश किया है। परफेक्टकंप्रेस 6.12 पी.ए.क्यू.8KX श्रृंखला के लिए समर्थन प्रस्तुत करता है।<ref>{{cite web|url=http://www.facebook.com/pages/PerfectCompress/224694115431 |title=परफेक्टकंप्रेस आधिकारिक फेसबुक पेज|publisher=Facebook.com |access-date=2010-05-19}}</ref> | ||
* फ्रंटपीएक्यू, पीएक्यू के लिए छोटा गुई। नवीनतम | * फ्रंटपीएक्यू, पीएक्यू के लिए छोटा गुई। नवीनतम वर्जन फ्रंटपी.ए.क्यू. v8 है जो पी.ए.क्यू.8PX, पी.ए.क्यू.8PF और FP8 को सपोर्ट करता है। सॉफ़्टवेयर अब अपडेट नहीं किया गया है और उपयोगकर्ताओं को पी.ए.क्यू.Compress का उपयोग करने के लिए प्रोत्साहित किया जाता है, जो नवीनतम पी.ए.क्यू. रिलीज़ को लागू करता है।<ref>{{Cite web|url=https://encode.su/threads/453-FrontPAQ-GUI-frontend-for-PAQ8PF-and-PAQ8PX?p=58940&viewfull=1#post58940|title=FrontPAQ - GUI frontend for PAQ8PF and PAQ8PX|website=encode.su|access-date=2019-07-26}}</ref> | ||
Line 187: | Line 193: | ||
==अग्रिम पठन== | ==अग्रिम पठन== | ||
* David Salomon, Giovanni Motta, (with contributions by David Bryant), ''Handbook of Data Compression'', 5th edition, Springer, 2009, {{ISBN|1-84882-902-7}}, 5.15 | * David Salomon, Giovanni Motta, (with contributions by David Bryant), ''Handbook of Data Compression'', 5th edition, Springer, 2009, {{ISBN|1-84882-902-7}}, 5.15 पी.ए.क्यू., pp. 314–319 | ||
* Byron Knoll, Nando de Freitas, [https://arxiv.org/abs/1108.3298 ''A Machine Learning Perspective on Predictive Coding with | * Byron Knoll, Nando de Freitas, [https://arxiv.org/abs/1108.3298 ''A Machine Learning Perspective on Predictive Coding with पी.ए.क्यू.''], University of British Columbia, Vancouver, Canada, August 17, 2011 | ||
Revision as of 21:38, 12 December 2023
पी.ए.क्यू. लॉसलेस डेटा कंप्रेशन अभिलेखों की श्रृंखला है जो सहयोगात्मक विकास के माध्यम से कंप्रेशन अनुपात को मापने वाले अनेक बेंचमार्क पर शीर्ष रैंकिंग तक पहुंच गई है (चूँकि गति और मेमोरी उपयोग की मूल्य पर)। पीएक्यू के विशिष्ट वर्जनो ने हटर पुरस्कार और कैलगरी चुनौती जीता है।[1] पीएक्यू जीएनयू जनरल पब्लिक लाइसेंस के अनुसार वितरित मुफ्त सॉफ्टवेयर है।[2]
एल्गोरिदम
पी.ए.क्यू. संदर्भ मिश्रण एल्गोरिथ्म का उपयोग करता है। संदर्भ मिश्रण आंशिक मिलान (पीपीएम) द्वारा पूर्वानुमान से संबंधित है जिसमें कंप्रेसर को भविष्यवक्ता और अंकगणितीय कोडर में विभाजित किया गया है, किन्तु इसमें भिन्नता है कि अगले-प्रतीक पूर्वानुमान की गणना बड़ी संख्या में मॉडल से संभाव्यता अनुमानों के भारित संयोजन का उपयोग करके की जाती है। विभिन्न सन्दर्भों पर आधारित पीपीएम के विपरीत, किसी संदर्भ को सन्निहित होने की आवश्यकता नहीं है। अधिकांश पी.ए.क्यू. वर्जन निम्नलिखित संदर्भों के लिए अगले-प्रतीक आँकड़े एकत्र करते हैं:
- n -ग्राम ; संदर्भअनुमानित प्रतीक से पहले अंतिम n बाइट्स है (जैसा कि पीपीएम में है);
- संपूर्ण-शब्द n-ग्राम, केस और गैर-वर्णमाला वर्णों को अनदेखा करना (टेक्स्ट फ़ाइलों में उपयोगी);
- विरल संदर्भ, उदाहरण के लिए, अनुमानित प्रतीक से पहले के दूसरे और चौथे बाइट्स (कुछ बाइनरी प्रारूपों में उपयोगी);
- एनालॉग संदर्भ, जिसमें पिछले 8- या 16-बिट शब्दों के उच्च-क्रम बिट्स सम्मिलित हैं (मल्टीमीडिया फ़ाइलों के लिए उपयोगी);
- द्वि-आयामी संदर्भ (छवियों, तालिकाओं और स्प्रेडशीट के लिए उपयोगी); पंक्ति की लंबाई दोहराए जाने वाले बाइट पैटर्न की स्ट्राइड लंबाई ज्ञात करके निर्धारित की जाती है;
- विशेष मॉडल, जैसे x86 निष्पादन योग्य, विंडोज़ बिटमैप , टीआईएफएफ, या जेपीईजी छवियां; ये मॉडल केवल तभी सक्रिय होते हैं जब विशेष फ़ाइल प्रकार का पता लगाया जाता है।
सभी पी.ए.क्यू. वर्जन समय में बिट की पूर्वानुमान करते हैं और कंप्रेस करते हैं, किन्तु मॉडल के विवरण और पूर्वानुमानो को संयुक्त और पोस्टप्रोसेस करने के विधियों में भिन्नता होती है। एक बार जब अगली-बिट संभावना निर्धारित हो जाती है, तो इसे अंकगणितीय कोडिंग द्वारा एन्कोड किया जाता है। वर्जन के आधार पर पूर्वानुमानो के संयोजन की तीन विधियाँ हैं:
- पी.ए.क्यू.1 से पी.ए.क्यू.3 तक, प्रत्येक पूर्वानुमान को बिट गणना की एक जोड़ी के रूप में दर्शाया जाता है। इन गणनाओं को भारित योग द्वारा संयोजित किया जाता है, जिसमें लंबे संदर्भों को अधिक महत्व दिया जाता है।
- पी.ए.क्यू.4 से पी.ए.क्यू.6 में, पूर्वानुमानों को पहले की तरह संयोजित किया जाता है, किन्तु प्रत्येक मॉडल को दिए गए भार को अधिक स्पष्ट मॉडल के पक्ष में समायोजित किया जाता है।
- पी.ए.क्यू.7 और पश्चात् में, प्रत्येक मॉडल गिनती की जोड़ी के अतिरिक्त संभावना को आउटपुट करता है। संभावनाओं को आर्टिफिशल न्यूरल नेटवर्क का उपयोग करके संयोजित किया जाता है।
पी.ए.क्यू.1एसएसई और पश्चात् के वर्जन द्वितीयक प्रतीक अनुमान (एसएसई) का उपयोग करके पूर्वानुमान को पोस्टप्रोसेस करते हैं। किसी तालिका में नई पूर्वानुमान देखने के लिए संयुक्त पूर्वानुमान और छोटे संदर्भ का उपयोग किया जाता है। बिट एन्कोड होने के पश्चात् , पूर्वानुमान त्रुटि को कम करने के लिए तालिका प्रविष्टि को समायोजित किया जाता है। एसएसई चरणों को विभिन्न संदर्भों के साथ पाइपलाइन किया जा सकता है या औसत आउटपुट के साथ समानांतर में गणना की जा सकती है।
अंकगणित कोडिंग
एक स्ट्रिंग s को सबसे छोटी बाइट स्ट्रिंग में कंप्रेस किया जाता है जो [0, 1] रेंज में बेस-256 बिग-एंडियन नंबर x का प्रतिनिधित्व करता है जैसे कि P(r < s) ≤ x < P(r ≤ s), जहां P(r < s) संभावना है कि एक रैंडम स्ट्रिंग r जिसकी लंबाई s के समान है, शब्दकोष की दृष्टि से s से कम होगी। ऐसा x खोजना सदैव संभव है कि x की लंबाई शैनन सीमा, −log2P(r = s) बिट्स से अधिक से अधिक एक बाइट अधिक हो। एस की लंबाई संग्रह शीर्षलेख में संग्रहीत है।
पी.ए.क्यू. में अंकगणित कोडिंग प्रत्येक पूर्वानुमान के लिए x पर निचली और ऊपरी सीमा को बनाए रखते हुए कार्यान्वित की जाती है, प्रारंभ में [0, 1]। प्रत्येक पूर्वानुमान के पश्चात् , वर्तमान सीमा को P(0) और P(1) के अनुपात में दो भागों में विभाजित किया जाता है, संभावना है कि s का अगला बिट क्रमशः 0 या 1 होगा, s के पिछले बिट्स को देखते हुए। फिर अगली बिट को नई श्रेणी के लिए संबंधित उपश्रेणी का चयन करके एन्कोड किया जाता है।
संख्या x को बिट पूर्वानुमानो की समान श्रृंखला बनाकर वापस स्ट्रिंग s में विघटित किया जाता है (चूंकि s के पिछले बिट्स ज्ञात हैं)। कंप्रेशन के साथ सीमा को विभाजित किया गया है। जो कि x वाला भाग नई श्रेणी बन जाता है, और संबंधित बिट को s से जोड़ दिया जाता है।
पी.ए.क्यू. में, सीमा की निचली और ऊपरी सीमा को 3 भागों में दर्शाया गया है। सबसे महत्वपूर्ण आधार-256 अंक समान हैं, इसलिए उन्हें x के अग्रणी बाइट्स के रूप में लिखा जा सकता है। अगले 4 बाइट्स को मेमोरी में रखा जाता है, जिससे प्रमुख बाइट अलग हो। अनुगामी बिट्स को निचली सीमा के लिए सभी शून्य और ऊपरी सीमा के लिए सभी शून्य माना जाता है। निचली सीमा से और बाइट लिखकर कंप्रेशन समाप्त किया जाता है।
अनुकूली मॉडल भार
पी.ए.क्यू.6 के माध्यम से पी.ए.क्यू. वर्जनो में, प्रत्येक मॉडल गिनती की एक जोड़ी, , शून्य बिट्स की गिनती, और , 1 बिट्स की गिनती के लिए अलग-अलग संदर्भों का एक सेट मैप करता है। वर्तमान के इतिहास का पक्ष लेने के लिए, विपरीत बिट देखे जाने पर 2 से अधिक की आधी गिनती को छोड़ दिया जाता है। उदाहरण के लिए, यदि किसी संदर्भ से जुड़ी वर्तमान स्थिति है और 1 देखा जाता है, तो गिनती (7, 4) में अपडेट की जाती है।
एक बिट को अंकगणितीय रूप से उसकी संभाव्यता के आनुपातिक स्थान के साथ कोडित किया जाता है, या तो P(1) या P(0) = 1 - P(1)। संभावनाओं की गणना 0 और 1 की गणना के भारित योग द्वारा की जाती है:
- S0 = Σi wi n0i,
- S1 = Σi wi n1i,
- S = S0 + S1,
- P(0) = S0 / S,
- P(1) = S1 / S,
जहां wi i-वें मॉडल का वजन है। पी.ए.क्यू.3 के माध्यम से, वजन तय किया गया और तदर्थ विधियों से सेट किया गया। (ऑर्डर-n संदर्भों का वजन n2 था।) पी.ए.क्यू.4 से प्रारंभ करते हुए, वजन को उस दिशा में अनुकूल रूप से समायोजित किया गया था जो समान संदर्भ सेट में भविष्य की त्रुटियों को कम करेगा। यदि कोड किया जाने वाला बिट y है, तो वजन समायोजन है:
- ni = n0i + n1i,
- त्रुटि = y – P(1),
- wi ← wi + [(S n1i − S1 ni) / (S0 S1)] त्रुटि.
न्यूरल-नेटवर्क मिश्रण
पी.ए.क्यू.7 से प्रारंभ होकर, प्रत्येक मॉडल पूर्वानुमान आउटपुट करता है (गिनती की जोड़ी के अतिरिक्त )। ये पूर्वानुमान लॉजिस्टिक डोमेन में औसत हैं:
- xi = खिंचाव(Pi(1)),
- P(1) = स्क्वैश(Σi wi xi),
जहां P(1) संभावना है कि अगला बिट 1, P होगाi(1) i -वें मॉडल द्वारा अनुमानित संभावना है, और
- खिंचाव(x) = ln(x / (1 − x)),
- स्क्वैश(x) = 1 / (1 + e−x) (खिंचाव का व्युत्क्रम)।
प्रत्येक पूर्वानुमान के पश्चात् , कोडिंग कास्ट को कम करने के लिए वजन को समायोजित करके मॉडल को अपडेट किया जाता है:
- wi ← wi + η xi (y − P(1)),
जहां η सीखने की दर है (आमतौर पर 0.002 से 0.01), y अनुमानित बिट है, और (y − P(1)) पूर्वानुमान त्रुटि है। वेट अपडेट एल्गोरिदम पश्चप्रचार से अलग है जिसमें P(1)P(0) शब्द हटा दिए जाते हैं। ऐसा इसलिए है क्योंकि तंत्रिका नेटवर्क का लक्ष्य कोडिंग कास्ट को कम करना है, न कि मूल माध्य वर्ग त्रुटि।
पीएक्यू के अधिकांश वर्जन तंत्रिका नेटवर्क के लिए वजन के सेट के बीच चयन करने के लिए छोटे संदर्भ का उपयोग करते हैं। कुछ वर्जन एकाधिक नेटवर्क का उपयोग करते हैं जिनके आउटपुट एसएसई चरणों से पहले और नेटवर्क के साथ संयुक्त होते हैं। इसके अलावा, प्रत्येक इनपुट पूर्वानुमान के लिए अनेक इनपुट हो सकते हैं जो पी के गैर-रेखीय कार्य हैंi(1) खिंचाव के अतिरिक्त (पी(1))।
संदर्भ मॉडलिंग
प्रत्येक मॉडल एस के ज्ञात बिट्स को संदर्भों के सेट में विभाजित करता है और प्रत्येक संदर्भ को 8-बिट स्थिति द्वारा दर्शाए गए बिट इतिहास में मैप करता है। पी.ए.क्यू.6 के माध्यम से वर्जनो में, राज्य काउंटरों की जोड़ी का प्रतिनिधित्व करता है (एन0, एन1). पी.ए.क्यू.7 और पश्चात् के वर्जनो में कुछ शर्तों के तहत, स्थिति अंतिम बिट या संपूर्ण अनुक्रम के मूल्य का भी प्रतिनिधित्व करती है। प्रत्येक मॉडल के लिए 256-प्रविष्टि तालिका का उपयोग करके राज्यों को संभावनाओं के आधार पर मैप किया जाता है। मॉडल द्वारा पूर्वानुमान के पश्चात् , पूर्वानुमान त्रुटि को कम करने के लिए तालिका प्रविष्टि को थोड़ा (आमतौर पर 0.4%) समायोजित किया जाता है।
सभी पी.ए.क्यू.8 वर्जनो में, प्रतिनिधित्व योग्य स्थितियाँ इस प्रकार हैं:
- 4 बिट तक के लिए स्पष्ट बिट अनुक्रम।
- 5 से 15 बिट्स के अनुक्रमों के लिए गिनती की जोड़ी और नवीनतम बिट का संकेतक।
- 16 से 41 बिट्स के अनुक्रमों के लिए गिनती की जोड़ी।
राज्यों की संख्या 256 तक रखने के लिए, प्रतिनिधित्व योग्य गणनाओं पर निम्नलिखित सीमाएँ रखी गई हैं: (41, 0), (40, 1), (12, 2), (5, 3), (4, 4), ( 3, 5), (2, 12), (1, 40), (0, 41)। यदि कोई गिनती इस सीमा से अधिक हो जाती है, तो अगला राज्य n के समान अनुपात के लिए चुना जाता है0 से एन1. इस प्रकार, यदि वर्तमान स्थिति (n0 = 4, एन1 = 4, अंतिम बिट = 0) और 1 देखा जाता है, तो नई स्थिति (एन) नहीं है0 = 4, एन1 = 5, अंतिम बिट = 1). बल्कि, यह (एन0 = 3, एन1 = 4, अंतिम बिट = 1).
अधिकांश संदर्भ मॉडल हैश तालिकाओं के रूप में कार्यान्वित किए जाते हैं। कुछ छोटे संदर्भों को प्रत्यक्ष लुकअप तालिकाओं के रूप में कार्यान्वित किया जाता है।
टेक्स्ट प्रीप्रोसेसिंग
पी.ए.क्यू. के कुछ संस्करण, विशेष रूप से PAsQDa, पी.ए.क्यू.AR (दोनों पी.ए.क्यू.6 डेरिवेटिव), और पी.ए.क्यू.8HP1 से पी.ए.क्यू.8HP8 (पी.ए.क्यू.8 डेरिवेटिव और हटर पुरस्कार प्राप्तकर्ता) बाहरी शब्दकोश में शब्दों को देखकर और उन्हें 1- से 3-बाइट कोड के साथ बदलकर टेक्स्ट फ़ाइलों को प्रीप्रोसेस करते हैं। . इसके अलावा, अपरकेस अक्षरों को विशेष वर्ण के साथ एन्कोड किया जाता है जिसके पश्चात् लोअरकेस अक्षर आते हैं। पी.ए.क्यू.8HP श्रृंखला में, शब्दकोश को वाक्यात्मक और शब्दार्थ संबंधी शब्दों को साथ समूहित करके व्यवस्थित किया जाता है। यह मॉडलों को संदर्भ के रूप में शब्दकोश कोड के सबसे महत्वपूर्ण बिट्स का उपयोग करने की अनुमति देता है।
तुलना
निम्नलिखित तालिका मैट महोनी द्वारा बड़े टेक्स्ट कंप्रेशन बेंचमार्क से नमूना है जिसमें 10 वाली फ़ाइल सम्मिलित हैअंग्रेजी विकिपीडिया टेक्स्ट के 9 बाइट्स (1 गीगाबाइट, या 0.931 GiB)।
कार्यक्रम | कंप्रेस आकार (बाइट्स) | मूल आकार का % | कंप्रेशन समय ( एनएस / बी ) | मेमोरी (एमआईबी) |
---|---|---|---|---|
पीएक्यू8एचपी8 | 133,423,109 | 13.34 | 64 639 | 1849 |
पी.पी.एम.डी | 183,976,014 | 18.4 | 880 | 256 |
बीजेआईपी 2 | 254,007,875 | 25.4 | 379 | 8 |
इन्फोज़िप | 322,649,703 | 32.26 | 104 | 0.1 |
फ़ाइल कंप्रेशन बेंचमार्क की सूची के लिए लॉसलेस कंप्रेशन #बेंचमार्क देखें।
इतिहास
निम्नलिखित पी.ए.क्यू. एल्गोरिथम के प्रमुख संवर्द्धनों को सूचीबद्ध करता है। इसके अलावा, बड़ी संख्या में वृद्धिशील सुधार हुए हैं, जिन्हें छोड़ दिया गया है।
- पी.ए.क्यू.1 को 6 जनवरी 2002 को मैट महोनी द्वारा जारी किया गया था। इसमें निश्चित वजन का उपयोग किया गया था और इसमें एनालॉग या विरल मॉडल सम्मिलित नहीं था।
- पी.ए.क्यू.1SSE/पी.ए.क्यू.2 को 11 मई 2003 को सर्ज ओस्नाच द्वारा जारी किया गया था। इसने भविष्यवक्ता और एनकोडर के बीच माध्यमिक प्रतीक अनुमान (एसएसई) चरण जोड़कर कंप्रेशन में उल्लेखनीय सुधार किया। एसएसई संक्षिप्त संदर्भ और वर्तमान पूर्वानुमान इनपुट करता है और तालिका से नई पूर्वानुमान आउटपुट करता है। फिर वास्तविक बिट मान को प्रतिबिंबित करने के लिए तालिका प्रविष्टि को समायोजित किया जाता है।
- 9 अक्टूबर 2003 को जारी पी.ए.क्यू.3N ने विरल मॉडल जोड़ा।
- मैट महोनी द्वारा 15 नवंबर 2003 को जारी पी.ए.क्यू.4 में अनुकूली भार का उपयोग किया गया। पी.ए.क्यू.5 (दिसंबर 18, 2003) और पी.ए.क्यू.6 (दिसंबर 30, 2003) नए एनालॉग मॉडल सहित मामूली सुधार थे। इस बिंदु पर, पीएक्यू सर्वश्रेष्ठ पीपीएम कम्प्रेसर के साथ प्रतिस्पर्धी था और उसने डेटा कंप्रेशन समुदाय का ध्यान आकर्षित किया, जिसके परिणामस्वरूप अप्रैल 2004 तक बड़ी संख्या में वृद्धिशील सुधार हुए। बर्टो डेस्टासियो ने मॉडलों को ट्यून किया और बिट काउंट डिस्काउंटिंग शेड्यूल को समायोजित किया। जोहान डी बॉक ने यूजर इंटरफ़ेस में सुधार किया। डेविड ए. स्कॉट ने अंकगणित कोडर में सुधार किया। फैबियो बफोनी ने गति में सुधार किया।
- 20 मई 2004 से 27 जुलाई 2004 की अवधि के दौरान, अलेक्जेंडर रतुश्न्याक ने पी.ए.क्यू.AR के सात वर्जन जारी किए, जिसमें अनेक नए मॉडल, संदर्भ द्वारा चयनित वजन के साथ अनेक मिक्सर, प्रत्येक मिक्सर आउटपुट में एसएसई चरण जोड़कर महत्वपूर्ण कंप्रेशन सुधार किए गए। और इंटेल निष्पादन योग्य फ़ाइलों के कंप्रेशन को बेहतर बनाने के लिए प्रीप्रोसेसर जोड़ना। पी.ए.क्यू.AR 2004 के अंत तक शीर्ष रैंक वाले कंप्रेसर के रूप में खड़ा था, किन्तु पिछले पी.ए.क्यू. वर्जनो की तुलना में काफी धीमा था।
- 18 जनवरी 2005 से 7 फरवरी 2005 की अवधि के दौरान, प्रेज़ेमिस्लाव स्किबिंस्की ने अंग्रेजी शब्दकोश प्रीप्रोसेसर के साथ पी.ए.क्यू.6 और पी.ए.क्यू.AR पर आधारित PASqDa के चार वर्जन जारी किए। इसने कैलगरी कॉर्पस पर शीर्ष रैंकिंग हासिल की किन्तु अधिकांश अन्य बेंचमार्क पर नहीं।
- पी.ए.क्यू.6 के संशोधित वर्जन ने 10 जनवरी 2004 को मैट महोनी द्वारा कैलगरी चैलेंज जीता। अलेक्जेंडर रतुश्न्याक द्वारा पी.ए.क्यू.AR के दस पश्चात् के वर्जनो द्वारा इसे बेहतर बनाया गया। सबसे हालिया 5 जून 2006 को प्रस्तुत किया गया था, जिसमें कुल 589,862 बाइट्स का कंप्रेस डेटा और प्रोग्राम स्रोत कोड सम्मिलित था।
- पी.ए.क्यू.7 को दिसंबर 2005 में मैट महोनी द्वारा रिलीज़ किया गया था। पी.ए.क्यू.7, पी.ए.क्यू.6 और वेरिएंट (पी.ए.क्यू.AR, PAsQDa) का पूर्ण पुनर्लेखन है। कंप्रेशन अनुपात पी.ए.क्यू.AR के समान था किन्तु 3 गुना तेज़ था। हालाँकि इसमें x86 और शब्दकोश का अभाव था, इसलिए यह विंडोज़ निष्पादनयोग्य और अंग्रेजी टेक्स्ट फ़ाइलों के साथ-साथ PAsQDa को कंप्रेस नहीं करता था। इसमें रंगीन बीएमपी, टीआईएफएफ और जेपीईजी फाइलों के मॉडल सम्मिलित हैं, इसलिए ये फाइलें बेहतर विधियों से कंप्रेस होती हैं। पी.ए.क्यू.6 से प्राथमिक अंतर यह है कि यह ग्रेडिएंट डिसेंट मिक्सर के अतिरिक्त मॉडलों को संयोजित करने के लिए तंत्रिका नेटवर्क का उपयोग करता है। अन्य विशेषता प्रोग्राम फ़ाइल ेल-, वर्ड- और पीडीएफ-फ़ाइलों में एम्बेडेड जेपीईजी और बिटमैप छवियों को कंप्रेस करने की पी.ए.क्यू.7 की क्षमता है।
- पी.ए.क्यू.8A को 27 जनवरी 2006 को, पी.ए.क्यू.8C को 13 फरवरी 2006 को जारी किया गया था। ये प्रत्याशित पी.ए.क्यू.8 के प्रायोगिक प्री-रिलीज़ थे। इसने पी.ए.क्यू.7 (कुछ मामलों में खराब कंप्रेशन ) में अनेक समस्याओं को ठीक किया। पी.ए.क्यू.8A में (x86) निष्पादनयोग्यों को कंप्रेस करने के लिए मॉडल भी सम्मिलित है।
- पी.ए.क्यू.8F को 28 फरवरी, 2006 को जारी किया गया था। पी.ए.क्यू.8F में पी.ए.क्यू.8A की तुलना में 3 सुधार थे: अधिक मेमोरी कुशल संदर्भ मॉडल, कंप्रेशन में सुधार के लिए नया अप्रत्यक्ष संदर्भ मॉडल, और विंडोज़ में ड्रैग और ड्रॉप का समर्थन करने के लिए नया उपयोगकर्ता इंटरफ़ेस। यह पी.ए.क्यू.8B/C/D/E वेरिएंट की तरह अंग्रेजी शब्दकोश का उपयोग नहीं करता है।
- पी.ए.क्यू.8G को प्रेज़ेमिस्लाव स्किबिंस्की द्वारा 3 मार्च 2006 को रिलीज़ किया गया था। पी.ए.क्यू.8G पी.ए.क्यू.8F है जिसमें शब्दकोश जोड़े गए हैं और पुन: डिज़ाइन किए गए टेक्स्टफ़िल्टर के रूप में कुछ अन्य सुधार किए गए हैं (जो गैर-पाठ्य फ़ाइलों पर कंप्रेशन प्रदर्शन को कम नहीं करता है)
- पी.ए.क्यू.8H को 22 मार्च 2006 को अलेक्जेंडर रतुश्न्याक द्वारा जारी किया गया और 24 मार्च 2006 को अद्यतन किया गया। पी.ए.क्यू.8H हैमॉडल में कुछ सुधारों के साथ पी.ए.क्यू.8G पर आधारित।
- पी.ए.क्यू.8I को 18 अगस्त 2006 को पावेल एल. होलोबोरोडको द्वारा 24 अगस्त, 4 सितंबर और 13 सितंबर को बग फिक्स के साथ जारी किया गया था। इसमें पोर्टेबल बिटमैप#पीजीएम उदाहरण फ़ाइलों के लिए ग्रेस्केल छवि मॉडल जोड़ा गया था।
- पी.ए.क्यू.8J को बिल पेटिस द्वारा 13 नवंबर 2006 को रिलीज़ किया गया था। यह पी.ए.क्यू.8HP5 से लिए गए कुछ टेक्स्ट मॉडल सुधारों के साथ पी.ए.क्यू.8F पर आधारित था। इस प्रकार, इसमें पी.ए.क्यू.8G से टेक्स्ट शब्दकोश या पी.ए.क्यू.8I से PGM मॉडल सम्मिलित नहीं थे।
- सर्ज ओस्नाच ने मॉडलिंग सुधारों की श्रृंखला जारी की: 16 नवंबर 2006 को पी.ए.क्यू.8JA, 21 नवंबर को पी.ए.क्यू.8JB और 28 नवंबर को पी.ए.क्यू.8JC।
- पी.ए.क्यू.8JD को बिल पेटिस द्वारा 30 दिसंबर 2006 को रिलीज़ किया गया था। तब से इस वर्जन को अनेक प्रोसेसरों के लिए 32 बिट माइक्रोसॉफ़्ट विंडोज़ और 32 और 64 बिट लिनक्स में पोर्ट किया गया है।
- पी.ए.क्यू.8K को बिल पेटिस द्वारा 13 फरवरी 2007 को रिलीज़ किया गया था। इसमें बाइनरी फ़ाइलों के लिए अतिरिक्त मॉडल सम्मिलित हैं।
- पी.ए.क्यू.8L को मैट महोनी द्वारा 8 मार्च 2007 को रिलीज़ किया गया था। यह पी.ए.क्यू.8JD पर आधारित है और गतिशील मार्कोव कंप्रेशन मॉडल जोड़ता है।
- पी.ए.क्यू.8O को 24 अगस्त 2007 को एंड्रियास मॉर्फिस द्वारा जारी किया गया था। इसमें पी.ए.क्यू.8L की तुलना में बेहतर BMP फ़ाइल स्वरूप और JPEG मॉडल सम्मिलित हैं। वैकल्पिक रूप से SSE2 समर्थन और 64-बिट Linux के लिए संकलित किया जा सकता है। 64-बिट ओएस के अनुसार एल्गोरिदम में उल्लेखनीय प्रदर्शन लाभ हैं।
- पी.ए.क्यू.8P को एंड्रियास मॉर्फिस द्वारा 25 अगस्त 2008 को जारी किया गया था। इसमें बेहतर BMP मॉडल सम्मिलित है और WAV मॉडल जोड़ा गया है।
- पी.ए.क्यू.8PX को 25 अप्रैल 2009 को जन ओन्ड्रस द्वारा जारी किया गया था। इसमें बेहतर WAV कम्प्रेशन और EXE कम्प्रेशन जैसे विभिन्न सुधार सम्मिलित हैं।
- पी.ए.क्यू.8KX को 15 जुलाई 2009 को जन ओन्ड्रस द्वारा जारी किया गया था। यह पी.ए.क्यू.8K के साथ पी.ए.क्यू.8PX का संयोजन है।
- पी.ए.क्यू.8PF को लवपिंपल द्वारा 9 सितंबर 2009 को बिना सोर्स कोड (जिसके लिए GPL लाइसेंस की आवश्यकता होती है) के बिना जारी किया गया था। यह 7% खराब कंप्रेस करता है, किन्तु पी.ए.क्यू.8PX v66 (1 एमबी अंग्रेजी टेक्स्ट से मापा गया) की तुलना में 7 गुना तेज है।
- पी.ए.क्यू.9A को मैट महोनी द्वारा 31 दिसंबर 2007 को जारी किया गया था। नया प्रयोगात्मक संस्करण. इसमें विशिष्ट फ़ाइल प्रकारों के लिए मॉडल सम्मिलित नहीं हैं, इसमें LZP प्रीप्रोसेसर है और 2 जीबी से अधिक की फ़ाइलों का समर्थन करता है।
- Zपी.ए.क्यू. को 12 मार्च 2009 को मैट महोनी द्वारा जारी किया गया था। यह नए संग्रह प्रारूप का उपयोग करता है जिसे डिज़ाइन किया गया है जिससे वर्तमान Zपी.ए.क्यू. प्रोग्राम भविष्य के Zपी.ए.क्यू. वर्जनो द्वारा बनाए गए अभिलेखागार को डीकंप्रेस करने में सक्षम हो सके।[3] (ऊपर सूचीबद्ध विभिन्न पीएक्यू वेरिएंट इस तरह से आगे संगत नहीं हैं)। यह बाइटकोड प्रोग्राम में डीकंप्रेसन एल्गोरिदम को निर्दिष्ट करके इसे प्राप्त करता है जो प्रत्येक निर्मित संग्रह फ़ाइल में संग्रहीत होता है।[4]
हटर पुरस्कार
श्रृंखला पी.ए.क्यू.8HP1 से पी.ए.क्यू.8HP8 को हटर पुरस्कार प्रस्तुतिकरण के रूप में 21 अगस्त 2006 से 18 जनवरी 2007 तक अलेक्जेंडर रतुश्न्याक द्वारा जारी किया गया था। हटर पुरस्कार विकिपीडिया के स्रोत से प्राप्त 100 एमबी अंग्रेजी और एक्सएमएल डेटा सेट का उपयोग करके टेक्स्ट कंप्रेशन प्रतियोगिता है। पी.ए.क्यू.8HP श्रृंखला को पी.ए.क्यू.8H से फोर्क किया गया था। कार्यक्रमों में टेक्स्ट प्रीप्रोसेसिंग शब्दकोश और विशेष रूप से बेंचमार्क के अनुरूप मॉडल सम्मिलित हैं। सभी गैर-टेक्स्ट मॉडल हटा दिए गए. शब्दकोशों को वाक्य-विन्यास और शब्दार्थ से संबंधित शब्दों को समूहीकृत करने और सामान्य प्रत्यय द्वारा शब्दों को समूहीकृत करने के लिए व्यवस्थित किया गया था। पूर्व रणनीति कंप्रेशन में सुधार करती है क्योंकि संबंधित शब्द (जो समान संदर्भ में प्रकट होने की संभावना है) को उनके शब्दकोश कोड के उच्च क्रम बिट्स पर मॉडल किया जा सकता है। पश्चात् वाली रणनीति शब्दकोश को कंप्रेस करना आसान बनाती है। डीकंप्रेसन प्रोग्राम और कंप्रेस शब्दकोश का आकार प्रतियोगिता रैंकिंग में सम्मिलित है।
27 अक्टूबर 2006 को इसकी घोषणा की गई[5] कि पी.ए.क्यू.8HP5 ने यूरो|€3,416 का हटर पुरस्कार जीता।
30 जून 2007 को, रतुश्न्याक के पी.ए.क्यू.8HP12 को €1732 के दूसरे हटर पुरस्कार से सम्मानित किया गया,[6] अपने पिछले रिकॉर्ड में 3.46% का सुधार हुआ।
पी.ए.क्यू. व्युत्पत्तियाँ
मुफ़्त सॉफ़्टवेयर होने के कारण, पी.ए.क्यू. को किसी भी व्यक्ति द्वारा संशोधित और पुनर्वितरित किया जा सकता है जिसके पास इसकी प्रतिलिपि है। इसने अन्य लेखकों को पीएक्यू कम्प्रेशन इंजन को फोर्क (सॉफ्टवेयर विकास) करने और ग्राफिकल यूज़र इंटरफ़ेस या बेहतर गति (कंप्रेशन अनुपात की मूल्य पर) जैसी नई सुविधाएं जोड़ने की अनुमति दी है। उल्लेखनीय पी.ए.क्यू. डेरिवेटिव में सम्मिलित हैं:
- WinUDA 0.291, पी.ए.क्यू.6 पर आधारित किन्तु तेज़[7]
- UDA 0.301, पी.ए.क्यू.8I एल्गोरिथम पर आधारित[7]* KGB पुरालेखपाल, पी.ए.क्यू.6 पर आधारित[8] (बीटा वर्जन पी.ए.क्यू.7 पर आधारित है)।
- एमिलकॉन्ट पी.ए.क्यू.6 पर आधारित है[9]
- पीज़िप जीयूआई फ्रंटएंड (विंडोज और लिनक्स के लिए) Lपी.ए.क्यू. के लिए,[10] Zपी.ए.क्यू. और विभिन्न पी.ए.क्यू.8* एल्गोरिदम[11]
- PWCM (पी.ए.क्यू. वेटेड कॉन्टेक्स्ट मिक्सिंग) WinRK में प्रयुक्त पी.ए.क्यू. एल्गोरिदम का स्वतंत्र रूप से विकसित बंद स्रोत कार्यान्वयन है।[12]
- पी.ए.क्यू.Compress अनेक नए पी.ए.क्यू. वर्जनो के लिए ग्राफिकल यूजर इंटरफेस है, जिसमें पी.ए.क्यू.8PX, पी.ए.क्यू.8PXD और पी.ए.क्यू.8PXV के नवीनतम रिलीज सम्मिलित हैं। जब भी कोई नया वर्जन जारी होता है तो इसे अपडेट किया जाता है। सॉफ़्टवेयर समझदारी से फ़ाइल नाम में एक्सटेंशन जोड़ता है जिसका उपयोग वह सही पी.ए.क्यू. वर्जन का उपयोग करके फ़ाइल को डीकंप्रेस करने के लिए कर सकता है। सॉफ्टवेयर खुला स्रोत है.[13]
- परफेक्ट कंप्रेस[14]एक कंप्रेशन सॉफ्टवेयर है जिसमें यूसीए (अल्ट्रा कंप्रेस्ड आर्काइव) की सुविधा है। कंप्रेशन प्रारूप जिसमें पी.ए.क्यू.8PX v42 से v65 सम्मिलित है और जो अब डिफ़ॉल्ट UCA कंप्रेसर के रूप में पी.ए.क्यू.8PF, पी.ए.क्यू.8KX, या पी.ए.क्यू.8PXPRE का उपयोग कर सकता है। इसके अलावा, परफेक्टकंप्रेस फ़ाइलों को पी.ए.क्यू.8PX v42 से v67, और Zपी.ए.क्यू. में कंप्रेस कर सकता है, और वर्जन 6.0 के अनुसार, फ़ाइलों को Lपी.ए.क्यू. और पी.ए.क्यू.8PF बीटा 1 से बीटा 3 में कंप्रेस कर सकता है। परफेक्टकंप्रेस v6.10 ने वर्तमान ही में जारी पी.ए.क्यू.8PXPRE के लिए समर्थन कंप्रेशन पेश किया है। परफेक्टकंप्रेस 6.12 पी.ए.क्यू.8KX श्रृंखला के लिए समर्थन प्रस्तुत करता है।[15]
- फ्रंटपीएक्यू, पीएक्यू के लिए छोटा गुई। नवीनतम वर्जन फ्रंटपी.ए.क्यू. v8 है जो पी.ए.क्यू.8PX, पी.ए.क्यू.8PF और FP8 को सपोर्ट करता है। सॉफ़्टवेयर अब अपडेट नहीं किया गया है और उपयोगकर्ताओं को पी.ए.क्यू.Compress का उपयोग करने के लिए प्रोत्साहित किया जाता है, जो नवीनतम पी.ए.क्यू. रिलीज़ को लागू करता है।[16]
यह भी देखें
- संग्रह प्रारूपों की सूची
- फ़ाइल संग्रहकर्ताओं की तुलना
संदर्भ
- ↑ "The Compression/SHA-1 Challenge". Mailcom.com. Retrieved 2010-05-19.
- ↑ "Homepage of the PAQ compressors". Retrieved 2007-07-10.
You may download, use, copy, modify, and distribute these programs under the terms of the GNU general public license
- ↑ "Ubuntu Manpage: zpaq - PAQ open standard maximum compressor". manpages.ubuntu.com.
- ↑ "ZPAQ स्तर 1 विशिष्टता" (PDF). Retrieved 2010-09-03.
- ↑ James Bowery. Alexander Ratushnyak Wins First Hutter Prize Payout. Published October 27, 2006. Retrieved October 30, 2006.[dead link]
- ↑ http://prize.hutter1.net/award2.gif[bare URL image file]
- ↑ 7.0 7.1 dwing's homepage Archived February 24, 2007, at the Wayback Machine
- ↑ "केजीबी आर्काइवर होमपेज". Kgbarchiver.net. Archived from the original on 2009-01-05. Retrieved 2010-05-19.
- ↑ "एमिलकॉन्ट अल्ट्राकम्प्रेशन". Freewebs.com. Archived from the original on 2010-09-10. Retrieved 2010-05-19.
- ↑ Matt Mahoney (2007). "LPAQ". Retrieved 2013-12-29.
- ↑ "पीज़िप". पीज़िप. Retrieved 2013-10-06.
- ↑ "एकल फ़ाइल डेटा संपीड़न बेंचमार्क, संपीड़न अनुपात पर क्रमबद्ध". Maximumcompression.com. 2007-04-14. Archived from the original on 2009-04-17. Retrieved 2010-05-19.
- ↑ "पीएक्यूकंप्रेस". Moisés Cardona (in English). 2019-01-10. Retrieved 2019-03-05.
- ↑ "परफेक्टकंप्रेस आधिकारिक वेबसाइट". Moises-studios.110mb.com. 2010-04-03. Retrieved 2010-05-19.
- ↑ "परफेक्टकंप्रेस आधिकारिक फेसबुक पेज". Facebook.com. Retrieved 2010-05-19.
- ↑ "FrontPAQ - GUI frontend for PAQ8PF and PAQ8PX". encode.su. Retrieved 2019-07-26.
अग्रिम पठन
- David Salomon, Giovanni Motta, (with contributions by David Bryant), Handbook of Data Compression, 5th edition, Springer, 2009, ISBN 1-84882-902-7, 5.15 पी.ए.क्यू., pp. 314–319
- Byron Knoll, Nando de Freitas, A Machine Learning Perspective on Predictive Coding with पी.ए.क्यू., University of British Columbia, Vancouver, Canada, August 17, 2011
बाहरी संबंध
- Official website
- Compiled linux binaries - Linux command-line executables download.