पी.ए.क्यू.: Difference between revisions
No edit summary |
No edit summary |
||
Line 38: | Line 38: | ||
एक बिट को अंकगणितीय रूप से उसकी संभाव्यता के आनुपातिक स्थान के साथ कोडित किया जाता है, या तो P(1) या P(0) = 1 - P(1)। संभावनाओं की गणना 0 और 1 की गणना के भारित योग द्वारा की जाती है: | एक बिट को अंकगणितीय रूप से उसकी संभाव्यता के आनुपातिक स्थान के साथ कोडित किया जाता है, या तो P(1) या P(0) = 1 - P(1)। संभावनाओं की गणना 0 और 1 की गणना के भारित योग द्वारा की जाती है: | ||
*''S''<sub>0</sub> = Σ<sub>''i''</sub> ''w<sub>i</sub>'' ''n''<sub>0''i''</sub>, | |||
*''S''<sub>1</sub> = Σ<sub>''i''</sub> ''w<sub>i</sub>'' ''n''<sub>1''i''</sub>, | |||
*''S'' = ''S''<sub>0</sub> + ''S''<sub>1</sub>, | |||
*P(0) = ''S''<sub>0</sub> / ''S'', | |||
*P(1) = ''S''<sub>1</sub> / ''S'', | |||
जहां ''w<sub>i</sub>'' ''i''-वें मॉडल का भार है। पी.ए.क्यू.3 के माध्यम से, भार तय किया गया और तदर्थ विधियों से सेट किया गया। (ऑर्डर-''n'' संदर्भों का भार n2 था।) पी.ए.क्यू.4 से प्रारंभ करते हुए, भार को उस दिशा में अनुकूल रूप से समायोजित किया गया था जो समान संदर्भ सेट में भविष्य की त्रुटियों को कम करेगा। यदि कोड किया जाने वाला बिट y है, तो भार समायोजन है: | जहां ''w<sub>i</sub>'' ''i''-वें मॉडल का भार है। पी.ए.क्यू.3 के माध्यम से, भार तय किया गया और तदर्थ विधियों से सेट किया गया। (ऑर्डर-''n'' संदर्भों का भार n2 था।) पी.ए.क्यू.4 से प्रारंभ करते हुए, भार को उस दिशा में अनुकूल रूप से समायोजित किया गया था जो समान संदर्भ सेट में भविष्य की त्रुटियों को कम करेगा। यदि कोड किया जाने वाला बिट y है, तो भार समायोजन है: | ||
*''n<sub>i</sub>'' = ''n''<sub>0''i''</sub> + ''n''<sub>1''i''</sub>, | *''n<sub>i</sub>'' = ''n''<sub>0''i''</sub> + ''n''<sub>1''i''</sub>, | ||
Line 60: | Line 60: | ||
प्रत्येक पूर्वानुमान के पश्चात् , कोडिंग कास्ट को कम करने के लिए भार को समायोजित करके मॉडल को अपडेट किया जाता है: | प्रत्येक पूर्वानुमान के पश्चात् , कोडिंग कास्ट को कम करने के लिए भार को समायोजित करके मॉडल को अपडेट किया जाता है: | ||
*''w<sub>i</sub>'' ← ''w<sub>i</sub>'' + η ''x<sub>i</sub>'' (''y'' − P(1)), | |||
जहां η सीखने की दर है (समान्य रूप से 0.002 से 0.01), y अनुमानित बिट है, और (y − P(1)) पूर्वानुमान त्रुटि है। वेट अपडेट एल्गोरिदम बैकप्रॉपैगेशन से अलग है जिसमें P(1)P(0) शब्द हटा दिए जाते हैं। ऐसा इसलिए है क्योंकि न्यूरल नेटवर्क का लक्ष्य कोडिंग कास्ट को कम करना है, न कि मूल माध्य वर्ग त्रुटि है। | जहां η सीखने की दर है (समान्य रूप से 0.002 से 0.01), y अनुमानित बिट है, और (y − P(1)) पूर्वानुमान त्रुटि है। वेट अपडेट एल्गोरिदम बैकप्रॉपैगेशन से अलग है जिसमें P(1)P(0) शब्द हटा दिए जाते हैं। ऐसा इसलिए है क्योंकि न्यूरल नेटवर्क का लक्ष्य कोडिंग कास्ट को कम करना है, न कि मूल माध्य वर्ग त्रुटि है। | ||
Revision as of 12:50, 13 December 2023
पी.ए.क्यू. लॉसलेस डेटा कंप्रेशन अभिलेखों की श्रृंखला है जो सहयोगात्मक विकास के माध्यम से कंप्रेशन अनुपात को मापने वाले अनेक बेंचमार्क पर शीर्ष रैंकिंग तक पहुंच गई है (चूँकि गति और मेमोरी उपयोग की मूल्य पर)। पीएक्यू के विशिष्ट वर्जनो ने हटर पुरस्कार और कैलगरी चुनौती जीता है।[1] पीएक्यू जीएनयू जनरल पब्लिक लाइसेंस के अनुसार वितरित मुफ्त सॉफ्टवेयर है।[2]
एल्गोरिदम
पी.ए.क्यू. संदर्भ मिश्रण एल्गोरिथ्म का उपयोग करता है। संदर्भ मिश्रण आंशिक मिलान (पीपीएम) द्वारा पूर्वानुमान से संबंधित है जिसमें कंप्रेसर को भविष्यवक्ता और अंकगणितीय कोडर में विभाजित किया गया है, किन्तु इसमें भिन्नता है कि अगले-प्रतीक पूर्वानुमान की गणना बड़ी संख्या में मॉडल से संभाव्यता अनुमानों के भारित संयोजन का उपयोग करके की जाती है। विभिन्न सन्दर्भों पर आधारित पीपीएम के विपरीत, किसी संदर्भ को सन्निहित होने की आवश्यकता नहीं है। अधिकांश पी.ए.क्यू. वर्जन निम्नलिखित संदर्भों के लिए अगले-प्रतीक आँकड़े एकत्र करते हैं:
- n -ग्राम ; संदर्भअनुमानित प्रतीक से पहले अंतिम n बाइट्स है (जैसा कि पीपीएम में है);
- संपूर्ण-शब्द n-ग्राम, केस और गैर-वर्णमाला वर्णों को अनदेखा करना (टेक्स्ट फ़ाइलों में उपयोगी);
- विरल संदर्भ, उदाहरण के लिए, अनुमानित प्रतीक से पहले के दूसरे और चौथे बाइट्स (कुछ बाइनरी प्रारूपों में उपयोगी);
- एनालॉग संदर्भ, जिसमें पिछले 8- या 16-बिट शब्दों के उच्च-क्रम बिट्स सम्मिलित हैं (मल्टीमीडिया फ़ाइलों के लिए उपयोगी);
- द्वि-आयामी संदर्भ (छवियों, तालिकाओं और स्प्रेडशीट के लिए उपयोगी); पंक्ति की लंबाई दोहराए जाने वाले बाइट पैटर्न की स्ट्राइड लंबाई ज्ञात करके निर्धारित की जाती है;
- विशेष मॉडल, जैसे x86 निष्पादन योग्य, विंडोज़ बिटमैप , टीआईएफएफ, या जेपीईजी छवियां; ये मॉडल केवल तभी सक्रिय होते हैं जब विशेष फ़ाइल प्रकार का पता लगाया जाता है।
सभी पी.ए.क्यू. वर्जन समय में बिट की पूर्वानुमान करते हैं और कंप्रेस करते हैं, किन्तु मॉडल के विवरण और पूर्वानुमानो को संयुक्त और पोस्टप्रोसेस करने के विधियों में भिन्नता होती है। एक बार जब अगली-बिट संभावना निर्धारित हो जाती है, तो इसे अंकगणितीय कोडिंग द्वारा एन्कोड किया जाता है। वर्जन के आधार पर पूर्वानुमानो के संयोजन की तीन विधियाँ हैं:
- पी.ए.क्यू.1 से पी.ए.क्यू.3 तक, प्रत्येक पूर्वानुमान को बिट गणना की एक जोड़ी के रूप में दर्शाया जाता है। इन गणनाओं को भारित योग द्वारा संयोजित किया जाता है, जिसमें लंबे संदर्भों को अधिक महत्व दिया जाता है।
- पी.ए.क्यू.4 से पी.ए.क्यू.6 में, पूर्वानुमानों को पहले की तरह संयोजित किया जाता है, किन्तु प्रत्येक मॉडल को दिए गए भार को अधिक स्पष्ट मॉडल के पक्ष में समायोजित किया जाता है।
- पी.ए.क्यू.7 और पश्चात् में, प्रत्येक मॉडल गिनती की जोड़ी के अतिरिक्त संभावना को आउटपुट करता है। संभावनाओं को आर्टिफिशल न्यूरल नेटवर्क का उपयोग करके संयोजित किया जाता है।
पी.ए.क्यू.1एसएसई और पश्चात् के वर्जन द्वितीयक प्रतीक अनुमान (एसएसई) का उपयोग करके पूर्वानुमान को पोस्टप्रोसेस करते हैं। किसी तालिका में नई पूर्वानुमान देखने के लिए संयुक्त पूर्वानुमान और छोटे संदर्भ का उपयोग किया जाता है। बिट एन्कोड होने के पश्चात् , पूर्वानुमान त्रुटि को कम करने के लिए तालिका प्रविष्टि को समायोजित किया जाता है। एसएसई चरणों को विभिन्न संदर्भों के साथ पाइपलाइन किया जा सकता है या औसत आउटपुट के साथ समानांतर में गणना की जा सकती है।
अंकगणित कोडिंग
एक स्ट्रिंग s को सबसे छोटी बाइट स्ट्रिंग में कंप्रेस किया जाता है जो [0, 1] रेंज में बेस-256 बिग-एंडियन नंबर x का प्रतिनिधित्व करता है जैसे कि P(r < s) ≤ x < P(r ≤ s), जहां P(r < s) संभावना है कि एक रैंडम स्ट्रिंग r जिसकी लंबाई s के समान है, शब्दकोष की दृष्टि से s से कम होगी। ऐसा x खोजना सदैव संभव है कि x की लंबाई शैनन सीमा, −log2P(r = s) बिट्स से अधिक से अधिक एक बाइट अधिक हो। एस की लंबाई संग्रह शीर्षलेख में संग्रहीत है।
पी.ए.क्यू. में अंकगणित कोडिंग प्रत्येक पूर्वानुमान के लिए x पर निचली और ऊपरी सीमा को बनाए रखते हुए कार्यान्वित की जाती है, प्रारंभ में [0, 1]। प्रत्येक पूर्वानुमान के पश्चात् , वर्तमान सीमा को P(0) और P(1) के अनुपात में दो भागों में विभाजित किया जाता है, संभावना है कि s का अगला बिट क्रमशः 0 या 1 होगा, s के पिछले बिट्स को देखते हुए। फिर अगली बिट को नई श्रेणी के लिए संबंधित उपश्रेणी का चयन करके एन्कोड किया जाता है।
संख्या x को बिट पूर्वानुमानो की समान श्रृंखला बनाकर वापस स्ट्रिंग s में विघटित किया जाता है (चूंकि s के पिछले बिट्स ज्ञात हैं)। कंप्रेशन के साथ सीमा को विभाजित किया गया है। जो कि x वाला भाग नई श्रेणी बन जाता है, और संबंधित बिट को s से जोड़ दिया जाता है।
पी.ए.क्यू. में, सीमा की निचली और ऊपरी सीमा को 3 भागों में दर्शाया गया है। सबसे महत्वपूर्ण आधार-256 अंक समान हैं, इसलिए उन्हें x के अग्रणी बाइट्स के रूप में लिखा जा सकता है। अगले 4 बाइट्स को मेमोरी में रखा जाता है, जिससे प्रमुख बाइट अलग हो। अनुगामी बिट्स को निचली सीमा के लिए सभी शून्य और ऊपरी सीमा के लिए सभी शून्य माना जाता है। निचली सीमा से और बाइट लिखकर कंप्रेशन समाप्त किया जाता है।
अनुकूली मॉडल भार
पी.ए.क्यू.6 के माध्यम से पी.ए.क्यू. वर्जनो में, प्रत्येक मॉडल गिनती की एक जोड़ी, , शून्य बिट्स की गिनती, और , 1 बिट्स की गिनती के लिए अलग-अलग संदर्भों का एक सेट मैप करता है। वर्तमान के इतिहास का पक्ष लेने के लिए, विपरीत बिट देखे जाने पर 2 से अधिक की आधी गिनती को छोड़ दिया जाता है। उदाहरण के लिए, यदि किसी संदर्भ से जुड़ी वर्तमान स्थिति है और 1 देखा जाता है, तो गिनती (7, 4) में अपडेट की जाती है।
एक बिट को अंकगणितीय रूप से उसकी संभाव्यता के आनुपातिक स्थान के साथ कोडित किया जाता है, या तो P(1) या P(0) = 1 - P(1)। संभावनाओं की गणना 0 और 1 की गणना के भारित योग द्वारा की जाती है:
- S0 = Σi wi n0i,
- S1 = Σi wi n1i,
- S = S0 + S1,
- P(0) = S0 / S,
- P(1) = S1 / S,
जहां wi i-वें मॉडल का भार है। पी.ए.क्यू.3 के माध्यम से, भार तय किया गया और तदर्थ विधियों से सेट किया गया। (ऑर्डर-n संदर्भों का भार n2 था।) पी.ए.क्यू.4 से प्रारंभ करते हुए, भार को उस दिशा में अनुकूल रूप से समायोजित किया गया था जो समान संदर्भ सेट में भविष्य की त्रुटियों को कम करेगा। यदि कोड किया जाने वाला बिट y है, तो भार समायोजन है:
- ni = n0i + n1i,
- त्रुटि = y – P(1),
- wi ← wi + [(S n1i − S1 ni) / (S0 S1)] त्रुटि.
न्यूरल-नेटवर्क मिश्रण
पी.ए.क्यू.7 से प्रारंभ होकर, प्रत्येक मॉडल पूर्वानुमान आउटपुट करता है (गिनती की जोड़ी के अतिरिक्त )। ये पूर्वानुमान लॉजिस्टिक डोमेन में औसत हैं:
- xi = खिंचाव (Pi(1)),
- P(1) = स्क्वैश (Σi wi xi),
जहां P(1) संभावना है कि अगला बिट 1, P होगाi(1) i -वें मॉडल द्वारा अनुमानित संभावना है, और
- खिंचाव(x) = ln(x / (1 − x)),
- स्क्वैश(x) = 1 / (1 + e−x) (खिंचाव का व्युत्क्रम)।
प्रत्येक पूर्वानुमान के पश्चात् , कोडिंग कास्ट को कम करने के लिए भार को समायोजित करके मॉडल को अपडेट किया जाता है:
- wi ← wi + η xi (y − P(1)),
जहां η सीखने की दर है (समान्य रूप से 0.002 से 0.01), y अनुमानित बिट है, और (y − P(1)) पूर्वानुमान त्रुटि है। वेट अपडेट एल्गोरिदम बैकप्रॉपैगेशन से अलग है जिसमें P(1)P(0) शब्द हटा दिए जाते हैं। ऐसा इसलिए है क्योंकि न्यूरल नेटवर्क का लक्ष्य कोडिंग कास्ट को कम करना है, न कि मूल माध्य वर्ग त्रुटि है।
पीएक्यू के अधिकांश वर्जन न्यूरल नेटवर्क के लिए भार के सेट के बीच चयन करने के लिए एक छोटे संदर्भ का उपयोग करते हैं। कुछ वर्जन एकाधिक नेटवर्क का उपयोग करते हैं जिनके आउटपुट एसएसई चरणों से पहले एक और नेटवर्क के साथ संयुक्त होते हैं। इसके अतिरिक्त , प्रत्येक इनपुट पूर्वानुमान के लिए कई इनपुट हो सकते हैं जो स्ट्रेच Pi(1) के अतिरिक्त (P(1)) के गैर-रेखीय कार्य हैं।
संदर्भ मॉडलिंग
प्रत्येक मॉडल एस के ज्ञात बिट्स को संदर्भों के एक सेट में विभाजित करता है और प्रत्येक संदर्भ को 8-बिट स्थिति द्वारा दर्शाए गए बिट इतिहास में मैप करता है। पी.ए.क्यू.6 के माध्यम से वर्जनो में, स्टेट काउंटरों की एक जोड़ी (n0, n1) का प्रतिनिधित्व करता है। पी.ए.क्यू.7 और बाद के वर्जनो में कुछ नियमो के अनुसार , स्थिति अंतिम बिट या संपूर्ण अनुक्रम के मूल्य का भी प्रतिनिधित्व करती है। प्रत्येक मॉडल के लिए 256-प्रविष्टि तालिका का उपयोग करके स्टेट को संभावनाओं के आधार पर मैप किया जाता है। मॉडल द्वारा पूर्वानुमान के बाद, पूर्वानुमान त्रुटि को कम करने के लिए तालिका प्रविष्टि को थोड़ा (समान्य रूप से 0.4%) समायोजित किया जाता है।
सभी पी.ए.क्यू.8 वर्जनो में, प्रतिनिधित्व योग्य स्थितियाँ इस प्रकार हैं:
- 4 बिट तक के लिए स्पष्ट बिट अनुक्रम।
- 5 से 15 बिट्स के अनुक्रमों के लिए गिनती की जोड़ी और नवीनतम बिट का संकेतक।
- 16 से 41 बिट्स के अनुक्रमों के लिए गिनती की जोड़ी।
स्टेट की संख्या 256 तक रखने के लिए, प्रतिनिधित्व योग्य गणनाओं पर निम्नलिखित सीमाएँ रखी गई हैं: (41, 0), (40, 1), (12, 2), (5, 3), (4, 4), ( 3, 5), (2, 12), (1, 40), (0, 41)। यदि कोई गिनती इस सीमा से अधिक हो जाती है, तो अगला स्टेट n0 से n1 के समान अनुपात वाला चुना जाता है। इस प्रकार, यदि वर्तमान स्थिति (n0 = 4, n1 = 4, अंतिम बिट = 0) है और 1 देखा जाता है, तो नई स्थिति (n0 = 4, n1 = 5, अंतिम बिट = 1) नहीं है। चूँकि , यह (n0 = 3, n1 = 4, अंतिम बिट = 1) है।
अधिकांश संदर्भ मॉडल हैश तालिकाओं के रूप में कार्यान्वित किए जाते हैं। कुछ छोटे संदर्भों को प्रत्यक्ष लुकअप तालिकाओं के रूप में कार्यान्वित किया जाता है।
टेक्स्ट प्रीप्रोसेसिंग
पी.ए.क्यू. के कुछ वर्जन, विशेष रूप से पीए क्यूडीए, पी.ए.क्यू.एआर (दोनों पी.ए.क्यू.6 डेरिवेटिव), और पी.ए.क्यू.8एच.पी1 से पी.ए.क्यू.8एच.पी8 (पी.ए.क्यू.8 डेरिवेटिव और हटर पुरस्कार प्राप्तकर्ता) बाहरी शब्दकोश में शब्दों को देखकर और उन्हें 1- से 3-बाइट कोड के साथ बदलकर टेक्स्ट फ़ाइलों को प्रीप्रोसेस करते हैं। . इसके अतिरिक्त, अपरकेस अक्षरों को विशेष वर्ण के साथ एन्कोड किया जाता है जिसके पश्चात् लोअरकेस अक्षर आते हैं। पी.ए.क्यू.8एच.पी श्रृंखला में, शब्दकोश को वाक्यात्मक और शब्दार्थ संबंधी शब्दों को साथ समूहित करके व्यवस्थित किया जाता है। यह मॉडलों को संदर्भ के रूप में शब्दकोश कोड के सबसे महत्वपूर्ण बिट्स का उपयोग करने की अनुमति देता है।
तुलना
निम्नलिखित तालिका मैट महोनी द्वारा बड़े टेक्स्ट कंप्रेशन बेंचमार्क का एक नमूना है जिसमें अंग्रेजी विकिपीडिया टेक्स्ट के 109 बाइट्स (1 जीबी, या 0.931 जीबी) वाली फ़ाइल सम्मिलित है।
कार्यक्रम | कंप्रेस आकार (बाइट्स) | मूल आकार का % | कंप्रेशन समय ( एनएस / बी ) | मेमोरी (एमआईबी) |
---|---|---|---|---|
पीएक्यू8एचपी8 | 133,423,109 | 13.34 | 64 639 | 1849 |
पी.पी.एम.डी | 183,976,014 | 18.4 | 880 | 256 |
बीजेआईपी 2 | 254,007,875 | 25.4 | 379 | 8 |
इन्फोज़िप | 322,649,703 | 32.26 | 104 | 0.1 |
फ़ाइल कंप्रेशन बेंचमार्क की सूची के लिए लॉसलेस कंप्रेशन या बेंचमार्क देखें।
इतिहास
निम्नलिखित पी.ए.क्यू. एल्गोरिथम के प्रमुख संवर्द्धनों को सूचीबद्ध करता है। इसके अतिरिक्त, बड़ी संख्या में वृद्धिशील सुधार हुए हैं, जिन्हें छोड़ दिया गया है।
- पी.ए.क्यू.1 को 6 जनवरी 2002 को मैट महोनी द्वारा जारी किया गया था। इसमें निश्चित भार का उपयोग किया गया था और इसमें एनालॉग या विरल मॉडल सम्मिलित नहीं था।
- पी.ए.क्यू.1एसएसई/पी.ए.क्यू.2 को 11 मई 2003 को सर्ज ओस्नाच द्वारा जारी किया गया था। इसने भविष्यवक्ता और एनकोडर के बीच माध्यमिक प्रतीक अनुमान (एसएसई) चरण जोड़कर कंप्रेशन में उल्लेखनीय सुधार किया। एसएसई संक्षिप्त संदर्भ और वर्तमान पूर्वानुमान इनपुट करता है और तालिका से नई पूर्वानुमान आउटपुट करता है। फिर वास्तविक बिट मान को प्रतिबिंबित करने के लिए तालिका प्रविष्टि को समायोजित किया जाता है।
- 9 अक्टूबर 2003 को जारी पी.ए.क्यू.3एन ने विरल मॉडल जोड़ा।
- मैट महोनी द्वारा 15 नवंबर 2003 को जारी पी.ए.क्यू.4 में अनुकूली भार का उपयोग किया गया। पी.ए.क्यू.5 (दिसंबर 18, 2003) और पी.ए.क्यू.6 (दिसंबर 30, 2003) नए एनालॉग मॉडल सहित सामान्य सुधार थे। इस बिंदु पर, पीएक्यू सर्वश्रेष्ठ पीपीएम कम्प्रेसर के साथ प्रतिस्पर्धी था और उसने डेटा कंप्रेशन समुदाय का ध्यान आकर्षित किया, जिसके परिणामस्वरूप अप्रैल 2004 तक बड़ी संख्या में वृद्धिशील सुधार हुए। बर्टो डेस्टासियो ने मॉडलों को ट्यून किया और बिट काउंट डिस्काउंटिंग शेड्यूल को समायोजित किया। जोहान डी बॉक ने यूजर इंटरफ़ेस में सुधार किया। डेविड ए. स्कॉट ने अंकगणित कोडर में सुधार किया। फैबियो बफोनी ने गति में सुधार किया गया था।
- 20 मई 2004 से 27 जुलाई 2004 की अवधि के समय , अलेक्जेंडर रतुश्न्याक ने पी.ए.क्यू.एआर के सात वर्जन जारी किए गए थे, जिसमें अनेक नए मॉडल, संदर्भ द्वारा चयनित भार के साथ अनेक मिक्सर, प्रत्येक मिक्सर आउटपुट में एसएसई चरण जोड़कर महत्वपूर्ण कंप्रेशन सुधार किए गए। और इंटेल निष्पादन योग्य फ़ाइलों के कंप्रेशन को उत्तम बनाने के लिए प्रीप्रोसेसर जोड़ना। पी.ए.क्यू.एआर 2004 के अंत तक शीर्ष रैंक वाले कंप्रेसर के रूप में खड़ा था, किन्तु पिछले पी.ए.क्यू. वर्जनो की तुलना में अधिक धीमा था।
- 18 जनवरी 2005 से 7 फरवरी 2005 की अवधि के समय , प्रेज़ेमिस्लाव स्किबिंस्की ने अंग्रेजी शब्दकोश प्रीप्रोसेसर के साथ पी.ए.क्यू.6 और पी.ए.क्यू.एआर पर आधारित पीएएसक्यूडीए के चार वर्जन जारी किए। इसने कैलगरी कॉर्पस पर शीर्ष रैंकिंग प्राप्त की किन्तु अधिकांश अन्य बेंचमार्क पर नहीं कि थी।
- पी.ए.क्यू.6 के संशोधित वर्जन ने 10 जनवरी 2004 को मैट महोनी द्वारा कैलगरी चैलेंज जीता। अलेक्जेंडर रतुश्न्याक द्वारा पी.ए.क्यू.एआर के दस पश्चात् के वर्जनो द्वारा इसे उत्तम बनाया गया। सबसे आधुनिक 5 जून 2006 को प्रस्तुत किया गया था, जिसमें कुल 589,862 बाइट्स का कंप्रेस डेटा और प्रोग्राम स्रोत कोड सम्मिलित था।
- पी.ए.क्यू.7 को दिसंबर 2005 में मैट महोनी द्वारा रिलीज़ किया गया था। पी.ए.क्यू.7, पी.ए.क्यू.6 और वेरिएंट (पी.ए.क्यू.एआर , पी ए एस क्यूडीए) का पूर्ण पुनर्लेखन है। कंप्रेशन अनुपात पी.ए.क्यू.एआर के समान था किन्तु 3 गुना तेज़ था। चूँकि इसमें x86 और शब्दकोश का अभाव था, इसलिए यह विंडोज़ निष्पादनयोग्य और अंग्रेजी टेक्स्ट फ़ाइलों के साथ-साथ पी ए एस क्यूडीए को कंप्रेस नहीं करता था। इसमें रंगीन बीएमपी, टीआईएफएफ और जेपीईजी फाइलों के मॉडल सम्मिलित हैं, इसलिए ये फाइलें उत्तम विधियों से कंप्रेस होती हैं। पी.ए.क्यू.6 से प्राथमिक अंतर यह है कि यह ग्रेडिएंट डिसेंट मिक्सर के अतिरिक्त मॉडलों को संयोजित करने के लिए न्यूरल नेटवर्क का उपयोग करता है। अन्य विशेषता प्रोग्राम फ़ाइल-, वर्ड- और पीडीएफ-फ़ाइलों में एम्बेडेड जेपीईजी और बिटमैप छवियों को कंप्रेस करने की पी.ए.क्यू.7 की क्षमता है।
- पी.ए.क्यू.8A को 27 जनवरी 2006 को, पी.ए.क्यू.8सी को 13 फरवरी 2006 को जारी किया गया था। ये प्रत्याशित पी.ए.क्यू.8 के प्रायोगिक प्री-रिलीज़ थे। इसने पी.ए.क्यू.7 (कुछ स्थितियों में वोर्स कंप्रेशन ) में अनेक समस्याओं को ठीक किया। पी.ए.क्यू.8ए में (x86) निष्पादनयोग्यों को कंप्रेस करने के लिए मॉडल भी सम्मिलित है।
- पी.ए.क्यू.8एफ को 28 फरवरी, 2006 को जारी किया गया था। पी.ए.क्यू.8एफ में पी.ए.क्यू.8ए की तुलना में 3 सुधार थे: अधिक मेमोरी कुशल संदर्भ मॉडल, कंप्रेशन में सुधार के लिए नया अप्रत्यक्ष संदर्भ मॉडल, और विंडोज़ में ड्रैग और ड्रॉप का समर्थन करने के लिए नया उपयोगकर्ता इंटरफ़ेस। यह पी.ए.क्यू.8बी/सी/डी/ई वेरिएंट की तरह अंग्रेजी शब्दकोश का उपयोग नहीं करता है।
- पी.ए.क्यू.8जी को प्रेज़ेमिस्लाव स्किबिंस्की द्वारा 3 मार्च 2006 को रिलीज़ किया गया था। पी.ए.क्यू.8जी पी.ए.क्यू.8एफ है जिसमें शब्दकोश जोड़े गए हैं और पुन: डिज़ाइन किए गए टेक्स्टफ़िल्टर के रूप में कुछ अन्य सुधार किए गए हैं (जो गैर-टेक्स्ट फ़ाइलों पर कंप्रेशन प्रदर्शन को कम नहीं करता है)
- पी.ए.क्यू.8एच को 22 मार्च 2006 को अलेक्जेंडर रतुश्न्याक द्वारा जारी किया गया और 24 मार्च 2006 को अद्यतन किया गया। पी.ए.क्यू.8एच है मॉडल में कुछ सुधारों के साथ पी.ए.क्यू.8जी पर आधारित है।
- पी.ए.क्यू.8एल को 18 अगस्त 2006 को पावेल एल. होलोबोरोडको द्वारा 24 अगस्त, 4 सितंबर और 13 सितंबर को बग फिक्स के साथ जारी किया गया था। इसमें पोर्टेबल बिटमैप या पीजीएम उदाहरण फ़ाइलों के लिए ग्रेस्केल छवि मॉडल जोड़ा गया था।
- पी.ए.क्यू.8जे को बिल पेटिस द्वारा 13 नवंबर 2006 को रिलीज़ किया गया था। यह पी.ए.क्यू.8एच.पी5 से लिए गए कुछ टेक्स्ट मॉडल सुधारों के साथ पी.ए.क्यू.8एफ पर आधारित था। इस प्रकार, इसमें पी.ए.क्यू.8जी से टेक्स्ट शब्दकोश या पी.ए.क्यू.8आई से पीजीएम मॉडल सम्मिलित नहीं थे।
- सर्ज ओस्नाच ने मॉडलिंग सुधारों की श्रृंखला जारी की: 16 नवंबर 2006 को पी.ए.क्यू.8जे ए, 21 नवंबर को पी.ए.क्यू.8जेबी और 28 नवंबर को पी.ए.क्यू.8जे.सी.।
- पी.ए.क्यू.8जे.डी को बिल पेटिस द्वारा 30 दिसंबर 2006 को रिलीज़ किया गया था। तब से इस वर्जन को अनेक प्रोसेसरों के लिए 32 बिट माइक्रोसॉफ़्ट विंडोज़ और 32 और 64 बिट लिनक्स में पोर्ट किया गया है।
- पी.ए.क्यू.8के को बिल पेटिस द्वारा 13 फरवरी 2007 को रिलीज़ किया गया था। इसमें बाइनरी फ़ाइलों के लिए अतिरिक्त मॉडल सम्मिलित हैं।
- पी.ए.क्यू.8एल को मैट महोनी द्वारा 8 मार्च 2007 को रिलीज़ किया गया था। यह पी.ए.क्यू.8जे.डी पर आधारित है और गतिशील मार्कोव कंप्रेशन मॉडल जोड़ता है।
- पी.ए.क्यू.8ओ को 24 अगस्त 2007 को एंड्रियास मॉर्फिस द्वारा जारी किया गया था। इसमें पी.ए.क्यू.8एल की तुलना में उत्तम बीएमपी फ़ाइल स्वरूप और जेपीईजी मॉडल सम्मिलित हैं। वैकल्पिक रूप से एसएसई2 समर्थन और 64-बिट लिनक्स के लिए संकलित किया जा सकता है। 64-बिट ओएस के अनुसार एल्गोरिदम में उल्लेखनीय प्रदर्शन लाभ हैं।
- पी.ए.क्यू.8पी को एंड्रियास मॉर्फिस द्वारा 25 अगस्त 2008 को जारी किया गया था। इसमें उत्तम बीएमपी मॉडल सम्मिलित है और डब्ल्यूएवी मॉडल जोड़ा गया है।
- पी.ए.क्यू.8पीएक्स को 25 अप्रैल 2009 को जन ओन्ड्रस द्वारा जारी किया गया था। इसमें उत्तम डब्ल्यूएवी कम्प्रेशन और ईएक्सई कम्प्रेशन जैसे विभिन्न सुधार सम्मिलित हैं।
- पी.ए.क्यू.8केएक्स को 15 जुलाई 2009 को जन ओन्ड्रस द्वारा जारी किया गया था। यह पी.ए.क्यू.8के के साथ पी.ए.क्यू.8पीएक्स का संयोजन है।
- पी.ए.क्यू.8पीएफ को लवपिंपल द्वारा 9 सितंबर 2009 को बिना सोर्स कोड (जिसके लिए जीपीएल लाइसेंस की आवश्यकता होती है) के बिना जारी किया गया था। यह 7% वोर्स कंप्रेस करता है, किन्तु पी.ए.क्यू.8पीएक्स वी 66 (1 एमबी अंग्रेजी टेक्स्ट से मापा गया) की तुलना में 7 गुना तेज है।
- पी.ए.क्यू.9ए को मैट महोनी द्वारा 31 दिसंबर 2007 को जारी किया गया था। नया प्रयोगात्मक वर्जन. इसमें विशिष्ट फ़ाइल प्रकारों के लिए मॉडल सम्मिलित नहीं हैं, इसमें एलजेडपी प्रीप्रोसेसर है और 2 जीबी से अधिक की फ़ाइलों का समर्थन करता है।
- जेडपी.ए.क्यू. को 12 मार्च 2009 को मैट महोनी द्वारा जारी किया गया था। यह नए संग्रह प्रारूप का उपयोग करता है जिसे डिज़ाइन किया गया है जिससे वर्तमान जेडपी.ए.क्यू. प्रोग्राम भविष्य के जेडपी.ए.क्यू. वर्जनो द्वारा बनाए गए अभिलेखागार को डीकंप्रेस करने में सक्षम हो सके।[3] (ऊपर सूचीबद्ध विभिन्न पीएक्यू वेरिएंट इस तरह से आगे संगत नहीं हैं)। यह बाइटकोड प्रोग्राम में डीकंप्रेसन एल्गोरिदम को निर्दिष्ट करके इसे प्राप्त करता है जो प्रत्येक निर्मित संग्रह फ़ाइल में संग्रहीत होता है।[4]
हटर पुरस्कार
श्रृंखला पीएक्यू8एचपी1 से पीएक्यू8 एचपी8 को हटर पुरस्कार प्रस्तुतिकरण के रूप में 21 अगस्त 2006 से 18 जनवरी 2007 तक अलेक्जेंडर रतुश्न्याक द्वारा जारी किया गया था। हटर पुरस्कार विकिपीडिया के स्रोत से प्राप्त 100 एमबी अंग्रेजी और एक्सएमएल डेटा सेट का उपयोग करके एक टेक्स्ट कंप्रेशन प्रतियोगिता है। पीएक्यू8एचपी श्रृंखला को पीएक्यू8एच से फोर्क किया गया था। कार्यक्रमों में टेक्स्ट प्रीप्रोसेसिंग शब्दकोश और विशेष रूप से बेंचमार्क के अनुरूप मॉडल सम्मिलित हैं। सभी गैर-टेक्स्ट मॉडल हटा दिए गए. शब्दकोशों को वाक्य-विन्यास और शब्दार्थ से संबंधित शब्दों को समूहीकृत करने और सामान्य प्रत्यय द्वारा शब्दों को समूहीकृत करने के लिए व्यवस्थित किया गया था। पूर्व युक्ति कंप्रेशन में सुधार करती है क्योंकि संबंधित शब्द (जो समान संदर्भ में प्रकट होने की संभावना है) को उनके शब्दकोश कोड के उच्च क्रम बिट्स पर मॉडल किया जा सकता है। बाद वाली युक्ति शब्दकोश को कंप्रेशन करना सरल बनाती है। डीकंप्रेसन प्रोग्राम और संपीड़ित शब्दकोश का आकार प्रतियोगिता रैंकिंग में सम्मिलित है।
27 अक्टूबर 2006 को इसकी घोषणा की गई[5] कि पी.ए.क्यू.8एच.पी5 ने यूरो या €3,416 का हटर पुरस्कार जीता था।
30 जून 2007 को, रतुश्न्याक के पी.ए.क्यू.8एचपी12 को €1732 के दूसरे हटर पुरस्कार से सम्मानित किया गया,[6] अपने पिछले रिकॉर्ड में 3.46% का सुधार हुआ।
पी.ए.क्यू. व्युत्पत्तियाँ
मुफ़्त सॉफ़्टवेयर होने के कारण, पी.ए.क्यू. को किसी भी व्यक्ति द्वारा संशोधित और पुनर्वितरित किया जा सकता है जिसके पास इसकी प्रतिलिपि है। इसने अन्य लेखकों को पीएक्यू कम्प्रेशन इंजन को फोर्क (सॉफ्टवेयर विकास) करने और ग्राफिकल यूज़र इंटरफ़ेस या उत्तम गति (कंप्रेशन अनुपात की मूल्य पर) जैसी नई सुविधाएं जोड़ने की अनुमति दी है। उल्लेखनीय पी.ए.क्यू. डेरिवेटिव में सम्मिलित हैं:
- विनयूडीए 0.291, पी.ए.क्यू.6 पर आधारित किन्तु तेज़[7]
- यूडीए 0.301, पी.ए.क्यू.8I एल्गोरिथम पर आधारित[7]
- केजीबी पुरालेखपाल, पी.ए.क्यू.6 पर आधारित[8] (बीटा वर्जन पी.ए.क्यू.7 पर आधारित है)।
- एमिलकॉन्ट पी.ए.क्यू.6 पर आधारित है[9]
- पीज़िप जीयूआई फ्रंटएंड (विंडोज और लिनक्स के लिए) एलपीएक्यू. के लिए,[10] जेडपी.ए.क्यू. और विभिन्न पी.ए.क्यू.8* एल्गोरिदम[11]
- पीडब्ल्यूसीएम (पी.ए.क्यू. वेटेड कॉन्टेक्स्ट मिक्सिंग) विनआरके में प्रयुक्त पी.ए.क्यू. एल्गोरिदम का स्वतंत्र रूप से विकसित बंद स्रोत कार्यान्वयन है।[12]
- पी.ए.क्यू.कम्प्रेशन अनेक नए पी.ए.क्यू. वर्जनो के लिए ग्राफिकल यूजर इंटरफेस है, जिसमें पी.ए.क्यू.8पीएक्स, पी.ए.क्यू.8पीएक्सडी और पी.ए.क्यू.8पीएक्सवी के नवीनतम रिलीज सम्मिलित हैं। जब भी कोई नया वर्जन जारी होता है तो इसे अपडेट किया जाता है। सॉफ़्टवेयर समझदारी से फ़ाइल नाम में एक्सटेंशन जोड़ता है जिसका उपयोग वह सही पी.ए.क्यू. वर्जन का उपयोग करके फ़ाइल को डीकंप्रेस करने के लिए कर सकता है। सॉफ्टवेयर खुला स्रोत है.[13]
- परफेक्ट कंप्रेस[14] एक कंप्रेशन सॉफ्टवेयर है जिसमें यूसीए (अल्ट्रा कंप्रेस्ड आर्काइव) की सुविधा है। कंप्रेशन प्रारूप जिसमें पी.ए.क्यू.8पीएक्स वी 42 से वी 65 सम्मिलित है और जो अब डिफ़ॉल्ट यूसीए कंप्रेसर के रूप में पी.ए.क्यू.8पीएफ, पी.ए.क्यू.8केएक्स, या पी.ए.क्यू.8पीएक्सपीआरई का उपयोग कर सकता है। इसके अतिरिक्त , परफेक्टकंप्रेस फ़ाइलों को पी.ए.क्यू.8पीएक्स वी 42 से वी 67, और जेडपी.ए.क्यू. में कंप्रेस कर सकता है, और वर्जन 6.0 के अनुसार, फ़ाइलों को एलपी.ए.क्यू. और पी.ए.क्यू.8पीएफ बीटा 1 से बीटा 3 में कंप्रेस कर सकता है। परफेक्टकंप्रेस वी 6.10 ने वर्तमान ही में जारी पी.ए.क्यू.8पीएक्सपीआरई के लिए समर्थन कंप्रेशन प्रस्तुत किया है। परफेक्टकंप्रेस 6.12 पी.ए.क्यू.8केएक्स श्रृंखला के लिए समर्थन प्रस्तुत करता है।[15]
- फ्रंटपीएक्यू, पीएक्यू के लिए छोटा गुई। नवीनतम वर्जन फ्रंटपी.ए.क्यू. वी 8 है जो पी.ए.क्यू.8पीएक्स, पी.ए.क्यू.8पीएफ और एफपी8 को समर्थन करता है। सॉफ़्टवेयर अब अपडेट नहीं किया गया है और उपयोगकर्ताओं को पी.ए.क्यू.कम्प्रेशन का उपयोग करने के लिए प्रोत्साहित किया जाता है, जो नवीनतम पी.ए.क्यू. रिलीज़ को प्रयुक्त करता है।[16]
यह भी देखें
- संग्रह प्रारूपों की सूची
- फ़ाइल संग्रहकर्ताओं की तुलना
संदर्भ
- ↑ "The Compression/SHA-1 Challenge". Mailcom.com. Retrieved 2010-05-19.
- ↑ "Homepage of the PAQ compressors". Retrieved 2007-07-10.
You may download, use, copy, modify, and distribute these programs under the terms of the GNU general public license
- ↑ "Ubuntu Manpage: zpaq - PAQ open standard maximum compressor". manpages.ubuntu.com.
- ↑ "ZPAQ स्तर 1 विशिष्टता" (PDF). Retrieved 2010-09-03.
- ↑ James Bowery. Alexander Ratushnyak Wins First Hutter Prize Payout. Published October 27, 2006. Retrieved October 30, 2006.[dead link]
- ↑ http://prize.hutter1.net/award2.gif[bare URL image file]
- ↑ 7.0 7.1 dwing's homepage Archived February 24, 2007, at the Wayback Machine
- ↑ "केजीबी आर्काइवर होमपेज". Kgbarchiver.net. Archived from the original on 2009-01-05. Retrieved 2010-05-19.
- ↑ "एमिलकॉन्ट अल्ट्राकम्प्रेशन". Freewebs.com. Archived from the original on 2010-09-10. Retrieved 2010-05-19.
- ↑ Matt Mahoney (2007). "LPAQ". Retrieved 2013-12-29.
- ↑ "पीज़िप". पीज़िप. Retrieved 2013-10-06.
- ↑ "एकल फ़ाइल डेटा संपीड़न बेंचमार्क, संपीड़न अनुपात पर क्रमबद्ध". Maximumcompression.com. 2007-04-14. Archived from the original on 2009-04-17. Retrieved 2010-05-19.
- ↑ "पीएक्यूकंप्रेस". Moisés Cardona (in English). 2019-01-10. Retrieved 2019-03-05.
- ↑ "परफेक्टकंप्रेस आधिकारिक वेबसाइट". Moises-studios.110mb.com. 2010-04-03. Retrieved 2010-05-19.
- ↑ "परफेक्टकंप्रेस आधिकारिक फेसबुक पेज". Facebook.com. Retrieved 2010-05-19.
- ↑ "FrontPAQ - GUI frontend for PAQ8PF and PAQ8PX". encode.su. Retrieved 2019-07-26.
अग्रिम पठन
- David Salomon, Giovanni Motta, (with contributions by David Bryant), Handbook of Data Compression, 5th edition, Springer, 2009, ISBN 1-84882-902-7, 5.15 पी.ए.क्यू., pp. 314–319
- Byron Knoll, Nando de Freitas, A Machine Learning Perspective on Predictive Coding with पी.ए.क्यू., University of British Columbia, Vancouver, Canada, August 17, 2011
बाहरी संबंध
- Official website
- Compiled linux binaries - Linux command-line executables download.