पीडीएफ417
पीडीएफ417 एक स्टैक्ड लीनियर बारकोड प्रारूप है जिसका उपयोग परिवहन, पहचान पत्र और इन्वेंट्री प्रबंधन जैसे विभिन्न अनुप्रयोगों में किया जाता है। पीडीएफ का मतलब पोर्टेबल डेटा फ़ाइल है। 417 दर्शाता है कि कोड में प्रत्येक पैटर्न में 17 इकाइयों (मॉड्यूल) लंबे पैटर्न में 4 बार और रिक्त स्थान होते हैं। पीडीएफ417 सिम्बोलॉजी का आविष्कार 1991 में प्रतीक प्रौद्योगिकी में डॉ. यिनजियुन पी. वांग द्वारा किया गया था।[1] इसे ISO 15438 में परिभाषित किया गया है।
अनुप्रयोग
पीडीएफ417 का उपयोग वाणिज्यिक और सरकारी दोनों संगठनों द्वारा कई अनुप्रयोगों में किया जाता है। पीडीएफ417 उन प्रारूपों में से एक है (डेटा मैट्रिक्स के साथ) जिसका उपयोग संयुक्त राज्य डाक सेवा द्वारा स्वीकार किए गए डाक टिकट को मुद्रित करने के लिए किया जा सकता है। पीडीएफ417 का उपयोग एयरलाइन उद्योग के बार कोडेड बोर्डिंग पास (बार कोडेड बोर्डिंग पास) मानक द्वारा पेपर बोर्डिंग पास के लिए 2डी बार कोड प्रतीकवाद के रूप में भी किया जाता है। पीडीएफ417 होमलैंड सिक्योरिटी विभाग द्वारा रीयलआईडी अनुरूप चालक लाइसेंस और राज्य द्वारा जारी पहचान पत्र के लिए मशीन पठनीय क्षेत्र प्रौद्योगिकी के रूप में चयनित मानक है। पीडीएफ417 बारकोड इज़राइल राज्य द्वारा जारी वीज़ा (यात्रा) और सीमा पार कार्डों पर भी शामिल हैं ([[:File:Israel_border_card.png|उदाहरण)।
विशेषताएँ
द्वि-आयामी बार कोड की विशिष्ट विशेषताओं के अलावा, PDF417 की क्षमताओं में शामिल हैं:
- लिंक करना। पीडीएफ417 प्रतीक अन्य प्रतीकों से लिंक हो सकते हैं जिन्हें अनुक्रम में स्कैन किया जाता है जिससे और भी अधिक डेटा संग्रहीत किया जा सकता है।
- उपयोगकर्ता-निर्दिष्ट आयाम। उपयोगकर्ता यह तय कर सकता है कि सबसे संकीर्ण ऊर्ध्वाधर पट्टी (एक्स आयाम) कितनी चौड़ी है, और पंक्तियाँ कितनी लंबी हैं (वाई आयाम)।
- सार्वजनिक डोमेन प्रारूप. कोई भी बिना किसी लाइसेंस के इस प्रारूप का उपयोग करके सिस्टम लागू कर सकता है।[2]
ISO/IEC दस्तावेज़ का परिचय बताता है:[2]::बार कोड उपकरण के निर्माताओं और बार कोड प्रौद्योगिकी के उपयोगकर्ताओं को सार्वजनिक रूप से उपलब्ध मानक सिम्बोलॉजी विशिष्टताओं की आवश्यकता होती है, जिनका वे उपकरण और एप्लिकेशन मानकों को विकसित करते समय उल्लेख कर सकते हैं। यह आईएसओ/आईईसी का इरादा और समझ है कि इस अंतर्राष्ट्रीय मानक में प्रस्तुत सहजीवन पूरी तरह से सार्वजनिक डोमेन में है और सभी उपयोगकर्ता प्रतिबंधों, लाइसेंस और शुल्क से मुक्त है।
प्रारूप
PDF417 बार कोड (जिसे प्रतीक भी कहा जाता है) में 3 से 90 पंक्तियाँ होती हैं, जिनमें से प्रत्येक एक छोटे रैखिक बार कोड की तरह होती है। प्रत्येक पंक्ति में है:
- एक शांत क्षेत्र. यह बार कोड शुरू होने से पहले सफेद स्थान की अनिवार्य न्यूनतम मात्रा है।
- एक प्रारंभ पैटर्न जो प्रारूप को PDF417 के रूप में पहचानता है।
- एक पंक्ति बाईं ओर कोडवर्ड है जिसमें पंक्ति के बारे में जानकारी होती है (जैसे कि पंक्ति संख्या और त्रुटि सुधार स्तर)
- 1-30 डेटा कोडवर्ड: कोडवर्ड बार और रिक्त स्थान का एक समूह है जो एक या अधिक संख्याओं, अक्षरों या अन्य प्रतीकों का प्रतिनिधित्व करता है।
- पंक्ति के बारे में अधिक जानकारी के साथ एक पंक्ति सही कोडवर्ड।
- एक स्टॉप पैटर्न.
- एक और शांत क्षेत्र।
सभी पंक्तियों की चौड़ाई समान है; प्रत्येक पंक्ति में समान संख्या में कोडवर्ड हैं।
कोडवर्ड
पीडीएफ417 सूत्र 929 एन्कोडिंग का उपयोग करता है। प्रत्येक कोडवर्ड 0 से 928 तक की संख्या को दर्शाता है।
कोडवर्ड को डार्क (बार) और लाइट (स्पेस) क्षेत्रों के पैटर्न द्वारा दर्शाया जाता है। इनमें से प्रत्येक पैटर्न में चार बार और चार स्थान होते हैं (जहां नाम में 4 आता है)। कुल चौड़ाई सबसे संकीर्ण अनुमत ऊर्ध्वाधर पट्टी (एक्स आयाम) की चौड़ाई से 17 गुना है; नाम में 17 यहीं से आता है। प्रत्येक पैटर्न एक बार से शुरू होता है और एक स्थान के साथ समाप्त होता है।
पंक्ति की ऊँचाई न्यूनतम चौड़ाई से कम से कम 3 गुना होनी चाहिए: Y ≥ 3 X।[2]: 5.8.2
प्रत्येक कोडवर्ड को दर्शाने के लिए तीन अलग-अलग बार-स्पेस पैटर्न का उपयोग किया जाता है। इन पैटर्नों को तीन समूहों में व्यवस्थित किया जाता है जिन्हें क्लस्टर कहा जाता है। क्लस्टर को 0, 3 और 6 लेबल किया गया है। एक से अधिक क्लस्टर में कोई बार-स्पेस पैटर्न का उपयोग नहीं किया जाता है। प्रतीक की पंक्तियाँ तीन समूहों के माध्यम से चक्रित होती हैं, इसलिए पंक्ति 1 क्लस्टर 0 से पैटर्न का उपयोग करती है, पंक्ति 2 क्लस्टर 3 का उपयोग करती है, पंक्ति 3 क्लस्टर 6 का उपयोग करती है, और पंक्ति 4 फिर से क्लस्टर 0 का उपयोग करती है।
कौन सा क्लस्टर एक समीकरण द्वारा निर्धारित किया जा सकता है:[2]: 5.3.1
जहां K क्लस्टर संख्या है और biप्रतीक वर्ण (X इकाइयों में) में i-वें काली पट्टी की चौड़ाई देखें।
वैकल्पिक रूप से,[2]: 76–78
जहां ईii-वें किनारे से अगले-समान-किनारे की दूरी है। विषम सूचकांक एक बार के अग्रणी किनारे से अगले बार के अग्रणी किनारे तक होते हैं; यहां तक कि सूचकांक भी अनुगामी किनारों के लिए हैं।
तीन समूहों का एक उद्देश्य यह निर्धारित करना है कि कोडवर्ड किस पंक्ति (मॉड 3) में है। क्लस्टर एकल स्कैन लाइन का उपयोग करके प्रतीक के हिस्सों को पढ़ने की अनुमति देते हैं जो क्षैतिज से तिरछा हो सकता है।[2]{{rp|5.11.1}उदाहरण के लिए, स्कैन पंक्ति की शुरुआत में पंक्ति 6 पर शुरू हो सकता है लेकिन पंक्ति 10 पर समाप्त हो सकता है। स्कैन की शुरुआत में, स्कैनर निरंतर प्रारंभ पैटर्न देखता है, और फिर यह क्लस्टर 6 में प्रतीकों को देखता है। जब तिरछा हो जाता है पंक्तियों 6 और 7 को स्कैन करें, फिर स्कैनर को शोर दिखाई देता है। जब स्कैन पंक्ति 7 पर होता है, तो स्कैनर क्लस्टर 0 में प्रतीकों को देखता है। नतीजतन, स्कैनर तिरछा दिशा जानता है। जब तक स्कैनर दाईं ओर पहुंचता है, यह पंक्ति 10 पर होता है, इसलिए यह क्लस्टर 0 पैटर्न देखता है। स्कैनर एक निरंतर स्टॉप पैटर्न भी देखेगा।
एन्कोडिंग
929 उपलब्ध कोड शब्दों में से 900 का उपयोग डेटा के लिए किया जाता है, और 29 का उपयोग विशेष कार्यों के लिए किया जाता है, जैसे प्रमुख मोड के बीच स्थानांतरण। तीन प्रमुख मोड अलग-अलग प्रकार के डेटा को अलग-अलग तरीकों से एनकोड करते हैं, और आवश्यकतानुसार एक ही बार कोड में मिलाया जा सकता है:
- बाइट: 5 कोड शब्दों का प्रत्येक समूह 6 बाइट्स का प्रतिनिधित्व करता है। (क्योंकि 9005>2566.) अतिरिक्त बाइट्स को प्रति कोड शब्द में से एक एन्कोड किया जाता है।
- संख्यात्मक: n अंक एन्कोड किए गए हैं ⌊n/3⌋+1 कोड शब्द, 15 कोड शब्दों में अधिकतम 44 अंक।
- पाठ: प्रत्येक कोड शब्द दो आधार-30 अंकों का प्रतिनिधित्व करता है, जिनका उपयोग मुद्रण योग्य ASCII वर्णों (प्लस कैरिज रिटर्न, रेखा भरण और क्षैतिज टैब) का प्रतिनिधित्व करने के लिए चार सबमोड की एक प्रणाली द्वारा किया जाता है:
- अपरकेस: ए-जेड, स्पेस (विराम चिह्न), लोअरकेस में बदलें, मिश्रित में बदलें, अगले अंक को विराम चिह्न के रूप में समझें
- लोअरकेस: ए-जेड, एसपी, अगले अंक को अपरकेस के रूप में समझें, मिश्रित में बदलें, अगले अंक को विराम चिह्न के रूप में समझें
- मिश्रित: 0-9, और, सीआर, एचटी, अल्पविराम, :, #, -, अवधि, $, /, +, %, *, =, ^, विराम चिह्न में बदलें, एसपी, लोअरकेस में बदलें, बदलें अपरकेस, अगले अंक को विराम चिह्न के रूप में समझें
- विराम चिह्न: ;, <, >, @, [, \, ], _, `, ~, !, CR, HT, अल्पविराम, :, LF, -, अवधि, $, /, , |, *, ( , ), ?, {, }, ', अपरकेस में बदलें
त्रुटि सुधार
जब PDF417 प्रतीक बनाया जाता है, तो 2 से 512 तक त्रुटि का पता लगाने और सुधार कोडवर्ड जोड़े जाते हैं। पीडीएफ417 रीड-सोलोमन त्रुटि सुधार का उपयोग करता है। जब प्रतीक को स्कैन किया जाता है, तो किए जा सकने वाले सुधारों की अधिकतम संख्या जोड़े गए कोडवर्ड की संख्या के बराबर होती है, लेकिन मानक अनुशंसा करता है कि सही जानकारी की विश्वसनीयता सुनिश्चित करने के लिए दो कोडवर्ड को रोक कर रखा जाए।
अन्य सहजीवन के साथ तुलना
पीडीएफ417 एक स्टैक्ड बारकोड है जिसे प्रतीक पर एक साधारण रैखिक स्कैन के साथ पढ़ा जा सकता है।[3] उन रैखिक स्कैनों को प्रारंभ और स्टॉप कोड शब्दों के साथ बाएं और दाएं कॉलम की आवश्यकता होती है। इसके अतिरिक्त, स्कैन को यह जानने की आवश्यकता है कि वह किस पंक्ति को स्कैन कर रहा है, इसलिए प्रतीक की प्रत्येक पंक्ति को अपनी पंक्ति संख्या को भी एन्कोड करना होगा। इसके अलावा, रीडर का लाइन स्कैन सिर्फ एक पंक्ति को स्कैन नहीं करेगा; यह आम तौर पर एक पंक्ति को स्कैन करना शुरू कर देगा, लेकिन फिर पड़ोसी तक पहुंच जाएगा और संभवतः लगातार पंक्तियों को पार करना जारी रखेगा। इन क्रॉसिंग के प्रभाव को कम करने के लिए, पीडीएफ417 मॉड्यूल लंबे और संकीर्ण हैं - ऊंचाई आमतौर पर चौड़ाई से तीन गुना है। साथ ही, प्रत्येक कोड शब्द को यह अवश्य इंगित करना चाहिए कि वह किस पंक्ति से संबंधित है ताकि क्रॉसओवर होने पर, उनका पता लगाया जा सके। कोड शब्द भी डेल्टा-डिकोडेबल होने के लिए डिज़ाइन किए गए हैं, इसलिए कुछ कोड शब्द अनावश्यक हैं। प्रत्येक पीडीएफ डेटा कोड शब्द लगभग 10 बिट जानकारी (लॉग) का प्रतिनिधित्व करता है2(900)≈9.8), लेकिन मुद्रित कोड शब्द (अक्षर) 17 मॉड्यूल चौड़ा है। 3 मॉड्यूल की ऊंचाई सहित, एक PDF417 कोड शब्द 10 बिट्स का प्रतिनिधित्व करने के लिए 51 वर्ग मॉड्यूल लेता है। वह क्षेत्र अन्य ओवरहेड जैसे प्रारंभ, स्टॉप, पंक्ति, प्रारूप और ईसीसी जानकारी की गणना नहीं करता है।
अन्य 2डी कोड, जैसे डेटा मैट्रिक्स और क्यू आर संहिता , को असंगठित रैखिक स्कैन के बजाय छवि सेंसर के साथ डिकोड किया जाता है। उन कोडों को अभी भी पहचान और संरेखण पैटर्न की आवश्यकता है, लेकिन उन्हें उतना प्रमुख होने की आवश्यकता नहीं है। एक 8 बिट कोड वर्ड में 8 वर्ग मॉड्यूल लगेंगे (पहचान, संरेखण, प्रारूप और ईसीसी जानकारी को नजरअंदाज करते हुए)।
व्यवहार में, एक PDF417 प्रतीक डेटामैट्रिक्स या QR कोड का लगभग चार गुना क्षेत्रफल लेता है।[4]
संदर्भ
- ↑ US 5243655, Wang, Ynjiun P., "System for Encoding and Decoding Data in Machine Readable Graphic Form", published 1993-09-07. PDF417 patent.
- ↑ 2.0 2.1 2.2 2.3 2.4 2.5 ISO/IEC (2006), Information technology – Automatic identification and data capture techniques – PDF417 bar code symbology specification (PDF) (second ed.), ISO/IEC 15438:2006(E)
- ↑ For example, the Symbol Technologies LS-4000 series.
- ↑ Using Barcodes in Documents – Best Practices (PDF), Tampa, FL: Accusoft, 2007, archived from the original (PDF) on May 24, 2012, retrieved May 9, 2012