शून्य वर्ण: Difference between revisions

From Vigyanwiki
(Created page with "{{short description|Control character whose bits are all 0}} {{Other uses|Null symbol (disambiguation){{!}}Null symbol}} शून्य वर्ण (शून्य टर...")
 
No edit summary
 
(6 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{short description|Control character whose bits are all 0}}
{{short description|Control character whose bits are all 0}}
{{Other uses|Null symbol (disambiguation){{!}}Null symbol}}
{{Other uses|शून्य प्रतीक (disambiguation){{!}}शून्य प्रतीक}}
शून्य वर्ण (शून्य टर्मिनेटर भी) शून्य मान वाला एक नियंत्रण वर्ण है।<ref>{{cite IETF
 
 
शून्य वर्ण (शून्य टर्मिनेटर भी) शून्य मान वाला एक नियंत्रण वर्ण है।।<ref>{{cite IETF
|rfc=20
|rfc=20
|title=ASCII format for Network Interchange
|title=ASCII format for Network Interchange
Line 27: Line 29:
  |publisher=Unicode Consortium
  |publisher=Unicode Consortium
  |access-date=2018-10-20}}
  |access-date=2018-10-20}}
</ref>
</ref> यह कई कैरेक्टर सेटों में उपस्थित है, जिनमें बॉडॉट और आईटीए2 कोड, आईएसओ/आईईसी 646 (या एएससीआईआई), सी0 कंट्रोल कोड, यूनिवर्सल कोडेड कैरेक्टर सेट (या यूनिकोड) और ईबीसीडीआईसी द्वारा परिभाषित कैरेक्टर सेट सम्मिलित हैं। यह लगभग सभी मुख्यधारा प्रोग्रामिंग भाषाओं में उपलब्ध है।<ref>"A byte with all bits set to 0, called the ''null character'', shall exist in the basic execution character set; it is used to terminate a character string literal." — ANSI/ISO 9899:1990 (the ANSI C standard), section 5.2.1</ref> इसे अधिकांशतः नल (या नल चूँकि कुछ संदर्भों में उस शब्द का उपयोग शून्य सूचक के लिए किया जाता है) के रूप में संक्षिप्त किया जाता है। 8-बिट कोड में इसे नल बाइट के रूप में जाना जाता है।
यह [[बॉडॉट कोड]] और [[ITA2]] कोड, ISO/IEC 646 (या [[ASCII]]), C0 और C1 कंट्रोल कोड, [[यूनिवर्सल कोडेड [[ अक्षरों का समूह ]]]] (या [[यूनिकोड]]), और [[EBCDIC]] द्वारा परिभाषित सहित कई कैरेक्टर सेट में मौजूद है। यह लगभग सभी मुख्यधारा की [[प्रोग्रामिंग भाषा]]ओं में उपलब्ध है।<ref>"A byte with all bits set to 0, called the ''null character'', shall exist in the basic execution character set; it is used to terminate a character string literal." — ANSI/ISO 9899:1990 (the ANSI C standard), section 5.2.1</ref> इसे अक्सर NUL (या NULL) के रूप में संक्षिप्त किया जाता है, हालांकि कुछ संदर्भों में उस शब्द का उपयोग अशक्त सूचक के लिए किया जाता है)8-बिट कोड में, इसे अशक्त बाइट के रूप में जाना जाता है।


इस वर्ण का मूल अर्थ [[एनओपी (कोड)]] की तरह था - जब [[ संगणक मुद्रक ]] या [[कंप्यूटर टर्मिनल]] पर भेजा जाता है, तो इसका कोई प्रभाव नहीं पड़ता है (कुछ टर्मिनल, हालांकि, इसे गलत तरीके से [[अंतरिक्ष (विराम चिह्न)]] के रूप में प्रदर्शित करते हैं)। जब इलेक्ट्रोमैकेनिकल [[ तैलिप्रिंटर ]] का उपयोग कंप्यूटर आउटपुट डिवाइस के रूप में किया जाता था, तो प्रत्येक मुद्रित लाइन के अंत में एक या अधिक अशक्त वर्ण भेजे जाते थे ताकि तंत्र को अगली पंक्ति पर पहली प्रिंटिंग स्थिति में लौटने का समय मिल सके।{{Citation needed|date=April 2010}} [[छिद्रित टेप]] पर, चरित्र को बिना किसी छेद के दर्शाया जाता है, इसलिए एक नया अनपंच टेप शुरू में शून्य वर्णों से भरा होता है, और अक्सर नए वर्णों को टेप में छिद्र करके रिक्त वर्णों के आरक्षित स्थान पर पाठ डाला जा सकता है अशक्त।
इस वर्ण का मूल अर्थ एनओपी जैसा था - जब इसे प्रिंटर या टर्मिनल पर भेजा जाता है, तो इसका कोई प्रभाव नहीं पड़ता है (चूँकि, कुछ टर्मिनल इसे गलत विधि से स्पेस के रूप में प्रदर्शित करते हैं)। जब इलेक्ट्रोमैकेनिकल टेलीप्रिंटर का उपयोग कंप्यूटर आउटपुट उपकरण के रूप में किया जाता था, तो प्रत्येक मुद्रित पंक्ति के अंत में एक या अधिक शून्य अक्षर भेजे जाते थे जिससे तंत्र को अगली पंक्ति पर पहली प्रिंटिंग स्थिति में लौटने का समय मिल सकता है । छिद्रित टेप पर, चरित्र को पूर्ण रूप भी छेद के बिना दर्शाया जाता है, इसलिए एक नया अनपेक्षित टेप प्रारंभ में शून्य वर्णों से भरा होता है, और अधिकांशतः नल के ऊपर टेप में नए वर्णों को छिद्रित करके शून्य वर्णों के आरक्षित स्थान पर पाठ डाला जा सकता है।


आज प्रोग्रामिंग लैंग्वेज C (प्रोग्रामिंग लैंग्वेज) और इसके डेरिवेटिव और कई डेटा फॉर्मेट में कैरेक्टर का बहुत अधिक महत्व है, जहां यह एक [[ स्ट्रिंग (कंप्यूटर विज्ञान) ]] के अंत को दर्शाने के लिए उपयोग किए जाने वाले आरक्षित कैरेक्टर के रूप में कार्य करता है।<ref>"A ''string'' is a contiguous sequence of characters terminated by and including the first null character" — ANSI/ISO 9899:1990 (the ANSI C standard), section 7.1.1</ref> अक्सर एक [[अशक्त-समाप्त स्ट्रिंग]] कहा जाता है।<ref>{{citation |title=Working Draft, Standard for Programming Language C++ |type=ISO 14882 standard working draft |date=28 February 2011 |publisher=[[International Organization for Standardization|ISO]]/[[International Electrotechnical Commission|IEC]] |page=427 |url=http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2011/n3242.pdf |access-date=27 February 2013 |id=N3242=11-0012 |quote=A ''null-terminated byte string'', or NTBS, is a character sequence whose highest-addressed element with defined content has the value zero (the ''terminating null character''); no other element in the sequence has the value zero.}}</ref> यह स्ट्रिंग को केवल एक बाइट के ओवरहेड के साथ किसी भी लम्बाई की अनुमति देता है; एक गिनती को संग्रहित करने के विकल्प के लिए या तो 255 की स्ट्रिंग लंबाई सीमा या एक से अधिक बाइट के ओवरहेड की आवश्यकता होती है (शून्य-समाप्त स्ट्रिंग आलेख में वर्णित अन्य फायदे/नुकसान हैं)।
आज प्रोग्रामिंग लैंग्वेज C (प्रोग्रामिंग लैंग्वेज) और इसके डेरिवेटिव और कई डेटा फॉर्मेट में कैरेक्टर का बहुत अधिक महत्व है, जहां यह एक [[ स्ट्रिंग (कंप्यूटर विज्ञान) |स्ट्रिंग (कंप्यूटर विज्ञान)]] के अंत को दर्शाने के लिए उपयोग किए जाने वाले आरक्षित कैरेक्टर के रूप में कार्य करता है।<ref name=":0">"A ''string'' is a contiguous sequence of characters terminated by and including the first null character" — ANSI/ISO 9899:1990 (the ANSI C standard), section 7.1.1</ref> अधिकांशतः एक [[अशक्त-समाप्त स्ट्रिंग]] कहा जाता है।<ref name=":1">{{citation |title=Working Draft, Standard for Programming Language C++ |type=ISO 14882 standard working draft |date=28 February 2011 |publisher=[[International Organization for Standardization|ISO]]/[[International Electrotechnical Commission|IEC]] |page=427 |url=http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2011/n3242.pdf |access-date=27 February 2013 |id=N3242=11-0012 |quote=A ''null-terminated byte string'', or NTBS, is a character sequence whose highest-addressed element with defined content has the value zero (the ''terminating null character''); no other element in the sequence has the value zero.}}</ref> यह स्ट्रिंग को केवल एक बाइट के ओवरहेड के साथ किसी भी लम्बाई की अनुमति देता है; एक गिनती को संग्रहित करने के विकल्प के लिए या तो 255 की स्ट्रिंग लंबाई सीमा या एक से अधिक बाइट के ओवरहेड की आवश्यकता होती है (शून्य-समाप्त स्ट्रिंग आलेख में वर्णित अन्य लाभ/हानि हैं)।
== प्रतिनिधित्व                                                                                                                    ==
शून्य वर्ण को अधिकांशतः स्रोत कोड, स्ट्रिंग शाब्दिक या वर्ण स्थिरांक में एस्केप अनुक्रम \0 के रूप में दर्शाया जाता है।<ref name="KandR38">Kernighan and Ritchie, ''C'', p. 38</ref> कई भाषाओं में (जैसे सी, जिसने इस अंकन को प्रस्तुत किया), यह एक अलग एस्केप अनुक्रम नहीं है, किंतु एकल ऑक्टल अंक 0 के साथ एक ऑक्टल एस्केप अनुक्रम है; परिणामस्वरूप, \0 के बाद 0 से 7 तक कोई भी अंक नहीं आना चाहिए; अन्यथा इसकी व्याख्या एक लंबे अष्टाधारी पलायन क्रम की प्रारंभिक के रूप में की जाती है।<ref>In [[YAML]] this combination is a [http://www.yaml.org/spec/1.2/spec.html#id2776092 separate escape sequence].</ref> अन्य एस्केप अनुक्रम जो विभिन्न भाषाओं में उपयोग में पाए जाते हैं वे हैं <code>\000</code>, <code>\x00</code>, <code>\z</code>, या <code>\u0000</code>. प्रतिशत कोड<code>%00</code>. के साथ [[यूआरएल]] में एक शून्य वर्ण रखा जा सकता है।


== प्रतिनिधित्व ==
एक अशक्त वर्ण का प्रतिनिधित्व करने की क्षमता का सदैव यह अर्थ नहीं होता है कि परिणामी स्ट्रिंग की सही व्याख्या की जाएगी, क्योंकि कई प्रोग्राम अशक्त को स्ट्रिंग का अंत मानेंगे। इस प्रकार इसे टाइप करने की क्षमता ([[अनियंत्रित उपयोगकर्ता इनपुट]] के स्थिति में) एक [[भेद्यता (कंप्यूटिंग)]] बनाता है जिसे नल बाइट इंजेक्शन के रूप में जाना जाता है और सुरक्षा शोषण का कारण बन सकता है।<ref>[http://projects.webappsec.org/Null-Byte-Injection Null Byte Injection] WASC Threat Classification Null Byte Attack section.</ref>
अशक्त चरित्र को अक्सर [[ बचने का क्रम ]] के रूप में दर्शाया जाता है <code>\0</code> स्रोत कोड में, स्ट्रिंग अक्षर या वर्ण स्थिरांक।<ref name="KandR38">Kernighan and Ritchie, ''C'', p. 38</ref> कई भाषाओं में ([[सी में एस्केप सीक्वेंस]], जिसने इस संकेतन को पेश किया), यह एक अलग एस्केप सीक्वेंस नहीं है, लेकिन एक [[ अष्टभुजाकार ]] एस्केप सीक्वेंस है जिसमें सिंगल ऑक्टल डिजिट 0 है; एक परिणाम के रूप में, <code>\0</code> किसी भी अंक के बाद नहीं होना चाहिए <code>0</code> द्वारा <code>7</code>; अन्यथा इसे एक लंबे ऑक्टल एस्केप सीक्वेंस की शुरुआत के रूप में समझा जाता है।<ref>In [[YAML]] this combination is a [http://www.yaml.org/spec/1.2/spec.html#id2776092 separate escape sequence].</ref> अन्य एस्केप सीक्वेंस जो विभिन्न भाषाओं में उपयोग में पाए जाते हैं वे हैं <code>\000</code>, <code>\x00</code>, <code>\z</code>, या <code>\u0000</code>. [[प्रतिशत एन्कोडिंग]] वाले [[यूआरएल]] में एक शून्य वर्ण रखा जा सकता है <code>%00</code>.


एक अशक्त वर्ण का प्रतिनिधित्व करने की क्षमता का हमेशा यह अर्थ नहीं होता है कि परिणामी स्ट्रिंग की सही व्याख्या की जाएगी, क्योंकि कई प्रोग्राम अशक्त को स्ट्रिंग का अंत मानेंगे। इस प्रकार इसे टाइप करने की क्षमता ([[अनियंत्रित उपयोगकर्ता इनपुट]] के मामले में) एक [[भेद्यता (कंप्यूटिंग)]] बनाता है जिसे नल बाइट इंजेक्शन के रूप में जाना जाता है और सुरक्षा शोषण का कारण बन सकता है।<ref>[http://projects.webappsec.org/Null-Byte-Injection Null Byte Injection] WASC Threat Classification Null Byte Attack section.</ref>
कैरेट नोटेशन में शून्य वर्ण <code>^@</code> है। कुछ कीबोर्ड पर, कोई व्यक्ति {{keypress|Ctrl}} दबाकर और {{keypress|@}} दबाकर एक शून्य वर्ण अंकित कर सकता है (यूएस लेआउट पर केवल {{keypress|Ctrl|2}} अधिकांशतः काम करेगा, @ चिह्न प्राप्त करने के लिए {{keypress|Shift}} की कोई आवश्यकता नहीं है)।
[[कैरेट नोटेशन]] में अशक्त वर्ण है <code>^@</code>. कुछ कीबोर्ड पर, नीचे पकड़ कर एक अशक्त वर्ण दर्ज किया जा सकता है {{keypress|Ctrl}} और दबाना {{keypress|@}} (सिर्फ यूएस लेआउट पर {{keypress|Ctrl|2}} अक्सर काम करेगा, इसकी कोई ज़रूरत नहीं है {{keypress|Shift}} @ चिह्न प्राप्त करने के लिए)।


नल के लिए [[हेक्साडेसिमल]] संकेतन है <code>00</code>. [[बेस 64]] स्ट्रिंग को डीकोड करना <code>AA==</code> अशक्त चरित्र भी देता है।
शून्य के लिए हेक्साडेसिमल अंकन 00 है। बेस 64 स्ट्रिंग <code>AA==</code>को डिकोड करने से भी शून्य वर्ण प्राप्त होता है।


प्रलेखन में, अशक्त वर्ण को कभी-कभी एकल-[[एम (टाइपोग्राफी)]]-चौड़ाई के प्रतीक के रूप में दर्शाया जाता है जिसमें NUL अक्षर होते हैं। यूनिकोड में इसके लिए एक वर्ण है: {{unichar|2400|SYMBOL FOR NULL}}.
प्रलेखन में, अशक्त वर्ण को कभी-कभी एकल-[[एम (टाइपोग्राफी)]]-चौड़ाई के प्रतीक के रूप में दर्शाया जाता है जिसमें नल अक्षर होते हैं। यूनिकोड में इसके लिए एक वर्ण है: {{unichar|2400|SYMBOL FOR NULL}}.


== एनकोडिंग ==
== एनकोडिंग ==
सभी आधुनिक वर्ण सेटों में, शून्य वर्ण का कोड बिंदु मान शून्य होता है। अधिकांश एनकोडिंग में, इसे शून्य मान वाली एकल कोड इकाई में अनुवादित किया जाता है। उदाहरण के लिए, [[UTF-8]] में यह एक शून्य बाइट है। हालाँकि, UTF-8#Modified UTF-8|Modified UTF-8 में नल वर्ण को दो बाइट्स के रूप में एन्कोड किया गया है: 0xC0, 0x80। यह बाइट को शून्य के मान के साथ अनुमति देता है, जो अब किसी भी वर्ण के लिए उपयोग नहीं किया जाता है, जिसे स्ट्रिंग टर्मिनेटर के रूप में उपयोग किया जाता है।
सभी आधुनिक वर्ण सेटों में, शून्य वर्ण का कोड बिंदु मान शून्य होता है। अधिकांश एनकोडिंग में, इसे शून्य मान वाली एकल कोड इकाई में अनुवादित किया जाता है। उदाहरण के लिए, [[UTF-8|यूटीएफ-8]] में यह एक शून्य बाइट है। चूँकि, यूटीएफ-8 या संशोधितयूटीएफ-8 '''संशोधितयूटीएफ-8''' में नल वर्ण को दो बाइट्स के रूप में एन्कोड किया गया है: 0xC0, 0x80। यह बाइट को शून्य के मान के साथ अनुमति देता है, जो अब किसी भी वर्ण के लिए उपयोग नहीं किया जाता है, जिसे स्ट्रिंग टर्मिनेटर के रूप में उपयोग किया जाता है।


== संदर्भ ==
== संदर्भ ==
Line 57: Line 58:
{{nulls}}
{{nulls}}


{{DEFAULTSORT:Null Character}}[[Category: नियंत्रण वर्ण]] [[Category: कंप्यूटर सुरक्षा शोषण]]
{{DEFAULTSORT:Null Character}}
 
 


[[Category: Machine Translated Page]]
[[Category:Articles with hatnote templates targeting a nonexistent page|Null Character]]
[[Category:Created On 14/06/2023]]
[[Category:Collapse templates|Null Character]]
[[Category:Created On 14/06/2023|Null Character]]
[[Category:Lua-based templates|Null Character]]
[[Category:Machine Translated Page|Null Character]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists|Null Character]]
[[Category:Pages with script errors|Null Character]]
[[Category:Sidebars with styles needing conversion|Null Character]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates Vigyan Ready|Null Character]]
[[Category:Templates generating microformats|Null Character]]
[[Category:Templates that add a tracking category|Null Character]]
[[Category:Templates that are not mobile friendly|Null Character]]
[[Category:Templates that generate short descriptions|Null Character]]
[[Category:Templates using TemplateData|Null Character]]
[[Category:Wikipedia metatemplates|Null Character]]
[[Category:कंप्यूटर सुरक्षा शोषण|Null Character]]
[[Category:नियंत्रण वर्ण|Null Character]]

Latest revision as of 10:58, 30 June 2023


शून्य वर्ण (शून्य टर्मिनेटर भी) शून्य मान वाला एक नियंत्रण वर्ण है।।[1][2][3][4] यह कई कैरेक्टर सेटों में उपस्थित है, जिनमें बॉडॉट और आईटीए2 कोड, आईएसओ/आईईसी 646 (या एएससीआईआई), सी0 कंट्रोल कोड, यूनिवर्सल कोडेड कैरेक्टर सेट (या यूनिकोड) और ईबीसीडीआईसी द्वारा परिभाषित कैरेक्टर सेट सम्मिलित हैं। यह लगभग सभी मुख्यधारा प्रोग्रामिंग भाषाओं में उपलब्ध है।[5] इसे अधिकांशतः नल (या नल चूँकि कुछ संदर्भों में उस शब्द का उपयोग शून्य सूचक के लिए किया जाता है) के रूप में संक्षिप्त किया जाता है। 8-बिट कोड में इसे नल बाइट के रूप में जाना जाता है।

इस वर्ण का मूल अर्थ एनओपी जैसा था - जब इसे प्रिंटर या टर्मिनल पर भेजा जाता है, तो इसका कोई प्रभाव नहीं पड़ता है (चूँकि, कुछ टर्मिनल इसे गलत विधि से स्पेस के रूप में प्रदर्शित करते हैं)। जब इलेक्ट्रोमैकेनिकल टेलीप्रिंटर का उपयोग कंप्यूटर आउटपुट उपकरण के रूप में किया जाता था, तो प्रत्येक मुद्रित पंक्ति के अंत में एक या अधिक शून्य अक्षर भेजे जाते थे जिससे तंत्र को अगली पंक्ति पर पहली प्रिंटिंग स्थिति में लौटने का समय मिल सकता है । छिद्रित टेप पर, चरित्र को पूर्ण रूप भी छेद के बिना दर्शाया जाता है, इसलिए एक नया अनपेक्षित टेप प्रारंभ में शून्य वर्णों से भरा होता है, और अधिकांशतः नल के ऊपर टेप में नए वर्णों को छिद्रित करके शून्य वर्णों के आरक्षित स्थान पर पाठ डाला जा सकता है।

आज प्रोग्रामिंग लैंग्वेज C (प्रोग्रामिंग लैंग्वेज) और इसके डेरिवेटिव और कई डेटा फॉर्मेट में कैरेक्टर का बहुत अधिक महत्व है, जहां यह एक स्ट्रिंग (कंप्यूटर विज्ञान) के अंत को दर्शाने के लिए उपयोग किए जाने वाले आरक्षित कैरेक्टर के रूप में कार्य करता है।[6] अधिकांशतः एक अशक्त-समाप्त स्ट्रिंग कहा जाता है।[7] यह स्ट्रिंग को केवल एक बाइट के ओवरहेड के साथ किसी भी लम्बाई की अनुमति देता है; एक गिनती को संग्रहित करने के विकल्प के लिए या तो 255 की स्ट्रिंग लंबाई सीमा या एक से अधिक बाइट के ओवरहेड की आवश्यकता होती है (शून्य-समाप्त स्ट्रिंग आलेख में वर्णित अन्य लाभ/हानि हैं)।

प्रतिनिधित्व

शून्य वर्ण को अधिकांशतः स्रोत कोड, स्ट्रिंग शाब्दिक या वर्ण स्थिरांक में एस्केप अनुक्रम \0 के रूप में दर्शाया जाता है।[8] कई भाषाओं में (जैसे सी, जिसने इस अंकन को प्रस्तुत किया), यह एक अलग एस्केप अनुक्रम नहीं है, किंतु एकल ऑक्टल अंक 0 के साथ एक ऑक्टल एस्केप अनुक्रम है; परिणामस्वरूप, \0 के बाद 0 से 7 तक कोई भी अंक नहीं आना चाहिए; अन्यथा इसकी व्याख्या एक लंबे अष्टाधारी पलायन क्रम की प्रारंभिक के रूप में की जाती है।[9] अन्य एस्केप अनुक्रम जो विभिन्न भाषाओं में उपयोग में पाए जाते हैं वे हैं \000, \x00, \z, या \u0000. प्रतिशत कोड%00. के साथ यूआरएल में एक शून्य वर्ण रखा जा सकता है।

एक अशक्त वर्ण का प्रतिनिधित्व करने की क्षमता का सदैव यह अर्थ नहीं होता है कि परिणामी स्ट्रिंग की सही व्याख्या की जाएगी, क्योंकि कई प्रोग्राम अशक्त को स्ट्रिंग का अंत मानेंगे। इस प्रकार इसे टाइप करने की क्षमता (अनियंत्रित उपयोगकर्ता इनपुट के स्थिति में) एक भेद्यता (कंप्यूटिंग) बनाता है जिसे नल बाइट इंजेक्शन के रूप में जाना जाता है और सुरक्षा शोषण का कारण बन सकता है।[10]

कैरेट नोटेशन में शून्य वर्ण ^@ है। कुछ कीबोर्ड पर, कोई व्यक्ति Ctrl दबाकर और @ दबाकर एक शून्य वर्ण अंकित कर सकता है (यूएस लेआउट पर केवल Ctrl+2 अधिकांशतः काम करेगा, @ चिह्न प्राप्त करने के लिए ⇧ Shift की कोई आवश्यकता नहीं है)।

शून्य के लिए हेक्साडेसिमल अंकन 00 है। बेस 64 स्ट्रिंग AA==को डिकोड करने से भी शून्य वर्ण प्राप्त होता है।

प्रलेखन में, अशक्त वर्ण को कभी-कभी एकल-एम (टाइपोग्राफी)-चौड़ाई के प्रतीक के रूप में दर्शाया जाता है जिसमें नल अक्षर होते हैं। यूनिकोड में इसके लिए एक वर्ण है: U+2400 SYMBOL FOR NULL.

एनकोडिंग

सभी आधुनिक वर्ण सेटों में, शून्य वर्ण का कोड बिंदु मान शून्य होता है। अधिकांश एनकोडिंग में, इसे शून्य मान वाली एकल कोड इकाई में अनुवादित किया जाता है। उदाहरण के लिए, यूटीएफ-8 में यह एक शून्य बाइट है। चूँकि, यूटीएफ-8 या संशोधितयूटीएफ-8 संशोधितयूटीएफ-8 में नल वर्ण को दो बाइट्स के रूप में एन्कोड किया गया है: 0xC0, 0x80। यह बाइट को शून्य के मान के साथ अनुमति देता है, जो अब किसी भी वर्ण के लिए उपयोग नहीं किया जाता है, जिसे स्ट्रिंग टर्मिनेटर के रूप में उपयोग किया जाता है।

संदर्भ

  1. ASCII format for Network Interchange. IETF. sec. 5.2. doi:10.17487/RFC0020. RFC 20. NUL (Null): The all-zeros character which may serve to accomplish time fill and media fill.
  2. "The set of control characters of the ISO 646" (PDF). Secretariat ISO/TC 97/SC 2. 1975-12-01. p. 4.4. Archived from the original (PDF) on 2014-05-12. Position: 0/0, Name: Null, Abbreviation: Nul
  3. "Unicode Character 'NULL' (U+0000)". Retrieved 2018-10-20.
  4. "C0 Controls and Basic Latin" (PDF). Unicode Consortium. 2018. Retrieved 2018-10-20.
  5. "A byte with all bits set to 0, called the null character, shall exist in the basic execution character set; it is used to terminate a character string literal." — ANSI/ISO 9899:1990 (the ANSI C standard), section 5.2.1
  6. "A string is a contiguous sequence of characters terminated by and including the first null character" — ANSI/ISO 9899:1990 (the ANSI C standard), section 7.1.1
  7. Working Draft, Standard for Programming Language C++ (PDF) (ISO 14882 standard working draft), ISO/IEC, 28 February 2011, p. 427, N3242=11-0012, retrieved 27 February 2013, A null-terminated byte string, or NTBS, is a character sequence whose highest-addressed element with defined content has the value zero (the terminating null character); no other element in the sequence has the value zero.
  8. Kernighan and Ritchie, C, p. 38
  9. In YAML this combination is a separate escape sequence.
  10. Null Byte Injection WASC Threat Classification Null Byte Attack section.


बाहरी संबंध