शेपफ़ाइल
Filename extension | .shp , .shx , .dbf |
---|---|
Internet media type |
x-gis/x-shapefile |
Developed by | Esri |
Type of format | GIS |
Standard | Shapefile Technical Description |
शेपफाइल प्रारूप भौगोलिक सूचना प्रणाली (जीआईएस) सॉफ्टवेयर के लिए एक भूस्थानिक सदिश डेटा प्रारूप है। इसे एएसआरआई द्वारा और अन्य भौगोलिक सूचना प्रणाली के बीच डेटा इंटरऑपरेबिलिटी के लिए एक खुले मानक के रूप में विकसित और विनियमित किया जाता है।[1] शेपफ़ाइल प्रारूप स्थानिक रूप से सदिश ग्राफिक्स सुविधाओं का वर्णन कर सकता है, जो बिंदु (ज्यामिति), पॉलीलाइन और बहुभुजों का उदाहरण के लिए पानी के कुएं नदियों और झीलों का प्रतिनिधित्व करते हैं और इस प्रकार प्रत्येक आइटम में विशेषता (कंप्यूटिंग) इसका वर्णन करने वाले गुण का वर्णन करती है, जैसे नाम या तापमान इत्यादि।
अवलोकन
शेपफ़ाइल प्रारूप भौगोलिक स्थिति तथा उससे संबंधित विशेषता सूचना के संग्रहीत करने के लिए एक डिजिटल सदिश भंडारण प्रारूप है। इस प्रारूप में भू-स्थानिक टोपोलॉजी जानकारी संग्रहीत करने की क्षमता का अभाव होता है। शेपफ़ाइल प्रारूप को 1990 के दशक के प्रारंभ में आर्कव्यू जी एस संस्करण 2 के साथ प्रस्तुत किया गया है और विभिन्न प्रकार के सॉफ़्टवेयर के साथ शेपफ़ाइल प्रारूप का उपयोग करके भौगोलिक डेटासेट को पढ़ना और लिखना अब संभव हो गया है।
शेपफ़ाइल प्रारूप ज्यामिति को बिंदुओं रेखाओं और बहुभुजों जैसी प्राचीन ज्यामितीय आकृतियों के रूप में संग्रहीत करता है। ये आकृतियाँ प्रत्येक आकृति से जुड़ी डेटा विशेषताओं के साथ भौगोलिक डेटा का प्रतिनिधित्व करती है। शेपफाइल शब्द बहुत सामान्य होते है, लेकिन प्रारूप में एक ही निर्देशिका (कंप्यूटिंग) में संग्रहीत सामान्य फ़ाइल नाम प्रीफिक्स वाली फ़ाइलों का संग्रह होता है और इस प्रकार तीन अनिवार्य फाइलों में फ़ाइल नाम एक्सटेंशन .shp
, .shx
, और .dbf
.के रूप में होते है। वास्तविक शेपफ़ाइल विशेष रूप.shp
फ़ाइल से संबंधित होती है, लेकिन वितरण के लिए अकेला अधूरा है क्योंकि अन्य सहायक फ़ाइलों की आवश्यकता होती है। यद्यपि आधुनिक सॉफ्टवेयर अनुप्रयोग लंबे नाम वाली फाइलों को स्वीकार करते हैं और इस प्रकार लीगेसी GIS सॉफ़्टवेयर के रूप में उम्मीद कर सकते हैं कि फ़ाइल नाम प्रीफिक्स को DOS 8.3 फ़ाइल नाम कन्वेंशन के अनुरूप आठ वर्णों तक सीमित किया जाता हैं।
- अनिवार्य फ़ाइलें
.shp
- आकार प्रारूप; फ़ीचर ज्यामिति स्वयं {सामग्री-प्रकार: x-gis/x-shapefile}.shx
- आकार सूचकांक प्रारूप; फ़ीचर ज्योमेट्री का एक स्थितिगत सूचकांक जो आगे और पीछे की ओर शीघ्रता से खोज करने की अनुमति देता है {सामग्री-प्रकार: x-gis/x-shapefile}.dbf
- विशेषता प्रारूप; प्रत्येक आकृति के लिए स्तंभ विशेषताएँ, dBase IV प्रारूप में {सामग्री-प्रकार: एप्लिकेशन/ऑक्टेट-स्ट्रीम या टेक्स्ट/सादा}
- अन्य फ़ाइलें
.prj
- प्रक्षेपण विवरण, समन्वय संदर्भ प्रणालियों के एक प्रसिद्ध पाठ प्रतिनिधित्व का उपयोग करते हुए {सामग्री-प्रकार: पाठ/सादा या एप्लिकेशन/पाठ}.sbn
और.sbx
- सुविधाओं का एक स्थानिक सूचकांक {सामग्री-प्रकार: x-gis/x-shapefile}.fbn
और.fbx
- सुविधाओं का एक स्थानिक सूचकांक जो केवल पढ़ने के लिए है {सामग्री-प्रकार: x-gis/x-shapefile}.ain
और.aih
- तालिका में सक्रिय फ़ील्ड का एक विशेषता सूचकांक {सामग्री-प्रकार: x-gis/x-shapefile}.ixs
- पढ़ने-लिखने वाले डेटासेट के लिए एक जियोकोडिंग इंडेक्स {सामग्री-प्रकार: x-gis/x-shapefile}.mxs
- पढ़ने-लिखने वाले डेटासेट के लिए एक जियोकोडिंग इंडेक्स (ओडीबी प्रारूप) {सामग्री-प्रकार: x-gis/x-shapefile}.atx
- के लिए एक विशेषता सूचकांक.dbf
फ़ाइल के रूप मेंshapefile.columnname.atx
(आर्कजीआईएस 8 और बाद के संस्करण) {सामग्री-प्रकार:x-gis/x-shapefile
}.shp.xml
- XML प्रारूप में भू-स्थानिक मेटाडेटा, जैसे ISO 19115 या अन्य XML स्कीमा {सामग्री-प्रकार: एप्लिकेशन/fgdc+xml}.cpg
- कोड पेज को निर्दिष्ट करने के लिए उपयोग किया जाता है (केवल के लिए)।.dbf
) इस्तेमाल किए जाने वाले अक्षरों को सांकेतिक अक्षरों में बदलना की पहचान के लिए {सामग्री-प्रकार:text/plain
याx-gis/x-shapefile
}.qix
- मानचित्र सर्वर और GDAL|GDAL/OGR सॉफ़्टवेयर द्वारा उपयोग किया जाने वाला एक वैकल्पिक क्वाडट्री स्थानिक सूचकांक {सामग्री-प्रकार: x-gis/x-shapefile}
प्रत्येक में .shp
, .shx
, और .dbf
फ़ाइलें, प्रत्येक फ़ाइल में आकृतियाँ अनुक्रम में एक दूसरे से मेल खाती हैं (अर्थात, पहला रिकॉर्ड .shp
फ़ाइल पहले रिकॉर्ड से मेल खाती है .shx
और .dbf
फ़ाइलें, आदि)। वह .shp
और .shx
फ़ाइलों में अलग-अलग अंतहीनता वाले विभिन्न क्षेत्र होते हैं, इसलिए फ़ाइल स्वरूपों के एक कार्यान्वयनकर्ता को प्रत्येक फ़ील्ड की अंतहीनता का सम्मान करने और उसके साथ उचित व्यवहार करने के लिए बहुत सावधान रहना चाहिए।
शेपफाइल आकार प्रारूप (.shp)
मुख्य फ़ाइल (.shp) में ज्यामिति डेटा शामिल है। किसी दिए गए फीचर की ज्यामिति को सदिश निर्देशांक के एक सेट के रूप में संग्रहीत किया जाता है।[1]: 5 बाइनरी फ़ाइल में एक निश्चित-लंबाई वाला हेडर (कंप्यूटिंग) होता है जिसके बाद एक या अधिक चर-लंबाई रिकॉर्ड (कंप्यूटर विज्ञान) होता है। प्रत्येक चर-लंबाई रिकॉर्ड में एक रिकॉर्ड-हेडर घटक और एक रिकॉर्ड-सामग्री घटक शामिल होता है। फ़ाइल स्वरूप का विस्तृत विवरण ESRI शेपफ़ाइल तकनीकी विवरण में दिया गया है।[1]इस प्रारूप को ऑटोकैड आकार फ़ॉन्ट स्रोत प्रारूप के साथ भ्रमित नहीं किया जाना चाहिए, जो इसे साझा करता है .shp
विस्तार।
समन्वय डेटा का 2डी अक्ष क्रम (XY) या (ईस्टिंग नॉर्थिंग) क्रम का उपयोग करके कार्टेशियन समन्वय प्रणाली मानता है। यह अक्ष क्रम भौगोलिक समन्वय प्रणालियों के लिए सुसंगत है, जहां क्रम समान (देशांतर अक्षांश) है। ऊंचाई और माप के लिए ज्यामिति क्रमशः 3- या 4-आयामी Z और M निर्देशांक का भी समर्थन कर सकती है। एक Z-आयाम त्रि-आयामी अंतरिक्ष में प्रत्येक समन्वय की ऊंचाई को संग्रहीत करता है, जिसका उपयोग विश्लेषण के लिए या 3डी कंप्यूटर ग्राफिक्स का उपयोग करके ज्यामिति के दृश्य के लिए किया जा सकता है। उपयोगकर्ता-परिभाषित एम आयाम का उपयोग कई कार्यों में से एक के लिए किया जा सकता है, जैसे कि रैखिक संदर्भ उपायों या चार-आयामी अंतरिक्ष में किसी सुविधा के सापेक्ष समय को संग्रहीत करना।
मुख्य फ़ाइल हेडर की लंबाई 100 बाइट्स तय की गई है और इसमें 17 फ़ील्ड हैं; नौ 4-बाइट (32-बिट हस्ताक्षरित पूर्णांक या int32) पूर्णांक फ़ील्ड और उसके बाद आठ 8-बाइट (दोहरी सुनिश्चितता ) हस्ताक्षरित फ़्लोटिंग पॉइंट फ़ील्ड:
Bytes | Type | Endianness | Usage |
---|---|---|---|
0–3 | int32 | big | File code (always hex value 0x0000270a) |
4–23 | int32 | big | Unused; five uint32 |
24–27 | int32 | big | File length (in 16-bit words, including the header) |
28–31 | int32 | little | Version |
32–35 | int32 | little | Shape type (see reference below) |
36–67 | double | little | Minimum bounding rectangle (MBR) of all shapes contained within the dataset; four doubles in the following order: min X, min Y, max X, max Y |
68–83 | double | little | Range of Z; two doubles in the following order: min Z, max Z |
84–99 | double | little | Range of M; two doubles in the following order: min M, max M |
फ़ाइल में किसी भी संख्या में चर-लंबाई रिकॉर्ड शामिल होते हैं। प्रत्येक रिकॉर्ड के पहले 8 बाइट्स का रिकॉर्ड हेडर लगा होता है:
Bytes | Type | Endianness | Usage |
---|---|---|---|
0–3 | int32 | big | Record number (1-based) |
4–7 | int32 | big | Record length (in 16-bit words) |
रिकॉर्ड हेडर के बाद वास्तविक रिकॉर्ड है:
Bytes | Type | Endianness | Usage |
---|---|---|---|
0–3 | int32 | little | Shape type (see reference below) |
4– | – | – | Shape content |
चर-लंबाई रिकॉर्ड सामग्री आकार प्रकार पर निर्भर करती है, जो या तो फ़ाइल हेडर में दिए गए आकार प्रकार या शून्य होनी चाहिए। निम्नलिखित संभावित आकार प्रकार हैं:
Value | Shape type | Fields |
---|---|---|
0 | Null shape | None |
1 | Point | X, Y |
3 | Polyline | MBR, Number of parts, Number of points, Parts, Points |
5 | Polygon | MBR, Number of parts, Number of points, Parts, Points |
8 | MultiPoint | MBR, Number of points, Points |
11 | PointZ | X, Y, Z Optional: M |
13 | PolylineZ | Mandatory: MBR, Number of parts, Number of points, Parts, Points, Z range, Z array Optional: M range, M array |
15 | PolygonZ | Mandatory: MBR, Number of parts, Number of points, Parts, Points, Z range, Z array Optional: M range, M array |
18 | MultiPointZ | Mandatory: MBR, Number of points, Points, Z range, Z array Optional: M range, M array |
21 | PointM | X, Y, M |
23 | PolylineM | Mandatory: MBR, Number of parts, Number of points, Parts, Points Optional: M range, M array |
25 | PolygonM | Mandatory: MBR, Number of parts, Number of points, Parts, Points Optional: M range, M array |
28 | MultiPointM | Mandatory: MBR, Number of points, Points Optional Fields: M range, M array |
31 | MultiPatch | Mandatory: MBR, Number of parts, Number of points, Parts, Part types, Points, Z range, Z array Optional: M range, M array |
शेपफाइल आकार सूचकांक प्रारूप (.shx)
सूचकांक में फ़ीचर ज्यामिति का स्थितीय सूचकांक और समान 100-बाइट हेडर शामिल है .shp
फ़ाइल, जिसके बाद किसी भी संख्या में 8-बाइट निश्चित-लंबाई वाले रिकॉर्ड होते हैं, जिसमें निम्नलिखित दो फ़ील्ड शामिल होते हैं:
Bytes | Type | Endianness | Usage |
---|---|---|---|
0–3 | int32 | big | Record offset (in 16-bit words) |
4–7 | int32 | big | Record length (in 16-bit words) |
इस सूचकांक का उपयोग करके, पहले आकार सूचकांक में पीछे की ओर खोज करना संभव है (जो संभव है क्योंकि यह निश्चित-लंबाई रिकॉर्ड का उपयोग करता है), फिर रिकॉर्ड ऑफसेट को पढ़ना, और उस ऑफसेट का उपयोग करके खोज करना संभव है में सही स्थिति .shp
फ़ाइल। एक ही विधि का उपयोग करके मनमाने ढंग से रिकॉर्ड की संख्या को आगे बढ़ाना भी संभव है।
अकेले दिए गए संपूर्ण इंडेक्स फ़ाइल को उत्पन्न करना संभव है .shp
फ़ाइल। हालाँकि, चूंकि शेपफाइल में हमेशा एक इंडेक्स होना चाहिए, ऐसा करना एक भ्रष्ट फ़ाइल की मरम्मत के रूप में गिना जाता है।[2]
शेपफाइल विशेषता प्रारूप (.dbf)
यह फ़ाइल प्रत्येक आकृति के लिए विशेषताओं को संग्रहीत करती है; यह dBase IV प्रारूप का उपयोग करता है। प्रारूप सार्वजनिक ज्ञान है, और इसे कई dBase क्लोनों में लागू किया गया है जिन्हें xBase के नाम से जाना जाता है। उदाहरण के लिए, ओपन-सोर्स शेपफाइल सी लाइब्रेरी अपने प्रारूप को xBase कहती है, भले ही यह सादा dBase IV हो।[3] विशेषताओं के नाम और मान मानकीकृत नहीं हैं, और आकृति फ़ाइल के स्रोत के आधार पर भिन्न होंगे।
शेपफ़ाइल स्थानिक सूचकांक प्रारूप (.sbn)
यह एक बाइनरी स्थानिक सूचकांक फ़ाइल है, जिसका उपयोग केवल Esri सॉफ़्टवेयर द्वारा किया जाता है। प्रारूप Esri द्वारा प्रलेखित नहीं है। हालाँकि इसे ओपन सोर्स समुदाय द्वारा रिवर्स-इंजीनियरिंग और दस्तावेजीकरण किया गया है। 100-बाइट हेडर इसके समान है .shp.[4] यह वर्तमान में अन्य विक्रेताओं द्वारा कार्यान्वित नहीं किया गया है। .sbn}bn
फ़ाइल पूरी तरह से आवश्यक नहीं है, क्योंकि .shp
फ़ाइल में स्थानिक डेटा को सफलतापूर्वक पार्स करने के लिए आवश्यक सभी जानकारी शामिल है।
सीमाएँ
टोपोलॉजी और शेपफाइल प्रारूप
शेपफ़ाइल प्रारूप में टोपोलॉजी जानकारी संग्रहीत करने की क्षमता नहीं है। ईएसआरआई आर्कइन्फो कवरेज डेटा#जीआईएस प्रारूप और व्यक्तिगत/फ़ाइल/उद्यम जियोडेटाबेस में फीचर टोपोलॉजी को संग्रहीत करने की क्षमता है।
स्थानिक प्रतिनिधित्व
पॉलीलाइन या बहुभुज के किनारे बिंदुओं से बने होते हैं। बिंदुओं का अंतर स्पष्ट रूप से उस पैमाने को निर्धारित करता है जिस पर सुविधा दृष्टिगत रूप से उपयोगी है। उस पैमाने से अधिक होने पर प्रतिनिधित्व अनियमित हो जाता है। बड़े पैमाने पर चिकनी आकृतियाँ प्राप्त करने के लिए अतिरिक्त बिंदुओं की आवश्यकता होगी। चिकनी वक्रों द्वारा बेहतर प्रतिनिधित्व वाली सुविधाओं के लिए, बहुभुज प्रतिनिधित्व के लिए, उदाहरण के लिए, स्प्लाइन (गणित) की तुलना में बहुत अधिक डेटा भंडारण की आवश्यकता होती है, जो सुचारू रूप से अलग-अलग आकृतियों को कुशलतापूर्वक कैप्चर कर सकता है। कोई भी शेपफ़ाइल प्रारूप प्रकार स्प्लिंस का समर्थन नहीं करता है।
डेटा भंडारण
दोनों का आकार .shp
और .dbf
घटक फ़ाइलें 2 जीबी (या 231बाइट्स) - लगभग 70 मिलियन पॉइंट फ़ीचर।[5] अन्य ज्यामिति प्रकारों के लिए फीचर की अधिकतम संख्या उपयोग किए गए शीर्षों की संख्या के आधार पर भिन्न होती है।
के लिए विशेषता डेटाबेस प्रारूप .dbf
घटक फ़ाइल पुराने dBase मानक पर आधारित है। इस डेटाबेस प्रारूप में स्वाभाविक रूप से कई सीमाएँ हैं:[5]*जबकि वर्तमान dBase मानक, और GDAL|GDAL/OGR (शेपफाइल प्रारूप डेटासेट को पढ़ने और लिखने के लिए मुख्य ओपन सोर्स सॉफ़्टवेयर लाइब्रेरी) Null (SQL) मानों का समर्थन करते हैं, ESRI सॉफ़्टवेयर इन मानों को शून्य के रूप में प्रस्तुत करता है - मात्रात्मक विश्लेषण के लिए एक बहुत ही गंभीर मुद्दा डेटा, क्योंकि यदि शून्य मात्राओं को शून्य के रूप में दर्शाया जाता है तो यह प्रतिनिधित्व और आंकड़ों को विकृत कर सकता है
- यूनिकोड फ़ील्ड नाम या फ़ील्ड संग्रहण के लिए ख़राब समर्थन
- फ़ील्ड नामों की अधिकतम लंबाई 10 अक्षर है
- फ़ील्ड की अधिकतम संख्या 255 है
- समर्थित फ़ील्ड प्रकार हैं: फ़्लोटिंग पॉइंट (13 वर्ण संग्रहण), पूर्णांक (4 या 9 वर्ण संग्रहण), दिनांक (कोई समय संग्रहण नहीं; 8 वर्ण संग्रहण), और पाठ (अधिकतम 254 वर्ण संग्रहण)
- फ्लोटिंग पॉइंट नंबरों में राउंडिंग त्रुटियां हो सकती हैं क्योंकि उन्हें टेक्स्ट के रूप में संग्रहीत किया जाता है
मिश्रण आकार प्रकार
क्योंकि आकृति प्रकार प्रत्येक ज्यामिति रिकॉर्ड से पहले होता है, एक आकृति फ़ाइल तकनीकी रूप से विभिन्न आकार प्रकारों के मिश्रण को संग्रहीत करने में सक्षम होती है। हालाँकि, विनिर्देश में कहा गया है, एक शेपफाइल में सभी गैर-शून्य आकृतियों को एक ही आकार प्रकार का होना आवश्यक है। इसलिए, आकार प्रकारों को मिश्रित करने की यह क्षमता फ़ाइल के शीर्षलेख में घोषित एकल आकार प्रकार के साथ शून्य आकृतियों को जोड़ने तक सीमित होनी चाहिए। एक शेपफाइल में पॉलीलाइन और पॉलीगॉन दोनों डेटा नहीं होने चाहिए, उदाहरण के लिए, एक कुएं (बिंदु), एक नदी (पॉलीलाइन), और एक झील (बहुभुज) का विवरण तीन अलग-अलग डेटासेट में संग्रहीत किया जाएगा।
यह भी देखें
- भौगोलिक सूचना प्रणाली
- भू-स्थानिक कंसोर्टियम खोलें
- ओपन सोर्स जियोस्पेशियल फाउंडेशन (OSGeo)
- भौगोलिक सूचना प्रणाली सॉफ्टवेयर की सूची
- भौगोलिक सूचना प्रणाली सॉफ्टवेयर की तुलना
बाहरी संबंध
- Shapefile file extensions – Esri Webhelp docs for ArcGIS 10.0 (2010)
- Esri – Understanding Topology and Shapefiles
- shapelib.maptools.org – Free c library for reading/writing shapefiles
- Python Shapefile Library – Open Source (MIT License) Python library for reading/writing shapefiles
- Shapefile Projection Finder - Detect unknown projection of a shapefile automatically [6][7]
- Java Shapefile and Dbase Libraries – Open Source (Apache License) Java libraries for reading/writing shapefiles and the associated dBase files (libraries are part of the AFC Library but could be used independently)
संदर्भ
- ↑ 1.0 1.1 1.2 ESRI (July 1998). "ईएसआरआई शेपफाइल तकनीकी विवरण" (PDF). Retrieved 2007-07-04.
{{cite journal}}
: Cite journal requires|journal=
(help) - ↑ Rollason, Ed. "qgis - Creating missing .shx file?". Geographic Information Systems Stack Exchange.
- ↑ "Shapefile C Library V1.2".
- ↑ "एसबीएन प्रारूप" (PDF) (in English). 4 Oct 2011. Archived from the original (PDF) on 13 August 2016. Retrieved 21 June 2023.
- ↑ 5.0 5.1 "ArcGIS Desktop 9.3 Help – Geoprocessing considerations for shapefile output". Esri. April 24, 2009.
- ↑ Egger, Manfred. "Shapefile Projectionfinder" (PDF). www.egger-gis.at (in English).
- ↑ "Shapefile Projectionfinder".