शेपफ़ाइल
Filename extension | .shp , .shx , .dbf |
---|---|
Internet media type |
x-gis/x-shapefile |
Developed by | Esri |
Type of format | GIS |
Standard | Shapefile Technical Description |
शेपफाइल प्रारूप भौगोलिक सूचना प्रणाली (जीआईएस) सॉफ्टवेयर के लिए एक भूस्पैटियल सदिश डेटा प्रारूप है। इसे एएसआरआई द्वारा और अन्य भौगोलिक सूचना प्रणाली के बीच डेटा इंटरऑपरेबिलिटी के लिए एक खुले मानक के रूप में विकसित और विनियमित किया जाता है।[1] शेपफ़ाइल प्रारूप स्पैटियल रूप से सदिश ग्राफिक्स सुविधाओं का वर्णन कर सकता है, जो बिंदु (ज्यामिति), पॉलीलाइन और बहुभुजों का उदाहरण के लिए पानी के कुएं नदियों और झीलों का प्रतिनिधित्व करते हैं और इस प्रकार प्रत्येक आइटम में एट्रिब्यूट (कंप्यूटिंग) इसका वर्णन करने वाले गुण का वर्णन करती है, जैसे नाम या तापमान इत्यादि।
अवलोकन
शेपफ़ाइल प्रारूप भौगोलिक स्थिति तथा उससे संबंधित एट्रिब्यूट सूचना के संग्रहीत करने के लिए एक डिजिटल सदिश भंडारण प्रारूप है। इस प्रारूप में भू-स्पैटियल टोपोलॉजी जानकारी संग्रहीत करने की क्षमता का अभाव होता है। शेपफ़ाइल प्रारूप को 1990 के दशक के प्रारंभ में आर्कव्यू जी एस संस्करण 2 के साथ प्रस्तुत किया गया है और विभिन्न प्रकार के सॉफ़्टवेयर के साथ शेपफ़ाइल प्रारूप का उपयोग करके भौगोलिक डेटासेट को पढ़ना और लिखना अब संभव हो गया है।
शेपफ़ाइल प्रारूप ज्यामिति को बिंदुओं रेखाओं और बहुभुजों जैसी प्राचीन ज्यामितीय आकृतियों के रूप में संग्रहीत करता है। ये आकृतियाँ प्रत्येक आकृति से जुड़ी डेटा एट्रिब्यूट के साथ भौगोलिक डेटा का प्रतिनिधित्व करती है। शेपफाइल शब्द बहुत सामान्य होते है, लेकिन प्रारूप में एक ही निर्देशिका (कंप्यूटिंग) में संग्रहीत सामान्य फ़ाइल नाम प्रीफिक्स वाली फ़ाइलों का संग्रह होता है और इस प्रकार तीन अनिवार्य फाइलों में फ़ाइल नाम एक्सटेंशन .shp
, .shx
, और .dbf
.के रूप में होते है। वास्तविक शेपफ़ाइल विशेष रूप.shp
फ़ाइल से संबंधित होती है, लेकिन वितरण के लिए अकेला अधूरा है क्योंकि अन्य सहायक फ़ाइलों की आवश्यकता होती है। यद्यपि आधुनिक सॉफ्टवेयर अनुप्रयोग लंबे नाम वाली फाइलों को स्वीकार करते हैं और इस प्रकार लीगेसी GIS सॉफ़्टवेयर के रूप में उम्मीद कर सकते हैं कि फ़ाइल नाम प्रीफिक्स को DOS 8.3 फ़ाइल नाम कन्वेंशन के अनुरूप आठ वर्णों तक सीमित किया जाता हैं।
- अनिवार्य फ़ाइलें
.shp
- आकार प्रारूप; फ़ीचर ज्यामिति और कंटेंट -प्रकार x-gis/x-शेपफ़ाइल के रूप में होते है।.shx
- आकार सूचकांक प्रारूप; फ़ीचर ज्यामिति का स्थितिगत सूचकांक जो आगे और पीछे की ओर शीघ्रता से खोज करने की अनुमति देता है और कंटेंट -प्रकार x-gis/x शेपफ़ाइल के रूप में होते है।.dbf
- एट्रिब्यूट प्रारूप; प्रत्येक आकृति के लिए कॉलुम्नार विशेषताएँ, dBase IV प्रारूप में कंटेंट प्रकार अनुप्रयोग /ऑक्टेट-स्ट्रीम या टेक्स्ट/प्लैन के रूप में होते है।
- अन्य फ़ाइलें
.prj
- प्रक्षेपण विवरण, निर्देशांक संदर्भ प्रणालियों के प्रसिद्ध टेक्स्ट प्रतिनिधित्व का उपयोग करते हुए कंटेंट -प्रकार टेक्स्ट /प्लैन या अनुप्रयोग /टेक्स्ट के रूप में होते है।.sbn
और.sbx
- सुविधाओं का एक स्पैटियल सूचकांक कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में होते है।.fbn
और.fbx
- सुविधाओं का एक स्पैटियल सूचकांक जो केवल पढ़ने के लिए है कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।.ain
और.aih
- तालिका में सक्रिय क्षेत्र का एक एट्रिब्यूट सूचकांक कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।.ixs
- पढ़ने-लिखने वाले डेटासेट के लिए एक जियोकोडिंग इंडेक्स कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।.mxs
- पढ़ने-लिखने वाले डेटासेट के लिए एक जियोकोडिंग इंडेक्स ओडीबी प्रारूप कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।.atx
- के लिए एक एट्रिब्यूट सूचकांक.dbf
फ़ाइल के रूप मेंशेपफ़ाइल .columnname.atx
ArcGIS 8 और बाद के संस्करण कंटेंट प्रकार:x-gis/x-शेपफ़ाइल
के रूप में उपयोग होते है।.shp.xml
- XML प्रारूप में भू-स्पैटियल मेटाडेटा, जैसे ISO 19115 या अन्य XML स्कीमा कंटेंट -प्रकार: अनुप्रयोग /fgdc+xml के रूप में उपयोग होते है।.cpg
- कोड पेज को निर्दिष्ट करने के लिए उपयोग किया जाता है और इस प्रकार.dbf
) उपयोग किए जाने वाले अक्षरों को सांकेतिक अक्षरों में बदलना की पहचान के लिए कंटेंट -प्रकार टेक्स्ट/प्लैन या x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।.qix
- मानचित्र सर्वर और GDAL/OGR सॉफ़्टवेयर द्वारा उपयोग किया जाने वाला एक वैकल्पिक क्वाडट्री स्पैटियल सूचकांक {कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।
और इस प्रकार प्रत्येक में .shp
, .shx
, और .dbf
फ़ाइलें में आकृतियाँ अनुक्रम में एक दूसरे से मेल खाती हैं, अर्थात पहला रिकॉर्ड .shp
फ़ाइल पहले रिकॉर्ड से मेल खाती है .shx
और .dbf
फ़ाइलें, इत्यादि रूप में होती है। जबकि .shp
और .shx
फ़ाइलों में भिन्न -भिन्न एंडियननेस वाले विभिन्न क्षेत्र होते हैं, इसलिए फ़ाइल स्वरूपों के कार्यान्वयनकर्ता को प्रत्येक क्षेत्र की एंडियननेस का सम्मान करने और उसके साथ उचित व्यवहार करने के लिए बहुत सावधान रहना चाहिए।
शेपफाइल शेप प्रारूप(.shp)
मुख्य फ़ाइल (.shp) में ज्यामिति डेटा के रूप में सम्मलित होते है। किसी दिए गए फीचर की ज्यामिति को सदिश निर्देशांक के एक सेट के रूप में संग्रहीत किया जाता है।[1]: 5 बाइनरी फ़ाइल में निश्चित-लंबाई वाला हेडर (कंप्यूटिंग) होता है जिसके बाद एक या अधिक चर-लंबाई के रिकॉर्ड होते है। प्रत्येक चर-लंबाई रिकॉर्ड में एक रिकॉर्ड हेडर घटक और एक रिकॉर्ड कंटेंट घटक के रूप में सम्मलित होता है और इस प्रकार फ़ाइल स्वरूप का विस्तृत विवरण ईएसआरआई शेपफ़ाइल प्रोद्योगिकीय विवरण में दिया गया है।[1] इस प्रारूप को ऑटोकैड आकार फ़ॉन्ट स्रोत प्रारूप के साथ भ्रमित नहीं किया जाता है जो इसे.shp
के रूप में साझा करता है।
निर्देशांक डेटा का 2डी अक्ष क्रम (XY) या ईस्टिंग नॉर्थिंग क्रम का उपयोग करके कार्टेशियन निर्देशांक पद्धति के रूप में जाना जाता है। यह अक्ष क्रम भौगोलिक निर्देशांक प्रणालियों के लिए कम्पेटिबिलिटी है, जहां क्रम समान रूप से देशांतर अक्षांश के रूप में है और ऊंचाई और माप के लिए ज्यामिति क्रमशः 3- या 4-आयामी Z और M निर्देशांक का समर्थन करती है। एक Z-आयाम त्रि-आयामी क्षेत्र में प्रत्येक निर्देशांक की ऊंचाई को संग्रहीत करता है, जिसका उपयोग विश्लेषण के लिए या 3डी कंप्यूटर ग्राफिक्स का उपयोग करके ज्यामिति के विज़ुअलाइज़ेशन के लिए किया जा सकता है और इस प्रकार उपयोगकर्ता-परिभाषित M आयाम का उपयोग कई कार्यों में से एक के लिए किया जा सकता है, जैसे कि रैखिक संदर्भ माप या 4D-आयामी क्षेत्र में किसी सुविधा के सापेक्ष समय को संग्रहीत करता है।
मुख्य फ़ाइल हेडर की लंबाई 100 बाइट्स तय की गई है और इसमें 17 क्षेत्र हैं; जबकि नौ 4-बाइट 32-बिट हस्ताक्षरित पूर्णांक या int32 पूर्णांक क्षेत्र और उसके बाद आठ 8-बाइट दोहरी सुनिश्चितता हस्ताक्षरित फ़्लोटिंग पॉइंट क्षेत्र होते है,
बाइट्स | प्रकार | एंडियननेस | प्रयोग |
---|---|---|---|
0–3 | int32 | big | फ़ाइल कोड (हेक्स मान 0x0000270a) |
4–23 | int32 | big | अप्रयुक्त; five uint32 |
24–27 | int32 | big | फ़ाइल की लंबाई (हेडर सहित 16-बिट शब्दों में) |
28–31 | int32 | little | संस्करण |
32–35 | int32 | little | आकार प्रकार (नीचे संदर्भ देखें) |
36–67 | double | little | डेटासेट के भीतर उपस्थित सभी आकृतियों की न्यूनतम बाउंडिंग आयत (एमबीआर); निम्नलिखित क्रम में चार युगल: न्यूनतम X, न्यूनतम Y, अधिकतम X, अधिकतम Y के रूप में होती है |
68–83 | double | little | ज़ेड की रेंज; निम्नलिखित क्रम में दो युगल: min Z, max Z होती है |
84–99 | double | little | एम की रेंज; निम्नलिखित क्रम में दो युगल: min M, max M होती है |
फ़ाइल में किसी भी संख्या में चर-लंबाई रिकॉर्ड सम्मलित होते हैं। प्रत्येक रिकॉर्ड के पहले 8 बाइट्स का रिकॉर्ड हेडर लगा होता है:
बाइट्स | प्रकार | एंडियननेस | प्रयोग |
---|---|---|---|
0–3 | int32 | big | Record number (1-based) |
4–7 | int32 | big | Record length (in 16-bit words) |
रिकॉर्ड हेडर के बाद वास्तविक रिकॉर्ड है:
बाइट्स | प्रकार | एंडियननेस | प्रयोग |
---|---|---|---|
0–3 | int32 | little | आकार प्रकार (नीचे संदर्भ देखें) |
4– | – | – | कंटेंट को आकार दें |
चर-लंबाई रिकॉर्ड कंटेंट आकार प्रकार पर निर्भर करती है, जो या तो फ़ाइल हेडर में दिए गए आकार प्रकार या शून्य के रूप में होनी चाहिए। निम्नलिखित संभावित आकार प्रकार हैं,
Value | Shape type | Fields |
---|---|---|
0 | Null shape | None |
1 | Point | X, Y |
3 | Polyline | MBR, Number of parts, Number of points, Parts, Points |
5 | Polygon | MBR, Number of parts, Number of points, Parts, Points |
8 | MultiPoint | MBR, Number of points, Points |
11 | PointZ | X, Y, Z Optional: M |
13 | PolylineZ | Mandatory: MBR, Number of parts, Number of points, Parts, Points, Z range, Z array Optional: M range, M array |
15 | PolygonZ | Mandatory: MBR, Number of parts, Number of points, Parts, Points, Z range, Z array Optional: M range, M array |
18 | MultiPointZ | Mandatory: MBR, Number of points, Points, Z range, Z array Optional: M range, M array |
21 | PointM | X, Y, M |
23 | PolylineM | Mandatory: MBR, Number of parts, Number of points, Parts, Points Optional: M range, M array |
25 | PolygonM | Mandatory: MBR, Number of parts, Number of points, Parts, Points Optional: M range, M array |
28 | MultiPointM | Mandatory: MBR, Number of points, Points Optional Fields: M range, M array |
31 | MultiPatch | Mandatory: MBR, Number of parts, Number of points, Parts, Part types, Points, Z range, Z array Optional: M range, M array |
शेपफाइल आकार सूचकांक प्रारूप (.shx)
सूचकांक में फ़ीचर ज्यामिति का स्थितीय सूचकांक और समान 100-बाइट हेडर के रूप में सम्मलित है और इस प्रकार.shp
फ़ाइल जिसके किसी भी संख्या में 8-बाइट निश्चित-लंबाई वाले रिकॉर्ड होते हैं, जिसमें निम्नलिखित दो क्षेत्र सम्मलित होते हैं:
बाइट्स | प्रकार | एंडियननेस | प्रयोग |
---|---|---|---|
0–3 | int32 | big | रिकॉर्ड ऑफ़सेट (16-बिट शब्दों में) |
4–7 | int32 | big | रिकॉर्ड लंबाई (16-बिट शब्दों में) |
इस सूचकांक का उपयोग करके पहले आकार सूचकांक में पीछे की ओर खोज करना संभव होता है, क्योंकि यह निश्चित-लंबाई रिकॉर्ड का उपयोग करता है फिर रिकॉर्ड ऑफसेट को पढ़ना और उस ऑफसेट का उपयोग करके खोज करना संभव होता है और इस प्रकार की सही स्थिति .shp
फ़ाइल के रूप में होती है। एक ही विधि का उपयोग करके यादृच्छिक ढंग से रिकॉर्ड की संख्या को आगे बढ़ाना संभव होता है।
अकेले दिए गए .shp
फ़ाइल संपूर्ण इंडेक्स फ़ाइल को उत्पन्न करना संभव है, चूंकि शेपफाइल में अधिकांशतः एक इंडेक्स होना चाहिए, ऐसा करना एक भ्रष्ट फ़ाइल की मरम्मत के रूप में गिना जाता है।[2]
शेपफाइल एट्रिब्यूट प्रारूप (.dbf)
यह फ़ाइल प्रत्येक आकृति के लिए एट्रिब्यूट को संग्रहीत करती है; यह dBase IV प्रारूप का उपयोग करता है। इस प्रकार प्रारूप सार्वजनिक ज्ञान के रूप में है और इसे कई dBase क्लोनों में प्रयुक्त किया जाता है जिन्हें xBase के नाम से जाना जाता है। उदाहरण के लिए ओपन-सोर्स शेपफाइल सी लाइब्रेरी अपने प्रारूप को xBase के रूप में होती है और भले ही यह प्लैन dBase IV के रूप में प्रयुक्त किया जाता है।[3] एट्रिब्यूट के नाम और मान मानकीकृत नहीं हैं और आकृति फ़ाइल के स्रोत के आधार पर भिन्न होती है।
शेपफ़ाइल स्पैटियल सूचकांक प्रारूप (.sbn)
यह एक बाइनरी स्पैटियल सूचकांक फ़ाइल है, जिसका उपयोग केवल ईएसआरआई सॉफ़्टवेयर द्वारा किया जाता है। इस प्रकार प्रारूप ईएसआरआई द्वारा प्रलेखित नहीं है। चूंकि इसे ओपन सोर्स कम्युनिटी द्वारा रिवर्स-इंजीनियरिंग और दस्तावेजीकरण किया गया है। 100-बाइट हेडर .shp के समान है.[4] यह वर्तमान में अन्य विक्रेताओं द्वारा कार्यान्वित नहीं किया जाता है। .sbn}bn
फ़ाइल पूरी तरह से आवश्यक नहीं है, क्योंकि .shp
फ़ाइल में स्पैटियल डेटा को सफलतापूर्वक पार्स करने के लिए आवश्यक सभी जानकारी सम्मलित है।
सीमाएँ
टोपोलॉजी और शेपफाइल प्रारूप
शेपफ़ाइल प्रारूप में टोपोलॉजी जानकारी संग्रहीत करने की क्षमता नहीं होती है। ईएसआरआई आर्कइन्फो कवरेज डेटा जीआईएस प्रारूप और व्यक्तिगत/फ़ाइल/उद्यम जियोडेटाबेस में फीचर टोपोलॉजी को संग्रहीत करने की क्षमता है।
स्पैटियल प्रतिनिधित्व
पॉलीलाइन या बहुभुज के किनारे बिंदुओं से बने होते हैं। बिंदुओं का अंतर स्पष्ट रूप से उस पैमाने को निर्धारित करता है, जिस पर सुविधा दृष्टिगत रूप से उपयोगी होती है। उस पैमाने से अधिक होने पर प्रतिनिधित्व अनियमित हो जाता है। बड़े पैमाने पर स्मूथ आकृतियाँ प्राप्त करने के लिए अतिरिक्त बिंदुओं की आवश्यकता होती है। स्मूथ वक्रों द्वारा बेहतर प्रतिनिधित्व वाली सुविधाओं के लिए बहुभुज प्रतिनिधित्व के लिए होती है , उदाहरण के लिए स्प्लाइन (गणित) की तुलना में बहुत अधिक डेटा भंडारण की आवश्यकता होती है, जो सुचारू रूप से भिन्न -भिन्न आकृतियों को कुशलतापूर्वक कैप्चर कर सकता है। कोई भी शेपफ़ाइल प्रारूप प्रकार स्प्लिंस का समर्थन नहीं करता है।
डेटा भंडारण
दोनों का आकार .shp
और .dbf
घटक फ़ाइलें 2 जीबी या 231बाइट्स लगभग 70 मिलियन पॉइंट फ़ीचर के रूप में होता है।[5] अन्य ज्यामिति प्रकारों के लिए फीचर की अधिकतम संख्या उपयोग किए गए शीर्षों की संख्या के आधार पर भिन्न होती है।
.dbf
घटक फ़ाइल के लिए एट्रिब्यूट डेटाबेस प्रारूप एक पुराने DBase मानक पर आधारित होता है। इस डेटाबेस प्रारूप में स्वाभाविक रूप से कई सीमाएँ होती हैं:[5]* जबकि वर्तमान dBase मानक और GDAL/OGR शेपफाइल प्रारूप डेटासेट को पढ़ने और लिखने के लिए मुख्य ओपन सोर्स सॉफ़्टवेयर लाइब्रेरी Null (SQL) मानों का समर्थन करते हैं, ईएसआरआई सॉफ़्टवेयर इन मानों को शून्य के रूप में प्रस्तुत करता है और इस प्रकार मात्रात्मक विश्लेषण के लिए एक बहुत ही गंभीर विषय डेटा के रूप में होते है, क्योंकि यदि शून्य मात्राओं को शून्य के रूप में दर्शाया जाता है तो यह प्रतिनिधित्व और आंकड़ों को विकृत कर सकता है
- यूनिकोड क्षेत्र नाम या क्षेत्र स्टोरेज के लिए ख़राब समर्थन होता है
- क्षेत्र नामों की अधिकतम लंबाई 10 अक्षर है
- क्षेत्र की अधिकतम संख्या 255 है
- समर्थित क्षेत्र प्रकार हैं: फ़्लोटिंग पॉइंट (13 वर्ण स्टोरेज( पूर्णांक (4 या 9 वर्ण स्टोरेज) , दिनांक (कोई समय स्टोरेज नहीं; 8 वर्ण स्टोरेज ) और टेक्स्ट (अधिकतम 254 वर्ण स्टोरेज) के रूप में संग्रहीत किया जाता है
- फ्लोटिंग पॉइंट नंबरों में राउंडिंग त्रुटियां हो सकती हैं क्योंकि उन्हें टेक्स्ट के रूप में संग्रहीत किया जाता है
मिश्रण आकार प्रकार
क्योंकि आकृति प्रकार प्रत्येक ज्यामिति रिकॉर्ड से पहले होता है, एक आकृति फ़ाइल प्रोद्योगिकीय रूप से विभिन्न आकार प्रकारों के मिश्रण को संग्रहीत करने में सक्षम होती है। हालाँकि, विनिर्देश में कहा गया है, एक शेपफाइल में सभी गैर-शून्य आकृतियों को एक ही आकार प्रकार का होना आवश्यक है। इसलिए, आकार प्रकारों को मिश्रित करने की यह क्षमता फ़ाइल के शीर्षलेख में घोषित एकल आकार प्रकार के साथ शून्य आकृतियों को जोड़ने तक सीमित होनी चाहिए। एक शेपफाइल में पॉलीलाइन और पॉलीगॉन दोनों डेटा नहीं होने चाहिए, उदाहरण के लिए, एक कुएं (बिंदु), एक नदी (पॉलीलाइन), और एक झील (बहुभुज) का विवरण तीन भिन्न -भिन्न डेटासेट में संग्रहीत किया जाएगा।
यह भी देखें
- भौगोलिक सूचना प्रणाली
- भू-स्पैटियल कंसोर्टियम खोलें
- ओपन सोर्स जियोस्पेशियल फाउंडेशन (OSGeo)
- भौगोलिक सूचना प्रणाली सॉफ्टवेयर की सूची
- भौगोलिक सूचना प्रणाली सॉफ्टवेयर की तुलना
बाहरी संबंध
- शेपफ़ाइल file extensions – ईएसआरआई Webhelp docs for ArcGIS 10.0 (2010)
- ईएसआरआई – Understanding Topology and शेपफ़ाइल s
- shapelib.maptools.org – Free c library for reading/writing शेपफ़ाइल s
- Python शेपफ़ाइल Library – Open Source (MIT License) Python library for reading/writing शेपफ़ाइल s
- शेपफ़ाइल Projection Finder - Detect unknown projection of a शेपफ़ाइल automatically [6][7]
- Java शेपफ़ाइल and Dbase Libraries – Open Source (Apache License) Java libraries for reading/writing शेपफ़ाइल s and the associated dBase files (libraries are part of the AFC Library but could be used independently)
संदर्भ
- ↑ 1.0 1.1 1.2 ESRI (July 1998). "ईएसआरआई शेपफाइल तकनीकी विवरण" (PDF). Retrieved 2007-07-04.
{{cite journal}}
: Cite journal requires|journal=
(help) - ↑ Rollason, Ed. "qgis - Creating missing .shx file?". Geographic Information Systems Stack Exchange.
- ↑ "Shapefile C Library V1.2".
- ↑ "एसबीएन प्रारूप" (PDF) (in English). 4 Oct 2011. Archived from the original (PDF) on 13 August 2016. Retrieved 21 June 2023.
- ↑ 5.0 5.1 "ArcGIS Desktop 9.3 Help – Geoprocessing considerations for shapefile output". Esri. April 24, 2009.
- ↑ Egger, Manfred. "Shapefile Projectionfinder" (PDF). www.egger-gis.at (in English).
- ↑ "Shapefile Projectionfinder".