शेपफ़ाइल

From Vigyanwiki
Shapefile
Simple vector map.svg
A vector map, with points, polylines and polygons
Filename extension.shp, .shx, .dbf
Internet media type
x-gis/x-shapefile
Developed byEsri
Type of formatGIS
StandardShapefile Technical Description

शेपफाइल प्रारूप भौगोलिक सूचना प्रणाली (जीआईएस) सॉफ्टवेयर के लिए एक भूस्थानिक सदिश डेटा प्रारूप है। इसे एएसआरआई द्वारा और अन्य भौगोलिक सूचना प्रणाली के बीच डेटा इंटरऑपरेबिलिटी के लिए एक खुले मानक के रूप में विकसित और विनियमित किया जाता है।[1] शेपफ़ाइल प्रारूप स्थानिक रूप से सदिश ग्राफिक्स सुविधाओं का वर्णन कर सकता है, जो बिंदु (ज्यामिति), पॉलीलाइन और बहुभुजों का उदाहरण के लिए पानी के कुएं नदियों और झीलों का प्रतिनिधित्व करते हैं और इस प्रकार प्रत्येक आइटम में एट्रिब्यूट (कंप्यूटिंग) इसका वर्णन करने वाले गुण का वर्णन करती है, जैसे नाम या तापमान इत्यादि।

अवलोकन

शेपफ़ाइल प्रारूप भौगोलिक स्थिति तथा उससे संबंधित एट्रिब्यूट सूचना के संग्रहीत करने के लिए एक डिजिटल सदिश भंडारण प्रारूप है। इस प्रारूप में भू-स्थानिक टोपोलॉजी जानकारी संग्रहीत करने की क्षमता का अभाव होता है। शेपफ़ाइल प्रारूप को 1990 के दशक के प्रारंभ में आर्कव्यू जी एस संस्करण 2 के साथ प्रस्तुत किया गया है और विभिन्न प्रकार के सॉफ़्टवेयर के साथ शेपफ़ाइल प्रारूप का उपयोग करके भौगोलिक डेटासेट को पढ़ना और लिखना अब संभव हो गया है।

शेपफ़ाइल प्रारूप ज्यामिति को बिंदुओं रेखाओं और बहुभुजों जैसी प्राचीन ज्यामितीय आकृतियों के रूप में संग्रहीत करता है। ये आकृतियाँ प्रत्येक आकृति से जुड़ी डेटा विशेषताओं के साथ भौगोलिक डेटा का प्रतिनिधित्व करती है। शेपफाइल शब्द बहुत सामान्य होते है, लेकिन प्रारूप में एक ही निर्देशिका (कंप्यूटिंग) में संग्रहीत सामान्य फ़ाइल नाम प्रीफिक्स वाली फ़ाइलों का संग्रह होता है और इस प्रकार तीन अनिवार्य फाइलों में फ़ाइल नाम एक्सटेंशन .shp, .shx, और .dbf.के रूप में होते है। वास्तविक शेपफ़ाइल विशेष रूप.shp फ़ाइल से संबंधित होती है, लेकिन वितरण के लिए अकेला अधूरा है क्योंकि अन्य सहायक फ़ाइलों की आवश्यकता होती है। यद्यपि आधुनिक सॉफ्टवेयर अनुप्रयोग लंबे नाम वाली फाइलों को स्वीकार करते हैं और इस प्रकार लीगेसी GIS सॉफ़्टवेयर के रूप में उम्मीद कर सकते हैं कि फ़ाइल नाम प्रीफिक्स को DOS 8.3 फ़ाइल नाम कन्वेंशन के अनुरूप आठ वर्णों तक सीमित किया जाता हैं।

अनिवार्य फ़ाइलें
  • .shp - आकार प्रारूप; फ़ीचर ज्यामिति और कंटेंट -प्रकार x-gis/x-शेपफ़ाइल के रूप में होते है।
  • .shx- आकार सूचकांक प्रारूप; फ़ीचर ज्यामिति का स्थितिगत सूचकांक जो आगे और पीछे की ओर शीघ्रता से खोज करने की अनुमति देता है और कंटेंट -प्रकार x-gis/x शेपफ़ाइल के रूप में होते है।
  • .dbf - एट्रिब्यूट प्रारूप; प्रत्येक आकृति के लिए कॉलुम्नार विशेषताएँ, dBase IV प्रारूप में कंटेंट प्रकार अनुप्रयोग /ऑक्टेट-स्ट्रीम या टेक्स्ट/प्लैन के रूप में होते है।
अन्य फ़ाइलें
  • .prj - प्रक्षेपण विवरण, समन्वय संदर्भ प्रणालियों के प्रसिद्ध टेक्स्ट प्रतिनिधित्व का उपयोग करते हुए कंटेंट -प्रकार टेक्स्ट /प्लैन या अनुप्रयोग /टेक्स्ट के रूप में होते है।
  • .sbn और .sbx - सुविधाओं का एक स्थानिक सूचकांक कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में होते है।
  • .fbn और .fbx - सुविधाओं का एक स्थानिक सूचकांक जो केवल पढ़ने के लिए है कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।
  • .ain और .aih - तालिका में सक्रिय क्षेत्र का एक एट्रिब्यूट सूचकांक कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।
  • .ixs - पढ़ने-लिखने वाले डेटासेट के लिए एक जियोकोडिंग इंडेक्स कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।
  • .mxs - पढ़ने-लिखने वाले डेटासेट के लिए एक जियोकोडिंग इंडेक्स ओडीबी प्रारूप कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।
  • .atx - के लिए एक एट्रिब्यूट सूचकांक .dbf फ़ाइल के रूप में शेपफ़ाइल .columnname.atx ArcGIS 8 और बाद के संस्करण कंटेंट प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।
  • .shp.xml - XML ​​प्रारूप में भू-स्थानिक मेटाडेटा, जैसे ISO 19115 या अन्य XML स्कीमा कंटेंट -प्रकार: अनुप्रयोग /fgdc+xml के रूप में उपयोग होते है।
  • .cpg - कोड पेज को निर्दिष्ट करने के लिए उपयोग किया जाता है और इस प्रकार .dbf) उपयोग किए जाने वाले अक्षरों को सांकेतिक अक्षरों में बदलना की पहचान के लिए कंटेंट -प्रकार टेक्स्ट/प्लैन या x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।
  • .qix - मानचित्र सर्वर और GDAL/OGR सॉफ़्टवेयर द्वारा उपयोग किया जाने वाला एक वैकल्पिक क्वाडट्री स्थानिक सूचकांक {कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।

और इस प्रकार प्रत्येक में .shp, .shx, और .dbf फ़ाइलें में आकृतियाँ अनुक्रम में एक दूसरे से मेल खाती हैं, अर्थात पहला रिकॉर्ड .shp फ़ाइल पहले रिकॉर्ड से मेल खाती है .shx और .dbf फ़ाइलें, इत्यादि रूप में होती है। जबकि .shp और .shx फ़ाइलों में भिन्न -भिन्न एंडियननेस वाले विभिन्न क्षेत्र होते हैं, इसलिए फ़ाइल स्वरूपों के कार्यान्वयनकर्ता को प्रत्येक क्षेत्र की एंडियननेस का सम्मान करने और उसके साथ उचित व्यवहार करने के लिए बहुत सावधान रहना चाहिए।

शेपफाइल शेप प्रारूप(.shp)

मुख्य फ़ाइल (.shp) में ज्यामिति डेटा के रूप में सम्मलित होते है। किसी दिए गए फीचर की ज्यामिति को सदिश निर्देशांक के एक सेट के रूप में संग्रहीत किया जाता है।[1]: 5  बाइनरी फ़ाइल में निश्चित-लंबाई वाला हेडर (कंप्यूटिंग) होता है जिसके बाद एक या अधिक चर-लंबाई के रिकॉर्ड होते है। प्रत्येक चर-लंबाई रिकॉर्ड में एक रिकॉर्ड हेडर घटक और एक रिकॉर्ड कंटेंट घटक के रूप में सम्मलित होता है और इस प्रकार फ़ाइल स्वरूप का विस्तृत विवरण ESRI शेपफ़ाइल प्रोद्योगिकीय विवरण में दिया गया है।[1] इस प्रारूप को ऑटोकैड आकार फ़ॉन्ट स्रोत प्रारूप के साथ भ्रमित नहीं होता है, जो इसे साझा करता है .shp विस्तार।

समन्वय डेटा का 2डी अक्ष क्रम (XY) या (ईस्टिंग नॉर्थिंग) क्रम का उपयोग करके कार्टेशियन समन्वय प्रणाली मानता है। यह अक्ष क्रम भौगोलिक समन्वय प्रणालियों के लिए सुसंगत है, जहां क्रम समान (देशांतर अक्षांश) है। ऊंचाई और माप के लिए ज्यामिति क्रमशः 3- या 4-आयामी Z और M निर्देशांक का भी समर्थन कर सकती है। एक Z-आयाम त्रि-आयामी अंतरिक्ष में प्रत्येक समन्वय की ऊंचाई को संग्रहीत करता है, जिसका उपयोग विश्लेषण के लिए या 3डी कंप्यूटर ग्राफिक्स का उपयोग करके ज्यामिति के दृश्य के लिए किया जा सकता है। उपयोगकर्ता-परिभाषित एम आयाम का उपयोग कई कार्यों में से एक के लिए किया जा सकता है, जैसे कि रैखिक संदर्भ उपायों या चार-आयामी अंतरिक्ष में किसी सुविधा के सापेक्ष समय को संग्रहीत करना।

मुख्य फ़ाइल हेडर की लंबाई 100 बाइट्स तय की गई है और इसमें 17 क्षेत्र हैं; नौ 4-बाइट (32-बिट हस्ताक्षरित पूर्णांक या int32) पूर्णांक क्षेत्र और उसके बाद आठ 8-बाइट (दोहरी सुनिश्चितता ) हस्ताक्षरित फ़्लोटिंग पॉइंट फ़ील्ड:

Header of a .shp file format
Bytes Type Endianness Usage
0–3 int32 big File code (always hex value 0x0000270a)
4–23 int32 big Unused; five uint32
24–27 int32 big File length (in 16-bit words, including the header)
28–31 int32 little Version
32–35 int32 little Shape type (see reference below)
36–67 double little Minimum bounding rectangle (MBR) of all shapes contained within the dataset; four doubles in the following order: min X, min Y, max X, max Y
68–83 double little Range of Z; two doubles in the following order: min Z, max Z
84–99 double little Range of M; two doubles in the following order: min M, max M

फ़ाइल में किसी भी संख्या में चर-लंबाई रिकॉर्ड सम्मलित होते हैं। प्रत्येक रिकॉर्ड के पहले 8 बाइट्स का रिकॉर्ड हेडर लगा होता है:

Bytes Type Endianness Usage
0–3 int32 big Record number (1-based)
4–7 int32 big Record length (in 16-bit words)

रिकॉर्ड हेडर के बाद वास्तविक रिकॉर्ड है:

Bytes Type Endianness Usage
0–3 int32 little Shape type (see reference below)
4– Shape content

चर-लंबाई रिकॉर्ड कंटेंट आकार प्रकार पर निर्भर करती है, जो या तो फ़ाइल हेडर में दिए गए आकार प्रकार या शून्य होनी चाहिए। निम्नलिखित संभावित आकार प्रकार हैं:

Value Shape type Fields
0 Null shape None
1 Point X, Y
3 Polyline MBR, Number of parts, Number of points, Parts, Points
5 Polygon MBR, Number of parts, Number of points, Parts, Points
8 MultiPoint MBR, Number of points, Points
11 PointZ X, Y, Z

Optional: M

13 PolylineZ Mandatory: MBR, Number of parts, Number of points, Parts, Points, Z range, Z array

Optional: M range, M array

15 PolygonZ Mandatory: MBR, Number of parts, Number of points, Parts, Points, Z range, Z array

Optional: M range, M array

18 MultiPointZ Mandatory: MBR, Number of points, Points, Z range, Z array

Optional: M range, M array

21 PointM X, Y, M
23 PolylineM Mandatory: MBR, Number of parts, Number of points, Parts, Points

Optional: M range, M array

25 PolygonM Mandatory: MBR, Number of parts, Number of points, Parts, Points

Optional: M range, M array

28 MultiPointM Mandatory: MBR, Number of points, Points

Optional Fields: M range, M array

31 MultiPatch Mandatory: MBR, Number of parts, Number of points, Parts, Part types, Points, Z range, Z array

Optional: M range, M array


शेपफाइल आकार सूचकांक प्रारूप (.shx)

सूचकांक में फ़ीचर ज्यामिति का स्थितीय सूचकांक और समान 100-बाइट हेडर सम्मलित है .shp फ़ाइल, जिसके बाद किसी भी संख्या में 8-बाइट निश्चित-लंबाई वाले रिकॉर्ड होते हैं, जिसमें निम्नलिखित दो क्षेत्र सम्मलित होते हैं:

Bytes Type Endianness Usage
0–3 int32 big Record offset (in 16-bit words)
4–7 int32 big Record length (in 16-bit words)

इस सूचकांक का उपयोग करके, पहले आकार सूचकांक में पीछे की ओर खोज करना संभव है (जो संभव है क्योंकि यह निश्चित-लंबाई रिकॉर्ड का उपयोग करता है), फिर रिकॉर्ड ऑफसेट को पढ़ना, और उस ऑफसेट का उपयोग करके खोज करना संभव है में सही स्थिति .shp फ़ाइल। एक ही विधि का उपयोग करके मनमाने ढंग से रिकॉर्ड की संख्या को आगे बढ़ाना भी संभव है।

अकेले दिए गए संपूर्ण इंडेक्स फ़ाइल को उत्पन्न करना संभव है .shp फ़ाइल। हालाँकि, चूंकि शेपफाइल में हमेशा एक इंडेक्स होना चाहिए, ऐसा करना एक भ्रष्ट फ़ाइल की मरम्मत के रूप में गिना जाता है।[2]


शेपफाइल एट्रिब्यूट प्रारूप (.dbf)

यह फ़ाइल प्रत्येक आकृति के लिए विशेषताओं को संग्रहीत करती है; यह dBase IV प्रारूप का उपयोग करता है। प्रारूप सार्वजनिक ज्ञान है, और इसे कई dBase क्लोनों में लागू किया गया है जिन्हें xBase के नाम से जाना जाता है। उदाहरण के लिए, ओपन-सोर्स शेपफाइल सी लाइब्रेरी अपने प्रारूप को xBase कहती है, भले ही यह प्लैन dBase IV हो।[3] विशेषताओं के नाम और मान मानकीकृत नहीं हैं, और आकृति फ़ाइल के स्रोत के आधार पर भिन्न होंगे।

शेपफ़ाइल स्थानिक सूचकांक प्रारूप (.sbn)

यह एक बाइनरी स्थानिक सूचकांक फ़ाइल है, जिसका उपयोग केवल Esri सॉफ़्टवेयर द्वारा किया जाता है। प्रारूप Esri द्वारा प्रलेखित नहीं है। हालाँकि इसे ओपन सोर्स समुदाय द्वारा रिवर्स-इंजीनियरिंग और दस्तावेजीकरण किया गया है। 100-बाइट हेडर इसके समान है .shp.[4] यह वर्तमान में अन्य विक्रेताओं द्वारा कार्यान्वित नहीं किया गया है। .sbn}bn फ़ाइल पूरी तरह से आवश्यक नहीं है, क्योंकि .shp फ़ाइल में स्थानिक डेटा को सफलतापूर्वक पार्स करने के लिए आवश्यक सभी जानकारी सम्मलित है।

सीमाएँ

टोपोलॉजी और शेपफाइल प्रारूप

शेपफ़ाइल प्रारूप में टोपोलॉजी जानकारी संग्रहीत करने की क्षमता नहीं है। ईएसआरआई आर्कइन्फो कवरेज डेटा#जीआईएस प्रारूप और व्यक्तिगत/फ़ाइल/उद्यम जियोडेटाबेस में फीचर टोपोलॉजी को संग्रहीत करने की क्षमता है।

स्थानिक प्रतिनिधित्व

पॉलीलाइन या बहुभुज के किनारे बिंदुओं से बने होते हैं। बिंदुओं का अंतर स्पष्ट रूप से उस पैमाने को निर्धारित करता है जिस पर सुविधा दृष्टिगत रूप से उपयोगी है। उस पैमाने से अधिक होने पर प्रतिनिधित्व अनियमित हो जाता है। बड़े पैमाने पर चिकनी आकृतियाँ प्राप्त करने के लिए अतिरिक्त बिंदुओं की आवश्यकता होगी। चिकनी वक्रों द्वारा बेहतर प्रतिनिधित्व वाली सुविधाओं के लिए, बहुभुज प्रतिनिधित्व के लिए, उदाहरण के लिए, स्प्लाइन (गणित) की तुलना में बहुत अधिक डेटा भंडारण की आवश्यकता होती है, जो सुचारू रूप से भिन्न -भिन्न आकृतियों को कुशलतापूर्वक कैप्चर कर सकता है। कोई भी शेपफ़ाइल प्रारूप प्रकार स्प्लिंस का समर्थन नहीं करता है।

डेटा भंडारण

दोनों का आकार .shp और .dbf घटक फ़ाइलें 2 जीबी (या 231बाइट्स) - लगभग 70 मिलियन पॉइंट फ़ीचर।[5] अन्य ज्यामिति प्रकारों के लिए फीचर की अधिकतम संख्या उपयोग किए गए शीर्षों की संख्या के आधार पर भिन्न होती है।

के लिए एट्रिब्यूट डेटाबेस प्रारूप .dbf घटक फ़ाइल पुराने dBase मानक पर आधारित है। इस डेटाबेस प्रारूप में स्वाभाविक रूप से कई सीमाएँ हैं:[5]*जबकि वर्तमान dBase मानक, और GDAL|GDAL/OGR (शेपफाइल प्रारूप डेटासेट को पढ़ने और लिखने के लिए मुख्य ओपन सोर्स सॉफ़्टवेयर लाइब्रेरी) Null (SQL) मानों का समर्थन करते हैं, ESRI सॉफ़्टवेयर इन मानों को शून्य के रूप में प्रस्तुत करता है - मात्रात्मक विश्लेषण के लिए एक बहुत ही गंभीर मुद्दा डेटा, क्योंकि यदि शून्य मात्राओं को शून्य के रूप में दर्शाया जाता है तो यह प्रतिनिधित्व और आंकड़ों को विकृत कर सकता है

  • यूनिकोड क्षेत्र नाम या क्षेत्र संग्रहण के लिए ख़राब समर्थन
  • क्षेत्र नामों की अधिकतम लंबाई 10 अक्षर है
  • क्षेत्र की अधिकतम संख्या 255 है
  • समर्थित क्षेत्र प्रकार हैं: फ़्लोटिंग पॉइंट (13 वर्ण संग्रहण), पूर्णांक (4 या 9 वर्ण संग्रहण), दिनांक (कोई समय संग्रहण नहीं; 8 वर्ण संग्रहण), और टेक्स्ट (अधिकतम 254 वर्ण संग्रहण)
  • फ्लोटिंग पॉइंट नंबरों में राउंडिंग त्रुटियां हो सकती हैं क्योंकि उन्हें टेक्स्ट के रूप में संग्रहीत किया जाता है

मिश्रण आकार प्रकार

क्योंकि आकृति प्रकार प्रत्येक ज्यामिति रिकॉर्ड से पहले होता है, एक आकृति फ़ाइल प्रोद्योगिकीय रूप से विभिन्न आकार प्रकारों के मिश्रण को संग्रहीत करने में सक्षम होती है। हालाँकि, विनिर्देश में कहा गया है, एक शेपफाइल में सभी गैर-शून्य आकृतियों को एक ही आकार प्रकार का होना आवश्यक है। इसलिए, आकार प्रकारों को मिश्रित करने की यह क्षमता फ़ाइल के शीर्षलेख में घोषित एकल आकार प्रकार के साथ शून्य आकृतियों को जोड़ने तक सीमित होनी चाहिए। एक शेपफाइल में पॉलीलाइन और पॉलीगॉन दोनों डेटा नहीं होने चाहिए, उदाहरण के लिए, एक कुएं (बिंदु), एक नदी (पॉलीलाइन), और एक झील (बहुभुज) का विवरण तीन भिन्न -भिन्न डेटासेट में संग्रहीत किया जाएगा।

यह भी देखें

बाहरी संबंध


संदर्भ

  1. 1.0 1.1 1.2 ESRI (July 1998). "ईएसआरआई शेपफाइल तकनीकी विवरण" (PDF). Retrieved 2007-07-04. {{cite journal}}: Cite journal requires |journal= (help)
  2. Rollason, Ed. "qgis - Creating missing .shx file?". Geographic Information Systems Stack Exchange.
  3. "Shapefile C Library V1.2".
  4. "एसबीएन प्रारूप" (PDF) (in English). 4 Oct 2011. Archived from the original (PDF) on 13 August 2016. Retrieved 21 June 2023.
  5. 5.0 5.1 "ArcGIS Desktop 9.3 Help – Geoprocessing considerations for shapefile output". Esri. April 24, 2009.
  6. Egger, Manfred. "Shapefile Projectionfinder" (PDF). www.egger-gis.at (in English).
  7. "Shapefile Projectionfinder".