पैनल डेटा

From Vigyanwiki

सांख्यिकी और अर्थमिति में, पैनल आँकड़े और अनुदैर्ध्य आँकड़े[1][2] दोनों बहु-आयामी आँकड़े हैं जिनमें समय के साथ माप शामिल हैं। पैनल आँकड़े अनुदैर्ध्य आँकड़े का एक उपसमुच्चय है जहां अवलोकन हर बार समान विषयों के लिए होते हैं।

टाइम सीरीज़ और क्रास सेक्शनल डाटा को पैनल आँकड़े के विशेष मामलों के रूप में माना जा सकता है जो केवल एक आयाम में हैं (एक पैनल सदस्य या पूर्व के लिए अलग अलग, बाद के लिए एक समय बिंदु)। एक साहित्य खोज में अक्सर समय श्रृंखला, क्रॉस-सेक्शनल या पैनल आँकड़े शामिल होते है। क्रॉस-पैनल आँकड़े (CPD) गणितीय और सांख्यिकीय विज्ञान में जानकारी का एक नवीन अभी तक कम अप्रमाणित वाला स्रोत है। CPD अन्य अनुसंधान प्रणालियों से अलग है क्योंकि यह स्पष्ट रूप से दिखाता है कि देशों के बीच स्वतंत्र और परतंत्र चर कैसे बदल सकते हैं। यह पैनल आँकड़े संग्रह शोधकर्ताओं को कई क्रॉस-सेक्शन और समय आवर्त में चर के बीच संबंध की जांच करने और अन्य देशों में नीतिगत कार्यों के परिणामों का विश्लेषण करने की अनुमति देता है।[3]

पैनल आँकड़े का उपयोग करने वाले अध्ययन को अनुदैर्ध्य अध्ययन या पैनल अध्ययन कहा जाता है।

उदाहरण

MRPP असंतुलित पैनल
व्यक्ति वर्ष आय आयु लिंग
1 2016 1300 27 1
1 2017 1600 28 1
1 2018 2000 29 1
2 2016 2000 38 2
2 2017 2300 39 2
2 2018 2400 40 2
MRPP असंतुलित पैनल
व्यक्ति वर्ष आय आयु लिंग
1 2016 1600 23 1
1 2017 1500 24 1
2 2016 1900 41 2
2 2017 2000 42 2
2 2018 2100 43 2
3 2017 3300 34 1

उपरोक्त एकाधिक प्रतिक्रिया क्रमचय प्रक्रिया (MRPP) उदाहरण में, पैनल संरचना वाले दो डेटासेट दिखाए गए हैं और इसका उद्देश्य यह परीक्षण करना है कि प्रतिचय आँकड़े में लोगों के बीच कोई सार्थकता अंतर है या नहीं। व्यक्तिगत विशेषताओं (आय, आयु, लिंग) को अलग-अलग व्यक्तियों और अलग-अलग वर्षों के लिए संकलित किया जाता है। पहले डेटासेट में तीन वर्ष (2016, 2017, 2018) के लिए प्रत्येक वर्ष दो व्यक्तियों (1, 2) का अवलोकन किया जाता है। दूसरे डेटासेट में, तीन व्यक्तियों (1, 2, 3) को तीन वर्षों (2016, 2017, 2018) में क्रमशः दो बार (व्यक्ति 1), तीन बार (व्यक्ति 2), और एक बार (व्यक्ति 3) देखा गया है। ; विशेष रूप से, व्यक्ति 1 वर्ष 2018 में नहीं देखा गया है और व्यक्ति 3 2016 या 2018 में नहीं देखा गया है।

एक संतुलित पैनल (उदाहरण के लिए, उपरोक्त पहला डेटासेट) एक डेटासेट है जिसमें प्रत्येक पैनल सदस्य (अर्थात, व्यक्ति) प्रत्येक वर्ष मनाया जाता है। परिणामस्वरूप, यदि एक संतुलित पैनल में N पैनल के सदस्य और T आवर्त शामिल हैं, तो डेटासेट में अवलोकनों की संख्या (n) जरूरी है n = N×T.

एक असंतुलित पैनल (जैसे, ऊपर दिया गया दूसरा डेटासेट) एक डेटासेट है जिसमें कम से कम एक पैनल सदस्य प्रत्येक आवर्त में नहीं देखा जाता है। इसलिए, यदि एक असंतुलित पैनल में N पैनल के सदस्य और T आवर्त शामिल हैं, तो निम्नलिखित पूर्णतः असमानता डेटासेट में अवलोकनों की संख्या (n) के लिए लागू होती है: n < N×T.

उपरोक्त दोनों डेटासेट लंबे प्रारूप में संरचित हैं, जहां एक पंक्ति प्रति समय एक अवलोकन रखती है। पैनल आँकड़े की संरचना का एक अन्य तरीका व्यापक प्रारूप होगा जहां एक पंक्ति समय में सभी बिंदुओं के लिए एक अवलोकन इकाई का प्रतिनिधित्व करती है (उदाहरण के लिए, विस्तृत प्रारूप में आँकड़े केवल दो (पहला उदाहरण) या तीन (दूसरा उदाहरण) पंक्तियां होंगी प्रत्येक समय-परिवर्तनशील चर (आय, आयु) के लिए अतिरिक्त कॉलम।

विश्लेषण

एक पैनल का रूप है

कहाँ व्यक्तिगत आयाम है और समय आयाम है। एक सामान्य पैनल आँकड़े परावर्तन आकार के रूप में लिखा गया है

इस सामान्य आकार की स्पष्ट संरचना पर विभिन्न अवलोकनाये बनाई जा सकती हैं। निश्चित प्रभाव आकार और अनियमित प्रभाव आकार दो महत्वपूर्ण आकार हैं।

एक सामान्य पैनल आँकड़े आकार पर विचार करें:

व्यक्तिगत-विशिष्ट, समय-अपरिवर्तनीय प्रभाव हैं (उदाहरण के लिए देशों के एक पैनल में इसमें भूगोल, जलवायु आदि शामिल हो सकते हैं) जो समय के साथ तय होते हैं। जबकि एक समय-परिवर्तनशील अनियमित घटक है।

यदि अप्रमाणित है, और कम से कम एक स्वतंत्र चर के साथ सहसंबद्ध है, तो यह एक मानक OLS प्रतिगमन में छोड़े गए चर पूर्वाग्रह का कारण होगा। हालाँकि, पैनल आँकड़े विधियाँ, जैसे कि निश्चित प्रभाव अनुमानक या वैकल्पिक रूप से, प्रथम-अंतर अनुमानक का उपयोग इसे नियंत्रित करने के लिए किया जा सकता है।

यदि किसी भी स्वतंत्र चर के साथ सहसंबद्ध नहीं है, तो प्रतिगमन मापदंडों के निष्पक्ष और सुसंगत अनुमानों को प्राप्त करने के लिए साधारण न्यूनतम वर्ग रैखिक प्रतिगमन विधियों का उपयोग किया जा सकता है। हालाँकि, क्योंकि समय के साथ तय हो जाता है, यह प्रतिगमन की अशुद्धि आवर्त में क्रमिक सहसंबंध को प्रेरित करेगा। इसका मतलब है कि अधिक कुशल आकलन तकनीक उपलब्ध हैं। अनियमित प्रभाव एक ऐसी विधि है, यह व्यवहार्य सामान्यीकृत कम से कम वर्गों का एक विशेष मामला है जो अनुक्रमिक सहसंबंध की संरचना के लिए नियंत्रित करता है जो प्रेरित होता है .

गतिशील पैनल आँकड़े

डायनेमिक पैनल आँकड़े उस मामले का वर्णन करता है जहां परतंत्र चर के लैग को प्रतिगामी के रूप में उपयोग किया जाता है:

लैग्ड परतंत्र चर की उपस्थिति सख्त एक्सोजेनिटी (अर्थमिति) का उल्लंघन करती है, यानी एंडोजीनिटी (अर्थमिति) हो सकती है। निश्चित प्रभाव अनुमानक और प्रथम अंतर अनुमानक दोनों सख्त बहिर्जातता की धारणा पर भरोसा करते हैं। इसलिए, अगर माना जाता है कि एक स्वतंत्र चर के साथ सहसंबद्ध माना जाता है, एक वैकल्पिक अनुमान तकनीक का उपयोग किया जाना चाहिए। इस स्थिति में सहायक चर या GMM तकनीकों का आमतौर पर उपयोग किया जाता है, जैसे कि अरेलानो-बॉन्ड अनुमानक।

आँकड़े सेट जिनमें एक पैनल डिज़ाइन है

== आँकड़े सेट जिनमें बहु-आयामी पैनल डिज़ाइन == है

टिप्पणियाँ

  1. Diggle, Peter J.; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. (2002). अनुदैर्ध्य डेटा का विश्लेषण (2nd ed.). Oxford University Press. p. 2. ISBN 0-19-852484-6.
  2. Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). अनुप्रयुक्त अनुदैर्ध्य विश्लेषण. Hoboken: John Wiley & Sons. p. 2. ISBN 0-471-21487-6.
  3. Zaman, Khalid (2023-01-24). "क्रॉस-पैनल डेटा तकनीकों पर एक नोट". Latest Developments in Econometrics. 1 (1): 1–7. doi:10.5281/zenodo.7565625.


संदर्भ

  • Baltagi, Badi H. (2008). Econometric Analysis of Panel Data (Fourth ed.). Chichester: John Wiley & Sons. ISBN 978-0-470-51886-1.
  • Davies, A.; Lahiri, K. (1995). "A New Framework for Testing Rationality and Measuring Aggregate Shocks Using Panel Data". Journal of Econometrics. 68 (1): 205–227. doi:10.1016/0304-4076(94)01649-K.
  • Davies, A.; Lahiri, K. (2000). "Re-examining the Rational Expectations Hypothesis Using Panel Data on Multi-Period Forecasts". Analysis of Panels and Limited Dependent Variable Models. Cambridge: Cambridge University Press. pp. 226–254. ISBN 0-521-63169-6.
  • Frees, E. (2004). Longitudinal and Panel Data: Analysis and Applications in the Social Sciences. New York: Cambridge University Press. ISBN 0-521-82828-7.
  • Hsiao, Cheng (2003). Analysis of Panel Data (Second ed.). New York: Cambridge University Press. ISBN 0-521-52271-4.


बाहरी संबंध