डेटा बिनिंग: Difference between revisions

From Vigyanwiki
(Created page with "डेटा बिनिंग, जिसे डेटा असतत बिनिंग या डेटा बकेटिंग भी कहा जाता है, ए...")
 
No edit summary
Line 1: Line 1:
डेटा बिनिंग, जिसे डेटा असतत बिनिंग या डेटा बकेटिंग भी कहा जाता है, एक [[डेटा प्री-प्रोसेसिंग]] तकनीक है जिसका उपयोग मामूली [[अवलोकन त्रुटि]]यों के प्रभाव को कम करने के लिए किया जाता है। मूल डेटा मान जो किसी दिए गए छोटे अंतराल में आते हैं, एक ''बिन (कम्प्यूटेशनल ज्योमेट्री)'', उस अंतराल के मूल्य प्रतिनिधि द्वारा प्रतिस्थापित किया जाता है, जो अक्सर एक [[केंद्रीय प्रवृत्ति]] (माध्य या माध्यिका) होता है। यह [[परिमाणीकरण (सिग्नल प्रोसेसिंग)]] से संबंधित है: डेटा बिनिंग [[सूच्याकार आकृति का भुज]] अक्ष पर संचालित होता है जबकि परिमाणीकरण [[तालमेल]] अक्ष पर संचालित होता है। बिनिंग [[गोलाई]] का एक सामान्यीकरण है।
डेटा बिनिंग, जिसे असतत बिनिंग या डेटा बकेटिंग भी कहा जाता है, [[डेटा प्री-प्रोसेसिंग]] प्रक्रिया है जिसका उपयोग साधारण [[अवलोकन त्रुटि|अवलोकन त्रुटियों]] के प्रभावों को न्यून करने के लिए किया जाता है। मूल डेटा मान जो किसी दिए गए छोटे अंतराल ''बिन (कम्प्यूटेशनल ज्योमेट्री)'' में आते हैं, उसे अंतराल के मूल्य प्रतिनिधि द्वारा प्रतिस्थापित किया जाता है, जो अधिकांशतः [[केंद्रीय प्रवृत्ति|केंद्रीय मान]] (माध्य या माध्यिका) होता है। यह [[परिमाणीकरण (सिग्नल प्रोसेसिंग)]] से संबंधित है: डेटा बिनिंग [[सूच्याकार आकृति का भुज|एब्सिस्सा]] अक्ष पर संचालित होता है जबकि परिमाणीकरण [[तालमेल|ऑर्डिनेट]] अक्ष पर संचालित होता है। बिनिंग [[गोलाई]] का सामान्यीकरण है।


सांख्यिकीय डेटा बिनिंग कम या ज्यादा निरंतर मानों की संख्या को कम संख्या में बिन में समूहित करने का एक तरीका है। उदाहरण के लिए, यदि आपके पास लोगों के समूह के बारे में डेटा है, तो हो सकता है कि आप उनकी आयु को कम संख्या में आयु अंतरालों में व्यवस्थित करना चाहें (उदाहरण के लिए, हर पांच साल में एक साथ समूह बनाना)। इसका उपयोग बहुभिन्नरूपी आँकड़ों में भी किया जा सकता है, एक साथ कई आयामों में बिनिंग किया जा सकता है।
सांख्यिकीय डेटा बिनिंग न्यून अथवा अधिक निरंतर मानों की संख्या को बिन में समूहित करने की विधि है। उदाहरण के लिए, यदि आपके निकट लोगों के समूह के सम्बन्ध में डेटा है, तो आप उनकी आयु को कम संख्या में आयु अंतरालों में व्यवस्थित करना चाहेंगे (उदाहरण के लिए, प्रत्येक पांच वर्ष में समूह निर्मित करना)। इसका उपयोग बहुभिन्नरूपी आँकड़ों में भी किया जा सकता है, समवर्ती रूप से विभिन्न आयामों में बिनिंग किया जा सकता है।


[[डिजिटल इमेज प्रोसेसिंग]] में, बिनिंग का बहुत अलग [[अर्थ]] है। [[[[पिक्सेल]] बिनिंग]], रीडआउट के दौरान या बाद में, उनके मूल्यों को जोड़कर या औसत करके, एक छवि में आसन्न पिक्सेल के ब्लॉक को संयोजित करने की प्रक्रिया है। यह डेटा की मात्रा कम कर देता है; परिणाम में सापेक्ष शोर का स्तर भी कम होता है।
[[डिजिटल इमेज प्रोसेसिंग]] में, बिनिंग का [[अर्थ]] भिन्न है। [[पिक्सेल]] बिनिंग, रीडआउट के समय या पश्चात में, उनके मूल्यों का योग या औसत करके छवि में आसन्न पिक्सेल के ब्लॉक को संयोजित करने की प्रक्रिया है। यह डेटा की मात्रा को सिमित कर देता है,  जिसके परिणाम में सापेक्ष नॉइज़ का स्तर भी कम हो जाता है।


== उदाहरण उपयोग ==
== उदाहरण उपयोग ==
[[हिस्टोग्राम]] अंतर्निहित [[आवृत्ति (सांख्यिकी)]] का निरीक्षण करने के लिए उपयोग किए जाने वाले डेटा बिनिंग का एक उदाहरण है। दृश्यता में आसानी के लिए वे आम तौर पर एक-आयामी स्थान और यूक्लिडियन वेक्टर # समानता [[अंतराल (गणित)]] में होते हैं।
[[हिस्टोग्राम]] अंतर्निहित [[आवृत्ति (सांख्यिकी)]] वितरण का निरीक्षण करने के लिए उपयोग किए जाने वाले डेटा बिनिंग का उदाहरण है। दृश्यता में सरलता के लिए वे सामान्यतः 1-आयामी स्थान और समान [[अंतराल (गणित)]] में होते हैं।


डेटा बिनिंग का उपयोग तब किया जा सकता है जब [[मास स्पेक्ट्रोमेट्री]] (एमएस) या परमाणु चुंबकीय अनुनाद (एनएमआर) प्रयोगों से वर्णक्रमीय आयाम में छोटे वाद्य बदलाव विभिन्न घटकों का प्रतिनिधित्व करने के रूप में गलत तरीके से व्याख्या किए जाएंगे, जब डेटा प्रोफाइल का एक संग्रह पैटर्न पहचान विश्लेषण के अधीन होता है। इस समस्या से निपटने का एक सीधा तरीका बिनिंग तकनीकों का उपयोग करना है जिसमें विश्लेषण के बीच छोटे वर्णक्रमीय बदलावों के बावजूद एक दी गई चोटी अपने बिन में बनी रहती है, यह सुनिश्चित करने के लिए स्पेक्ट्रम को पर्याप्त डिग्री तक कम किया जाता है। उदाहरण के लिए, परमाणु चुंबकीय अनुनाद में रासायनिक शिफ्ट अक्ष को विखंडित और मोटे तौर पर बायन किया जा सकता है, और द्रव्यमान स्पेक्ट्रोमेट्री में वर्णक्रमीय सटीकता पूर्णांक परमाणु द्रव्यमान इकाई मूल्यों के लिए गोल हो सकती है। इसके अलावा, कई [[डिजिटल कैमरा]] सिस्टम इमेज कंट्रास्ट को बेहतर बनाने के लिए एक स्वचालित पिक्सेल बिनिंग फ़ंक्शन को शामिल करते हैं।<ref name="example">{{cite web |title=फोटोग्राफी में बिनिंग का उपयोग।|url=https://www.microscopyu.com/tutorials/ccd-signal-to-noise-ratio |publisher=Nikon, FSU |accessdate=2011-01-18}}</ref>
डेटा बिनिंग का उपयोग तब किया जा सकता है जब [[मास स्पेक्ट्रोमेट्री]] (एमएस) या परमाणु चुंबकीय अनुनाद (एनएमआर) प्रयोगों से वर्णक्रमीय आयाम में छोटे वाद्य परिवर्तन विभिन्न घटकों का प्रतिनिधित्व करने के रूप में अनुचित प्रकार से परिभाषित किए जाएंगे, जब डेटा प्रोफाइल का एक संग्रह पैटर्न पहचान विश्लेषण के अधीन होता है। इस समस्या से निपटने का एक सीधा तरीका बिनिंग तकनीकों का उपयोग करना है जिसमें विश्लेषण के बीच छोटे वर्णक्रमीय बदलावों के बावजूद एक दी गई चोटी अपने बिन में बनी रहती है, यह सुनिश्चित करने के लिए स्पेक्ट्रम को पर्याप्त डिग्री तक कम किया जाता है। उदाहरण के लिए, परमाणु चुंबकीय अनुनाद में रासायनिक शिफ्ट अक्ष को विखंडित और मोटे तौर पर बायन किया जा सकता है, और द्रव्यमान स्पेक्ट्रोमेट्री में वर्णक्रमीय सटीकता पूर्णांक परमाणु द्रव्यमान इकाई मूल्यों के लिए गोल हो सकती है। इसके अलावा, कई [[डिजिटल कैमरा]] सिस्टम इमेज कंट्रास्ट को बेहतर बनाने के लिए एक स्वचालित पिक्सेल बिनिंग फ़ंक्शन को शामिल करते हैं।<ref name="example">{{cite web |title=फोटोग्राफी में बिनिंग का उपयोग।|url=https://www.microscopyu.com/tutorials/ccd-signal-to-noise-ratio |publisher=Nikon, FSU |accessdate=2011-01-18}}</ref>
[[ यंत्र अधिगम ]] में तेजी लाने के लिए बिनिंग का भी उपयोग किया जाता है<ref name="lightgbm">{{cite web |title=LightGBM: A Highly Efficient Gradient Boosting Decision Tree |url=https://proceedings.neurips.cc/paper/2017/hash/6449f44a102fde848669bdd9eb6b76fa-Abstract.html |publisher=Neural Information Processing Systems (NIPS) |accessdate=2019-12-18}}</ref> [[माइक्रोसॉफ्ट]] के [[लाइट जीबीएम]] और [[scikit-सीखें]] जैसे एल्गोरिदम में पर्यवेक्षित वर्गीकरण और प्रतिगमन के लिए निर्णय-ट्री [[बूस्टिंग (मशीन लर्निंग)]] विधि -आधारित ग्रेडिएंट बूस्टिंग क्लासिफिकेशन ट्री]।
[[ यंत्र अधिगम ]] में तेजी लाने के लिए बिनिंग का भी उपयोग किया जाता है<ref name="lightgbm">{{cite web |title=LightGBM: A Highly Efficient Gradient Boosting Decision Tree |url=https://proceedings.neurips.cc/paper/2017/hash/6449f44a102fde848669bdd9eb6b76fa-Abstract.html |publisher=Neural Information Processing Systems (NIPS) |accessdate=2019-12-18}}</ref> [[माइक्रोसॉफ्ट]] के [[लाइट जीबीएम]] और [[scikit-सीखें]] जैसे एल्गोरिदम में पर्यवेक्षित वर्गीकरण और प्रतिगमन के लिए निर्णय-ट्री [[बूस्टिंग (मशीन लर्निंग)]] विधि -आधारित ग्रेडिएंट बूस्टिंग क्लासिफिकेशन ट्री]।



Revision as of 22:32, 20 April 2023

डेटा बिनिंग, जिसे असतत बिनिंग या डेटा बकेटिंग भी कहा जाता है, डेटा प्री-प्रोसेसिंग प्रक्रिया है जिसका उपयोग साधारण अवलोकन त्रुटियों के प्रभावों को न्यून करने के लिए किया जाता है। मूल डेटा मान जो किसी दिए गए छोटे अंतराल बिन (कम्प्यूटेशनल ज्योमेट्री) में आते हैं, उसे अंतराल के मूल्य प्रतिनिधि द्वारा प्रतिस्थापित किया जाता है, जो अधिकांशतः केंद्रीय मान (माध्य या माध्यिका) होता है। यह परिमाणीकरण (सिग्नल प्रोसेसिंग) से संबंधित है: डेटा बिनिंग एब्सिस्सा अक्ष पर संचालित होता है जबकि परिमाणीकरण ऑर्डिनेट अक्ष पर संचालित होता है। बिनिंग गोलाई का सामान्यीकरण है।

सांख्यिकीय डेटा बिनिंग न्यून अथवा अधिक निरंतर मानों की संख्या को बिन में समूहित करने की विधि है। उदाहरण के लिए, यदि आपके निकट लोगों के समूह के सम्बन्ध में डेटा है, तो आप उनकी आयु को कम संख्या में आयु अंतरालों में व्यवस्थित करना चाहेंगे (उदाहरण के लिए, प्रत्येक पांच वर्ष में समूह निर्मित करना)। इसका उपयोग बहुभिन्नरूपी आँकड़ों में भी किया जा सकता है, समवर्ती रूप से विभिन्न आयामों में बिनिंग किया जा सकता है।

डिजिटल इमेज प्रोसेसिंग में, बिनिंग का अर्थ भिन्न है। पिक्सेल बिनिंग, रीडआउट के समय या पश्चात में, उनके मूल्यों का योग या औसत करके छवि में आसन्न पिक्सेल के ब्लॉक को संयोजित करने की प्रक्रिया है। यह डेटा की मात्रा को सिमित कर देता है, जिसके परिणाम में सापेक्ष नॉइज़ का स्तर भी कम हो जाता है।

उदाहरण उपयोग

हिस्टोग्राम अंतर्निहित आवृत्ति (सांख्यिकी) वितरण का निरीक्षण करने के लिए उपयोग किए जाने वाले डेटा बिनिंग का उदाहरण है। दृश्यता में सरलता के लिए वे सामान्यतः 1-आयामी स्थान और समान अंतराल (गणित) में होते हैं।

डेटा बिनिंग का उपयोग तब किया जा सकता है जब मास स्पेक्ट्रोमेट्री (एमएस) या परमाणु चुंबकीय अनुनाद (एनएमआर) प्रयोगों से वर्णक्रमीय आयाम में छोटे वाद्य परिवर्तन विभिन्न घटकों का प्रतिनिधित्व करने के रूप में अनुचित प्रकार से परिभाषित किए जाएंगे, जब डेटा प्रोफाइल का एक संग्रह पैटर्न पहचान विश्लेषण के अधीन होता है। इस समस्या से निपटने का एक सीधा तरीका बिनिंग तकनीकों का उपयोग करना है जिसमें विश्लेषण के बीच छोटे वर्णक्रमीय बदलावों के बावजूद एक दी गई चोटी अपने बिन में बनी रहती है, यह सुनिश्चित करने के लिए स्पेक्ट्रम को पर्याप्त डिग्री तक कम किया जाता है। उदाहरण के लिए, परमाणु चुंबकीय अनुनाद में रासायनिक शिफ्ट अक्ष को विखंडित और मोटे तौर पर बायन किया जा सकता है, और द्रव्यमान स्पेक्ट्रोमेट्री में वर्णक्रमीय सटीकता पूर्णांक परमाणु द्रव्यमान इकाई मूल्यों के लिए गोल हो सकती है। इसके अलावा, कई डिजिटल कैमरा सिस्टम इमेज कंट्रास्ट को बेहतर बनाने के लिए एक स्वचालित पिक्सेल बिनिंग फ़ंक्शन को शामिल करते हैं।[1] यंत्र अधिगम में तेजी लाने के लिए बिनिंग का भी उपयोग किया जाता है[2] माइक्रोसॉफ्ट के लाइट जीबीएम और scikit-सीखें जैसे एल्गोरिदम में पर्यवेक्षित वर्गीकरण और प्रतिगमन के लिए निर्णय-ट्री बूस्टिंग (मशीन लर्निंग) विधि -आधारित ग्रेडिएंट बूस्टिंग क्लासिफिकेशन ट्री]।

यह भी देखें

संदर्भ

  1. "फोटोग्राफी में बिनिंग का उपयोग।". Nikon, FSU. Retrieved 2011-01-18.
  2. "LightGBM: A Highly Efficient Gradient Boosting Decision Tree". Neural Information Processing Systems (NIPS). Retrieved 2019-12-18.