डेटा बिनिंग

From Vigyanwiki
Revision as of 12:36, 21 March 2023 by alpha>Indicwiki (Created page with "डेटा बिनिंग, जिसे डेटा असतत बिनिंग या डेटा बकेटिंग भी कहा जाता है, ए...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

डेटा बिनिंग, जिसे डेटा असतत बिनिंग या डेटा बकेटिंग भी कहा जाता है, एक डेटा प्री-प्रोसेसिंग तकनीक है जिसका उपयोग मामूली अवलोकन त्रुटियों के प्रभाव को कम करने के लिए किया जाता है। मूल डेटा मान जो किसी दिए गए छोटे अंतराल में आते हैं, एक बिन (कम्प्यूटेशनल ज्योमेट्री), उस अंतराल के मूल्य प्रतिनिधि द्वारा प्रतिस्थापित किया जाता है, जो अक्सर एक केंद्रीय प्रवृत्ति (माध्य या माध्यिका) होता है। यह परिमाणीकरण (सिग्नल प्रोसेसिंग) से संबंधित है: डेटा बिनिंग सूच्याकार आकृति का भुज अक्ष पर संचालित होता है जबकि परिमाणीकरण तालमेल अक्ष पर संचालित होता है। बिनिंग गोलाई का एक सामान्यीकरण है।

सांख्यिकीय डेटा बिनिंग कम या ज्यादा निरंतर मानों की संख्या को कम संख्या में बिन में समूहित करने का एक तरीका है। उदाहरण के लिए, यदि आपके पास लोगों के समूह के बारे में डेटा है, तो हो सकता है कि आप उनकी आयु को कम संख्या में आयु अंतरालों में व्यवस्थित करना चाहें (उदाहरण के लिए, हर पांच साल में एक साथ समूह बनाना)। इसका उपयोग बहुभिन्नरूपी आँकड़ों में भी किया जा सकता है, एक साथ कई आयामों में बिनिंग किया जा सकता है।

डिजिटल इमेज प्रोसेसिंग में, बिनिंग का बहुत अलग अर्थ है। [[पिक्सेल बिनिंग]], रीडआउट के दौरान या बाद में, उनके मूल्यों को जोड़कर या औसत करके, एक छवि में आसन्न पिक्सेल के ब्लॉक को संयोजित करने की प्रक्रिया है। यह डेटा की मात्रा कम कर देता है; परिणाम में सापेक्ष शोर का स्तर भी कम होता है।

उदाहरण उपयोग

हिस्टोग्राम अंतर्निहित आवृत्ति (सांख्यिकी) का निरीक्षण करने के लिए उपयोग किए जाने वाले डेटा बिनिंग का एक उदाहरण है। दृश्यता में आसानी के लिए वे आम तौर पर एक-आयामी स्थान और यूक्लिडियन वेक्टर # समानता अंतराल (गणित) में होते हैं।

डेटा बिनिंग का उपयोग तब किया जा सकता है जब मास स्पेक्ट्रोमेट्री (एमएस) या परमाणु चुंबकीय अनुनाद (एनएमआर) प्रयोगों से वर्णक्रमीय आयाम में छोटे वाद्य बदलाव विभिन्न घटकों का प्रतिनिधित्व करने के रूप में गलत तरीके से व्याख्या किए जाएंगे, जब डेटा प्रोफाइल का एक संग्रह पैटर्न पहचान विश्लेषण के अधीन होता है। इस समस्या से निपटने का एक सीधा तरीका बिनिंग तकनीकों का उपयोग करना है जिसमें विश्लेषण के बीच छोटे वर्णक्रमीय बदलावों के बावजूद एक दी गई चोटी अपने बिन में बनी रहती है, यह सुनिश्चित करने के लिए स्पेक्ट्रम को पर्याप्त डिग्री तक कम किया जाता है। उदाहरण के लिए, परमाणु चुंबकीय अनुनाद में रासायनिक शिफ्ट अक्ष को विखंडित और मोटे तौर पर बायन किया जा सकता है, और द्रव्यमान स्पेक्ट्रोमेट्री में वर्णक्रमीय सटीकता पूर्णांक परमाणु द्रव्यमान इकाई मूल्यों के लिए गोल हो सकती है। इसके अलावा, कई डिजिटल कैमरा सिस्टम इमेज कंट्रास्ट को बेहतर बनाने के लिए एक स्वचालित पिक्सेल बिनिंग फ़ंक्शन को शामिल करते हैं।[1] यंत्र अधिगम में तेजी लाने के लिए बिनिंग का भी उपयोग किया जाता है[2] माइक्रोसॉफ्ट के लाइट जीबीएम और scikit-सीखें जैसे एल्गोरिदम में पर्यवेक्षित वर्गीकरण और प्रतिगमन के लिए निर्णय-ट्री बूस्टिंग (मशीन लर्निंग) विधि -आधारित ग्रेडिएंट बूस्टिंग क्लासिफिकेशन ट्री]।

यह भी देखें

संदर्भ

  1. "फोटोग्राफी में बिनिंग का उपयोग।". Nikon, FSU. Retrieved 2011-01-18.
  2. "LightGBM: A Highly Efficient Gradient Boosting Decision Tree". Neural Information Processing Systems (NIPS). Retrieved 2019-12-18.