कंप्यूटर प्रयोग
कंप्यूटर प्रयोग या अनुकरण प्रयोग एक कंप्यूटर अनुकरण का अध्ययन करने के लिए प्रयोग किया जाने वाला प्रयोग है, जिसे सिलिको सिस्टम में भी कहा जाता है। इस क्षेत्र में कम्प्यूटेशनल भौतिकी (अभिकलनात्मक), कम्प्यूटेशनल रसायन विज्ञान, कम्प्यूटेशनल जीव विज्ञान और अन्य समान विषय सम्मिलित हैं।
पृष्ठभूमि
कंप्यूटर सिमुलेशन भौतिक प्रणाली का अनुकरण करने के लिए बनाए गए हैं। क्योंकि ये किसी प्रणाली के कुछ पहलू को विस्तार से दोहराने के लिए होते हैं, वे प्रायः विश्लेषणात्मक समाधान नहीं देते हैं। इसलिए, असतत घटना अनुकरण या परिमित तत्व सॉल्वर जैसे तरीकों का उपयोग किया जाता है। कंप्यूटर मॉडल का उपयोग उस सिस्टम के बारे में अनुमान लगाने के लिए किया जाता है, जिसकी वह प्रतिकृति करता है। उदाहरण के लिए, प्रायः जलवायु मॉडल का उपयोग किया जाता है क्योंकि पृथ्वी के आकार की वस्तु पर प्रयोग असंभव है।
उद्देश्य
कंप्यूटर प्रयोगों को ध्यान में रखते हुए कई उद्देश्यों के लिए नियोजित किया गया है। उनमें से कुछ सम्मिलित हैं:
- अनिश्चितता मात्रा का ठहराव: कंप्यूटर सिमुलेशन के निर्माण के दौरान अज्ञात से उत्पन्न होने वाले कंप्यूटर सिमुलेशन में अनिश्चितता की विशेषता।
- व्युत्क्रम समस्याएँ: भौतिक डेटा से सिस्टम के अंतर्निहित गुणों की खोज करें।
- अभिनति सुधार: सिमुलेशन में पूर्वाग्रह को ठीक करने के लिए भौतिक डेटा का उपयोग करें।
- डेटा एसिमिनेशन: कई सिमुलेशन और भौतिक डेटा स्रोतों को एक पूर्ण भविष्य कहनेवाला मॉडल में संयोजित करें।
- सिस्टम डिजाइन: ऐसे इनपुट खोजें जो इष्टतम सिस्टम प्रदर्शन उपायों में परिणत होते हैं।
कंप्यूटर अनुकरण मॉडलिंग
कंप्यूटर प्रयोगों की मॉडलिंग सामान्यतः बायेसियन फ्रेमवर्क का उपयोग करती है। बायेसियन सांख्यिकी आंकड़ों के क्षेत्र की व्याख्या है जहां दुनिया की वास्तविक स्थिति के बारे में सभी साक्ष्य स्पष्ट रूप से संभावनाओं के रूप में व्यक्त किए जाते हैं। कंप्यूटर प्रयोगों के दायरे में, बायेसियन व्याख्या का अर्थ होगा कि हमें एक पूर्व वितरण बनाना चाहिए जो कंप्यूटर मॉडल की संरचना पर हमारे पूर्व विश्वास का प्रतिनिधित्व करता है। कंप्यूटर प्रयोगों के लिए इस दर्शन का उपयोग 1980 के दशक में प्रारम्भ हुआ और सैक्स एट अल द्वारा अच्छी तरह से संक्षेप में प्रस्तुत किया गया है। (1989) [1]। जबकि बायेसियन दृष्टिकोण का व्यापक रूप से उपयोग किया जाता है, हाल ही में प्रायःवादी दृष्टिकोणों पर चर्चा की गई है[2]।
इस ढांचे का मूल विचार इनपुट के एक सेट के अज्ञात कार्य के रूप में कंप्यूटर सिमुलेशन को मॉडल करना है। कंप्यूटर सिमुलेशन को कंप्यूटर कोड के टुकड़े के रूप में लागू किया जाता है जिसका मूल्यांकन आउटपुट के संग्रह का उत्पादन करने के लिए किया जा सकता है। इन सिमुलेशन के इनपुट के उदाहरण अंतर्निहित मॉडल में गुणांक, प्रारंभिक स्थितियां और बल कार्य हैं। सिमुलेशन को निर्धारक कार्य के रूप में देखना स्वाभाविक है जो इन इनपुट को आउटपुट के संग्रह में मैप करता है। हमारे सिम्युलेटर को इस तरह देखने के आधार पर, इनपुट के संग्रह को कंप्यूटर सिमुलेशन को स्वयं और परिणामी आउटपुट को के रूप में संदर्भित करना आम बात है। दोनों और सदिश राशियाँ हैं, और वे मानों का बहुत बड़ा संग्रह हो सकते हैं, जिन्हें प्रायः स्थान द्वारा, या समय के अनुसार, या स्थान और समय दोनों द्वारा अनुक्रमित किया जाता है।
यद्यपि सिद्धांत रूप में जाना जाता है, व्यवहार में ऐसा नहीं है। कई सिमुलेटरों में उच्च-स्तरीय कंप्यूटर कोड की हजारों लाइनें सम्मिलित होती हैं, जो कि अंतर्ज्ञान के लिए सुलभ नहीं है। कुछ सिमुलेशन के लिए, जैसे जलवायु मॉडल, इनपुट के एक सेट के लिए आउटपुट के मूल्यांकन के लिए लाखों कंप्यूटर घंटों की आवश्यकता हो सकती है[3]।
गाऊसी प्रक्रिया पूर्व
कंप्यूटर कोड आउटपुट के लिए विशिष्ट मॉडल गॉसियन प्रक्रिया है। सांकेतिक सरलता के लिए, मान लीजिए अदिश राशि है। बायेसियन ढांचे के कारण, हम अपने विश्वास को ठीक करते हैं कि फ़ंक्शन गाऊसी प्रक्रिया का अनुसरण करता है, जहां माध्य फ़ंक्शन है और सहप्रसरण फ़ंक्शन है। लोकप्रिय माध्य फलन निम्न-क्रम बहुपद हैं और लोकप्रिय सहप्रसरण फलन मैटर्न कोवेरियन्स (मातृ सहप्रसरण) है, जिसमें दोनों घातांक और गॉसियन सहप्रसरण (जैसे ) सम्मिलित हैं .
कंप्यूटर प्रयोगों का डिजाइन
कंप्यूटर प्रयोगों के डिजाइन में पैरामीट्रिक मॉडल के प्रयोगों के डिजाइन से काफी अंतर है। चूंकि गॉसियन प्रक्रिया में एक अनंत आयामी प्रतिनिधित्व होता है, A और D मानदंड (इष्टतम डिजाइन देखें) की अवधारणाएं, जो मापदंडों में त्रुटि को कम करने पर ध्यान केंद्रित करती हैं, का उपयोग नहीं किया जा सकता है। जब कंप्यूटर सिमुलेशन में कोई त्रुटि नहीं होती है तो प्रतिकृतियां भी व्यर्थ होंगी। अच्छे प्रयोगात्मक डिजाइन को निर्धारित करने के लिए जिन मानदंडों का उपयोग किया जाता है उनमें एकीकृत माध्य चुकता भविष्यवाणी त्रुटि [4] और दूरी-आधारित मानदंड [5] सम्मिलित हैं।
डिजाइन के लिए लोकप्रिय रणनीतियों में लैटिन हाइपरक्यूब नमूनाकरण और निम्न विसंगति अनुक्रम सम्मिलित हैं।
बड़े पैमाने पर नमूना आकार के साथ समस्याएं
भौतिक प्रयोगों के विपरीत, कंप्यूटर प्रयोगों में हजारों विभिन्न इनपुट संयोजनों का होना आम बात है। चूंकि मानक अनुमान के लिए नमूनों की संख्या () के आकार के वर्ग मैट्रिक्स के मैट्रिक्स व्युत्क्रम की आवश्यकता होती है, इसलिए लागत पर बढ़ती है। बड़े, सघन मैट्रिक्स का मैट्रिक्स व्युत्क्रमण भी संख्यात्मक अशुद्धि का कारण बन सकता है। वर्तमान में, इस समस्या को लालची निर्णय ट्री तकनीकों द्वारा हल किया जाता है, असीमित आयामीता और नमूना आकार पेटेंट WO2013055257A1 के लिए प्रभावी संगणना की अनुमति देता है, या सन्निकटन विधियों का उपयोग करके टाला जाता है, उदा।[5]।
यह भी देखें
- सिमुलेशन
- अनिश्चितता परिमाणीकरण
- बायेसियन सांख्यिकी
- गाऊसी प्रक्रिया एमुलेटर
- प्रयोगों का डिजाइन
- आणविक गतिकी
- मोंटे कार्लो विधि
- सरोगेट मॉडल
- ग्रे बॉक्स पूर्णता और सत्यापन
अग्रिम पठन
- Santner, Thomas (2003). The Design and Analysis of Computer Experiments. Berlin: Springer. ISBN 0-387-95420-1.
- Fehr, Jörg; Heiland, Jan; Himpe, Christian; Saak, Jens (2016). "Best practices for replicability, reproducibility and reusability of computer-based experiments exemplified by model reduction software". AIMS Mathematics. 1 (3): 261–281. arXiv:1607.01191. doi:10.3934/Math.2016.3.261.