परीक्षण डेटा: Difference between revisions

From Vigyanwiki
(Created page with "{{For|the machine learning term|test set}} परीक्षण डेटा सॉफ्टवेयर विकास में इनपुट प्रदान कर...")
 
No edit summary
Line 4: Line 4:
== पृष्ठभूमि ==
== पृष्ठभूमि ==
कुछ डेटा का उपयोग पुष्टिकरण तरीके से किया जा सकता है, आमतौर पर यह सत्यापित करने के लिए कि किसी दिए गए फ़ंक्शन में इनपुट का दिया गया सेट कुछ अपेक्षित परिणाम उत्पन्न करता है। असामान्य, चरम, असाधारण या अप्रत्याशित इनपुट पर प्रतिक्रिया देने की प्रोग्राम की क्षमता को चुनौती देने के लिए अन्य डेटा का उपयोग किया जा सकता है।<ref>{{Cite journal |last=Weyuker |first=E. J. |date=1988-06-01 |title=प्रोग्राम-आधारित सॉफ़्टवेयर परीक्षण डेटा पर्याप्तता मानदंड का मूल्यांकन|url=https://doi.org/10.1145/62959.62963 |journal=Communications of the ACM |volume=31 |issue=6 |pages=668–675 |doi=10.1145/62959.62963 |s2cid=15141475 |issn=0001-0782}}</ref>
कुछ डेटा का उपयोग पुष्टिकरण तरीके से किया जा सकता है, आमतौर पर यह सत्यापित करने के लिए कि किसी दिए गए फ़ंक्शन में इनपुट का दिया गया सेट कुछ अपेक्षित परिणाम उत्पन्न करता है। असामान्य, चरम, असाधारण या अप्रत्याशित इनपुट पर प्रतिक्रिया देने की प्रोग्राम की क्षमता को चुनौती देने के लिए अन्य डेटा का उपयोग किया जा सकता है।<ref>{{Cite journal |last=Weyuker |first=E. J. |date=1988-06-01 |title=प्रोग्राम-आधारित सॉफ़्टवेयर परीक्षण डेटा पर्याप्तता मानदंड का मूल्यांकन|url=https://doi.org/10.1145/62959.62963 |journal=Communications of the ACM |volume=31 |issue=6 |pages=668–675 |doi=10.1145/62959.62963 |s2cid=15141475 |issn=0001-0782}}</ref>
परीक्षण डेटा को केंद्रित या व्यवस्थित तरीके से तैयार किया जा सकता है (जैसा कि आमतौर पर डोमेन परीक्षण में होता है), या अन्य, कम-केंद्रित दृष्टिकोणों का उपयोग करके (जैसा कि आमतौर पर उच्च-मात्रा वाले यादृच्छिक स्वचालित परीक्षणों में होता है)। परीक्षण डेटा परीक्षक द्वारा, या किसी प्रोग्राम या फ़ंक्शन द्वारा तैयार किया जा सकता है जो परीक्षक की सहायता करता है। परीक्षण डेटा को पुन: उपयोग के लिए रिकॉर्ड किया जा सकता है या केवल एक बार उपयोग किया जा सकता है। डेटा जनरेशन टूल (अक्सर यादृच्छिकता पर आधारित) का उपयोग करके परीक्षण डेटा मैन्युअल रूप से बनाया जा सकता है<ref>{{Cite web|url=https://medium.com/@marian.jureczko/on-testing-in-ddd-f250482b5717|title=DDD में परीक्षण पर|date=2022-04-24|website=Medium|language=en-GB|access-date=2023-01-24}}</ref>), या मौजूदा उत्पादन परिवेश से पुनर्प्राप्त किया जा सकता है। डेटा सेट में सिंथेटिक (नकली) डेटा शामिल हो सकता है, लेकिन अधिमानतः इसमें प्रतिनिधि (वास्तविक) डेटा शामिल होता है।<ref>{{Cite web|url=https://www.datprof.com/solutions/what-is-test-data/|title=What is test data and how is it created?|date=2019-06-26|website=DATPROF|language=en-US|access-date=2020-04-29}}</ref>
परीक्षण डेटा को केंद्रित या व्यवस्थित तरीके से तैयार किया जा सकता है (जैसा कि आमतौर पर डोमेन परीक्षण में होता है), या अन्य, कम-केंद्रित दृष्टिकोणों का उपयोग करके (जैसा कि आमतौर पर उच्च-मात्रा वाले यादृच्छिक स्वचालित परीक्षणों में होता है)। परीक्षण डेटा परीक्षक द्वारा, या किसी प्रोग्राम या फ़ंक्शन द्वारा तैयार किया जा सकता है जो परीक्षक की सहायता करता है। परीक्षण डेटा को पुन: उपयोग के लिए रिकॉर्ड किया जा सकता है या केवल बार उपयोग किया जा सकता है। डेटा जनरेशन टूल (अक्सर यादृच्छिकता पर आधारित) का उपयोग करके परीक्षण डेटा मैन्युअल रूप से बनाया जा सकता है<ref>{{Cite web|url=https://medium.com/@marian.jureczko/on-testing-in-ddd-f250482b5717|title=DDD में परीक्षण पर|date=2022-04-24|website=Medium|language=en-GB|access-date=2023-01-24}}</ref>), या मौजूदा उत्पादन परिवेश से पुनर्प्राप्त किया जा सकता है। डेटा सेट में सिंथेटिक (नकली) डेटा शामिल हो सकता है, लेकिन अधिमानतः इसमें प्रतिनिधि (वास्तविक) डेटा शामिल होता है।<ref>{{Cite web|url=https://www.datprof.com/solutions/what-is-test-data/|title=What is test data and how is it created?|date=2019-06-26|website=DATPROF|language=en-US|access-date=2020-04-29}}</ref>




Line 10: Line 10:


जीडीपीआर, पीसीआई और स्वास्थ्य बीमा पोर्टेबिलिटी और जवाबदेही अधिनियम जैसे गोपनीयता नियमों और विनियमों के कारण परीक्षण के लिए गोपनीयता संवेदनशील व्यक्तिगत डेटा का उपयोग करने की अनुमति नहीं है।<ref>{{Cite web|date=2020-03-03|title=जीडीपीआर, पीसीआई और एचआईपीएए का अनुपालन प्राप्त करें|url=https://www.datprof.com/solutions/get-gdpr-pci-and-hipaa-compliant/|access-date=2020-07-09|website=DATPROF|language=en-US}}</ref> लेकिन अज्ञात (और अधिमानतः उप-समूहित) उत्पादन डेटा का उपयोग परीक्षण और विकास के लिए प्रतिनिधि डेटा के रूप में किया जा सकता है।<ref>{{Cite web|date=2019-10-17|title=परीक्षण के लिए उत्पादन डेटा का उपयोग करना|url=https://www.datprof.com/blogs/using-production-data-for-testing/|access-date=2020-07-09|website=DATPROF|language=en-US}}</ref> प्रोग्रामर नकली डेटा उत्पन्न करना भी चुन सकते हैं, लेकिन इसकी अपनी सीमाएँ हैं। परीक्षण के लिए पर्याप्त नकली या नकली डेटा तैयार करना हमेशा संभव नहीं होता है।<ref>{{Cite book |last1=Emam |first1=Khaled El |url=https://books.google.com/books?id=XWnnDwAAQBAJ&dq=Software+testing+synthetic+data&pg=PA18 |title=Practical Synthetic Data Generation: Balancing Privacy and the Broad Availability of Data |last2=Mosquera |first2=Lucy |last3=Hoptroff |first3=Richard |date=2020-05-19 |publisher="O'Reilly Media, Inc." |isbn=978-1-4920-7271-3 |language=en}}</ref>
जीडीपीआर, पीसीआई और स्वास्थ्य बीमा पोर्टेबिलिटी और जवाबदेही अधिनियम जैसे गोपनीयता नियमों और विनियमों के कारण परीक्षण के लिए गोपनीयता संवेदनशील व्यक्तिगत डेटा का उपयोग करने की अनुमति नहीं है।<ref>{{Cite web|date=2020-03-03|title=जीडीपीआर, पीसीआई और एचआईपीएए का अनुपालन प्राप्त करें|url=https://www.datprof.com/solutions/get-gdpr-pci-and-hipaa-compliant/|access-date=2020-07-09|website=DATPROF|language=en-US}}</ref> लेकिन अज्ञात (और अधिमानतः उप-समूहित) उत्पादन डेटा का उपयोग परीक्षण और विकास के लिए प्रतिनिधि डेटा के रूप में किया जा सकता है।<ref>{{Cite web|date=2019-10-17|title=परीक्षण के लिए उत्पादन डेटा का उपयोग करना|url=https://www.datprof.com/blogs/using-production-data-for-testing/|access-date=2020-07-09|website=DATPROF|language=en-US}}</ref> प्रोग्रामर नकली डेटा उत्पन्न करना भी चुन सकते हैं, लेकिन इसकी अपनी सीमाएँ हैं। परीक्षण के लिए पर्याप्त नकली या नकली डेटा तैयार करना हमेशा संभव नहीं होता है।<ref>{{Cite book |last1=Emam |first1=Khaled El |url=https://books.google.com/books?id=XWnnDwAAQBAJ&dq=Software+testing+synthetic+data&pg=PA18 |title=Practical Synthetic Data Generation: Balancing Privacy and the Broad Availability of Data |last2=Mosquera |first2=Lucy |last3=Hoptroff |first3=Richard |date=2020-05-19 |publisher="O'Reilly Media, Inc." |isbn=978-1-4920-7271-3 |language=en}}</ref>
एआई-जनित सिंथेटिक डेटा परीक्षण डेटा उत्पन्न करने का एक अन्य विकल्प हो सकता है। एआई-संचालित सिंथेटिक डेटा जनरेटर नमूना डेटाबेस के पैटर्न और गुणों को सीखते हैं। एक बार एआई एल्गोरिदम का प्रशिक्षण हो जाने के बाद, यह परिभाषित अनुसार अधिक या कम परीक्षण डेटा उत्पन्न कर सकता है। एल्गोरिदम को ओवरफिटिंग से बचाने के लिए एआई-जनरेटेड सिंथेटिक डेटा को अतिरिक्त गोपनीयता उपायों की आवश्यकता होती है। कुछ व्यावसायिक रूप से उपलब्ध सिंथेटिक डेटा जनरेटर अतिरिक्त गोपनीयता और सटीकता नियंत्रण के साथ आते हैं। परीक्षण किए जाने वाले डेटा की मात्रा समय, लागत और गुणवत्ता जैसे विचारों से निर्धारित या सीमित होती है। उत्पादन का समय, उत्पादन की लागत और परीक्षण डेटा की गुणवत्ता, और दक्षता।
एआई-जनित सिंथेटिक डेटा परीक्षण डेटा उत्पन्न करने का अन्य विकल्प हो सकता है। एआई-संचालित सिंथेटिक डेटा जनरेटर नमूना डेटाबेस के पैटर्न और गुणों को सीखते हैं। बार एआई एल्गोरिदम का प्रशिक्षण हो जाने के बाद, यह परिभाषित अनुसार अधिक या कम परीक्षण डेटा उत्पन्न कर सकता है। एल्गोरिदम को ओवरफिटिंग से बचाने के लिए एआई-जनरेटेड सिंथेटिक डेटा को अतिरिक्त गोपनीयता उपायों की आवश्यकता होती है। कुछ व्यावसायिक रूप से उपलब्ध सिंथेटिक डेटा जनरेटर अतिरिक्त गोपनीयता और सटीकता नियंत्रण के साथ आते हैं। परीक्षण किए जाने वाले डेटा की मात्रा समय, लागत और गुणवत्ता जैसे विचारों से निर्धारित या सीमित होती है। उत्पादन का समय, उत्पादन की लागत और परीक्षण डेटा की गुणवत्ता, और दक्षता।


==डोमेन परीक्षण==
==डोमेन परीक्षण==


डोमेन परीक्षण परीक्षण तकनीकों का एक परिवार है जो परीक्षण डेटा पर ध्यान केंद्रित करता है। इसमें सामान्य या महत्वपूर्ण इनपुट की पहचान करना, एक विशेष समतुल्य वर्ग मॉडल के प्रतिनिधि, वे मान जो एक समतुल्य वर्ग और दूसरे के बीच की सीमाओं पर दिखाई दे सकते हैं, अपमानजनक मूल्य जिन्हें प्रोग्राम द्वारा अस्वीकार कर दिया जाना चाहिए, इनपुट के संयोजन, या इनपुट जो उत्पाद को आउटपुट के एक विशेष सेट की ओर ले जा सकते हैं, शामिल हो सकते हैं।<ref>{{Cite book |last=Fries |first=Richard C. |url=https://books.google.com/books?id=z5KpDwAAQBAJ&dq=Domain+testing+critical+inputs&pg=PT394 |title=मेडिकल डिवाइस डिज़ाइन की हैंडबुक|date=2019-08-15 |publisher=CRC Press |isbn=978-1-000-69695-0 |language=en}}</ref>
डोमेन परीक्षण परीक्षण तकनीकों का परिवार है जो परीक्षण डेटा पर ध्यान केंद्रित करता है। इसमें सामान्य या महत्वपूर्ण इनपुट की पहचान करना, विशेष समतुल्य वर्ग मॉडल के प्रतिनिधि, वे मान जो समतुल्य वर्ग और दूसरे के बीच की सीमाओं पर दिखाई दे सकते हैं, अपमानजनक मूल्य जिन्हें प्रोग्राम द्वारा अस्वीकार कर दिया जाना चाहिए, इनपुट के संयोजन, या इनपुट जो उत्पाद को आउटपुट के विशेष सेट की ओर ले जा सकते हैं, शामिल हो सकते हैं।<ref>{{Cite book |last=Fries |first=Richard C. |url=https://books.google.com/books?id=z5KpDwAAQBAJ&dq=Domain+testing+critical+inputs&pg=PT394 |title=मेडिकल डिवाइस डिज़ाइन की हैंडबुक|date=2019-08-15 |publisher=CRC Press |isbn=978-1-000-69695-0 |language=en}}</ref>





Revision as of 10:28, 26 July 2023

परीक्षण डेटा सॉफ्टवेयर विकास में इनपुट प्रदान करके महत्वपूर्ण भूमिका निभाता है जिसका उपयोग सॉफ्टवेयर सिस्टम की शुद्धता, प्रदर्शन और विश्वसनीयता को सत्यापित करने के लिए किया जाता है। परीक्षण डेटा में विभिन्न प्रकार शामिल होते हैं, जैसे सकारात्मक और नकारात्मक परिदृश्य, किनारे के मामले और यथार्थवादी उपयोगकर्ता परिदृश्य, और इसका उद्देश्य बग को उजागर करने और उसके व्यवहार को मान्य करने के लिए सॉफ़्टवेयर के विभिन्न पहलुओं का अभ्यास करना है। उपयुक्त परीक्षण डेटा के साथ परीक्षण मामलों को डिज़ाइन और निष्पादित करके, डेवलपर्स दोषों की पहचान और सुधार कर सकते हैं, सॉफ़्टवेयर की गुणवत्ता में सुधार कर सकते हैं और यह सुनिश्चित कर सकते हैं कि यह निर्दिष्ट आवश्यकताओं को पूरा करता है। इसके अलावा, परीक्षण डेटा का उपयोग प्रतिगमन परीक्षण के लिए भी किया जा सकता है ताकि यह सत्यापित किया जा सके कि नए कोड परिवर्तन या संवर्द्धन कोई अनपेक्षित दुष्प्रभाव पेश नहीं करते हैं या मौजूदा कार्यक्षमताओं को तोड़ नहीं देते हैं। कुल मिलाकर, सॉफ्टवेयर विकास में परीक्षण डेटा का प्रभावी उपयोग विश्वसनीय और मजबूत सॉफ्टवेयर सिस्टम के उत्पादन में महत्वपूर्ण योगदान देता है।

पृष्ठभूमि

कुछ डेटा का उपयोग पुष्टिकरण तरीके से किया जा सकता है, आमतौर पर यह सत्यापित करने के लिए कि किसी दिए गए फ़ंक्शन में इनपुट का दिया गया सेट कुछ अपेक्षित परिणाम उत्पन्न करता है। असामान्य, चरम, असाधारण या अप्रत्याशित इनपुट पर प्रतिक्रिया देने की प्रोग्राम की क्षमता को चुनौती देने के लिए अन्य डेटा का उपयोग किया जा सकता है।[1] परीक्षण डेटा को केंद्रित या व्यवस्थित तरीके से तैयार किया जा सकता है (जैसा कि आमतौर पर डोमेन परीक्षण में होता है), या अन्य, कम-केंद्रित दृष्टिकोणों का उपयोग करके (जैसा कि आमतौर पर उच्च-मात्रा वाले यादृच्छिक स्वचालित परीक्षणों में होता है)। परीक्षण डेटा परीक्षक द्वारा, या किसी प्रोग्राम या फ़ंक्शन द्वारा तैयार किया जा सकता है जो परीक्षक की सहायता करता है। परीक्षण डेटा को पुन: उपयोग के लिए रिकॉर्ड किया जा सकता है या केवल बार उपयोग किया जा सकता है। डेटा जनरेशन टूल (अक्सर यादृच्छिकता पर आधारित) का उपयोग करके परीक्षण डेटा मैन्युअल रूप से बनाया जा सकता है[2]), या मौजूदा उत्पादन परिवेश से पुनर्प्राप्त किया जा सकता है। डेटा सेट में सिंथेटिक (नकली) डेटा शामिल हो सकता है, लेकिन अधिमानतः इसमें प्रतिनिधि (वास्तविक) डेटा शामिल होता है।[3]


सीमाएँ

जीडीपीआर, पीसीआई और स्वास्थ्य बीमा पोर्टेबिलिटी और जवाबदेही अधिनियम जैसे गोपनीयता नियमों और विनियमों के कारण परीक्षण के लिए गोपनीयता संवेदनशील व्यक्तिगत डेटा का उपयोग करने की अनुमति नहीं है।[4] लेकिन अज्ञात (और अधिमानतः उप-समूहित) उत्पादन डेटा का उपयोग परीक्षण और विकास के लिए प्रतिनिधि डेटा के रूप में किया जा सकता है।[5] प्रोग्रामर नकली डेटा उत्पन्न करना भी चुन सकते हैं, लेकिन इसकी अपनी सीमाएँ हैं। परीक्षण के लिए पर्याप्त नकली या नकली डेटा तैयार करना हमेशा संभव नहीं होता है।[6] एआई-जनित सिंथेटिक डेटा परीक्षण डेटा उत्पन्न करने का अन्य विकल्प हो सकता है। एआई-संचालित सिंथेटिक डेटा जनरेटर नमूना डेटाबेस के पैटर्न और गुणों को सीखते हैं। बार एआई एल्गोरिदम का प्रशिक्षण हो जाने के बाद, यह परिभाषित अनुसार अधिक या कम परीक्षण डेटा उत्पन्न कर सकता है। एल्गोरिदम को ओवरफिटिंग से बचाने के लिए एआई-जनरेटेड सिंथेटिक डेटा को अतिरिक्त गोपनीयता उपायों की आवश्यकता होती है। कुछ व्यावसायिक रूप से उपलब्ध सिंथेटिक डेटा जनरेटर अतिरिक्त गोपनीयता और सटीकता नियंत्रण के साथ आते हैं। परीक्षण किए जाने वाले डेटा की मात्रा समय, लागत और गुणवत्ता जैसे विचारों से निर्धारित या सीमित होती है। उत्पादन का समय, उत्पादन की लागत और परीक्षण डेटा की गुणवत्ता, और दक्षता।

डोमेन परीक्षण

डोमेन परीक्षण परीक्षण तकनीकों का परिवार है जो परीक्षण डेटा पर ध्यान केंद्रित करता है। इसमें सामान्य या महत्वपूर्ण इनपुट की पहचान करना, विशेष समतुल्य वर्ग मॉडल के प्रतिनिधि, वे मान जो समतुल्य वर्ग और दूसरे के बीच की सीमाओं पर दिखाई दे सकते हैं, अपमानजनक मूल्य जिन्हें प्रोग्राम द्वारा अस्वीकार कर दिया जाना चाहिए, इनपुट के संयोजन, या इनपुट जो उत्पाद को आउटपुट के विशेष सेट की ओर ले जा सकते हैं, शामिल हो सकते हैं।[7]


यह भी देखें

संदर्भ

  1. Weyuker, E. J. (1988-06-01). "प्रोग्राम-आधारित सॉफ़्टवेयर परीक्षण डेटा पर्याप्तता मानदंड का मूल्यांकन". Communications of the ACM. 31 (6): 668–675. doi:10.1145/62959.62963. ISSN 0001-0782. S2CID 15141475.
  2. "DDD में परीक्षण पर". Medium (in British English). 2022-04-24. Retrieved 2023-01-24.
  3. "What is test data and how is it created?". DATPROF (in English). 2019-06-26. Retrieved 2020-04-29.
  4. "जीडीपीआर, पीसीआई और एचआईपीएए का अनुपालन प्राप्त करें". DATPROF (in English). 2020-03-03. Retrieved 2020-07-09.
  5. "परीक्षण के लिए उत्पादन डेटा का उपयोग करना". DATPROF (in English). 2019-10-17. Retrieved 2020-07-09.
  6. Emam, Khaled El; Mosquera, Lucy; Hoptroff, Richard (2020-05-19). Practical Synthetic Data Generation: Balancing Privacy and the Broad Availability of Data (in English). "O'Reilly Media, Inc.". ISBN 978-1-4920-7271-3.
  7. Fries, Richard C. (2019-08-15). मेडिकल डिवाइस डिज़ाइन की हैंडबुक (in English). CRC Press. ISBN 978-1-000-69695-0.