फेयरनेस (मशीन लर्निंग): Difference between revisions

From Vigyanwiki
(TEXT)
 
(4 intermediate revisions by 2 users not shown)
Line 1: Line 1:
{{Short description|Measurement of algorithmic bias}}
{{Short description|Measurement of algorithmic bias}}
मशीन लर्निंग में '''निष्पक्षता''' मशीन लर्निंग प्रतिरूप के आधार पर स्वचालित निर्णय प्रक्रियाओं में [[एल्गोरिथम पूर्वाग्रह|कलनविधीय पूर्वाग्रह]] को ठीक करने के विभिन्न प्रयासों को संदर्भित करती है। मशीन-लर्निंग प्रक्रिया के बाद कंप्यूटर द्वारा लिए गए निर्णय अनुचित माने जा सकते हैं यदि वे '''संवेदनशील''' माने जाने वाले [[आश्रित और स्वतंत्र चर|चर]] पर आधारित है। इस प्रकार के चर के उदाहरणों में [[लिंग]], [[जातीयता]], [[यौन रुझान|यौन अभिविन्यास]], [[विकलांगता]] और बहुत कुछ सम्मिलित हैं। जैसा कि कई नैतिक अवधारणाओं का प्रकरण है, निष्पक्षता और पूर्वाग्रह की परिभाषाएँ हमेशा विवादास्पद होती हैं। सामान्य रूप में, निष्पक्षता और पूर्वाग्रह तब प्रासंगिक माने जाते हैं जब निर्णय प्रक्रिया लोगों के जीवन को प्रभावित करती है। मशीन लर्निंग में, कलनविधीय पूर्वाग्रह की समस्या सर्वविदित है और इसका अच्छी तरह से अध्ययन किया गया है। कई कारकों के कारण परिणाम विषम हो सकते हैं और इस प्रकार इन्हें कुछ समूहों या व्यक्तियों के संबंध में अनुचित माना जा सकता है। इसका एक उदाहरण वह प्रकार होगा जिससे सामाजिक मीडिया साइटें उपभोक्ताओं को वैयक्तिकृत समाचार प्रदान करती हैं।
यंत्र अधिगम में '''निष्पक्षता''' यंत्र अधिगम प्रतिरूप के आधार पर स्वचालित निर्णय प्रक्रियाओं में [[एल्गोरिथम पूर्वाग्रह|कलनविधि पूर्वाग्रह]] को सही करने के विभिन्न प्रयासों को संदर्भित करता है। यंत्र अधिगम प्रक्रिया के बाद कंप्यूटर द्वारा लिए गए निर्णय अनुचित माने जा सकते हैं यदि वे '''संवेदनशील''' माने जाने वाले [[आश्रित और स्वतंत्र चर|चर]] पर आधारित है। इस प्रकार के चर के उदाहरणों में [[लिंग]], [[जातीयता]], [[यौन रुझान|लैंगिक अभिविन्यास]], [[विकलांगता]] और बहुत कुछ सम्मिलित हैं। जैसा कि कई नैतिक अवधारणाओं का प्रकरण है, निष्पक्षता और पूर्वाग्रह की परिभाषाएँ हमेशा विवादास्पद होती हैं। सामान्य रूप में, निष्पक्षता और पूर्वाग्रह तब प्रासंगिक माने जाते हैं जब निर्णय प्रक्रिया लोगों के जीवन को प्रभावित करती है। यंत्र अधिगम में, कलनविधि पूर्वाग्रह की समस्या सर्वविदित है और इसका अच्छी तरह से अध्ययन किया गया है। कई कारकों के कारण परिणाम विषम हो सकते हैं और इस प्रकार इन्हें कुछ समूहों या व्यक्तियों के संबंध में अनुचित माना जा सकता है। इसका एक उदाहरण प्रकार होगा जिससे सामाजिक मीडिया साइटें उपभोक्ताओं को वैयक्तिकृत समाचार प्रदान करती हैं।


== सन्दर्भ ==
== सन्दर्भ ==


मशीन लर्निंग में निष्पक्षता के बारे में परिचर्चा अपेक्षाकृत आधुनिक विषय है। 2016 के बाद से इस विषय पर अनुसंधान में तेजी से वृद्धि हुई है।<ref>{{Cite arXiv |last1=Caton |first1=Simon |last2=Haas |first2=Christian |date=2020-10-04 |title=Fairness in Machine Learning: A Survey |class=cs.LG |eprint=2010.04053 }}</ref> इस वृद्धि को आंशिक रूप से [[प्रोपब्लिका]] की एक प्रभावशाली रिपोर्ट के कारण माना जा सकता है जिसमें दावा किया गया था कि कॉम्पास (सॉफ़्टवेयर) सॉफ़्टवेयर, जिसका व्यापक रूप से अमेरिकी अदालतों में पुनरावृत्ति की भविष्यवाणी करने के लिए उपयोग किया जाता था, जातीयता के आधार पर पक्षपाती था।<ref name=":0" /> अनुसंधान और परिचर्चा का एक विषय निष्पक्षता की परिभाषा है, क्योंकि इसकी कोई सार्वभौमिक परिभाषा नहीं है, और विभिन्न परिभाषाएँ एक-दूसरे के साथ विरोधाभास में हो सकती हैं, जिससे मशीन लर्निंग प्रतिरूप का न्याय करना कठिन हो जाता है।<ref>{{Cite journal |last1=Friedler |first1=Sorelle A. |last2=Scheidegger |first2=Carlos |last3=Venkatasubramanian |first3=Suresh |date=April 2021 |title=The (Im)possibility of fairness: different value systems require different mechanisms for fair decision making |url=https://dl.acm.org/doi/10.1145/3433949 |journal=Communications of the ACM |language=en |volume=64 |issue=4 |pages=136–143 |doi=10.1145/3433949 |s2cid=1769114 |issn=0001-0782}}</ref> अन्य अनुसंधान विषयों में पूर्वाग्रह की उत्पत्ति, पूर्वाग्रह के प्रकार और पूर्वाग्रह को कम करने के प्रकार सम्मिलित हैं।<ref>{{Cite journal |last1=Mehrabi |first1=Ninareh |last2=Morstatter |first2=Fred |last3=Saxena |first3=Nripsuta |last4=Lerman |first4=Kristina |last5=Galstyan |first5=Aram |date=2021-07-13 |title=मशीन लर्निंग में पूर्वाग्रह और निष्पक्षता पर एक सर्वेक्षण|url=https://doi.org/10.1145/3457607 |journal=ACM Computing Surveys |volume=54 |issue=6 |pages=115:1–115:35 |doi=10.1145/3457607 |arxiv=1908.09635 |s2cid=201666566 |issn=0360-0300}}</ref>
यंत्र अधिगम में निष्पक्षता के बारे में परिचर्चा अपेक्षाकृत आधुनिक विषय है। 2016 के बाद से इस विषय पर अनुसंधान में तेजी से वृद्धि हुई है।<ref>{{Cite arXiv |last1=Caton |first1=Simon |last2=Haas |first2=Christian |date=2020-10-04 |title=Fairness in Machine Learning: A Survey |class=cs.LG |eprint=2010.04053 }}</ref> इस वृद्धि को आंशिक रूप से [[प्रोपब्लिका]] की एक प्रभावशाली प्रतिवेदन के कारण माना जा सकता है जिसमें दावा किया गया था कि कॉम्पास (सॉफ़्टवेयर) सॉफ़्टवेयर, जिसका व्यापक रूप से अमेरिकी अदालतों में पुनरावृत्ति की भविष्यवाणी करने के लिए उपयोग किया जाता था, जातीयता के आधार पर पक्षपाती था।<ref name=":0" /> अनुसंधान और परिचर्चा का एक विषय निष्पक्षता की परिभाषा है, क्योंकि इसकी कोई सार्वभौमिक परिभाषा नहीं है, और विभिन्न परिभाषाएँ एक-दूसरे के साथ विरोधाभास में हो सकती हैं, जिससे यंत्र अधिगम प्रतिरूप का न्याय करना कठिन हो सकता है।<ref>{{Cite journal |last1=Friedler |first1=Sorelle A. |last2=Scheidegger |first2=Carlos |last3=Venkatasubramanian |first3=Suresh |date=April 2021 |title=The (Im)possibility of fairness: different value systems require different mechanisms for fair decision making |url=https://dl.acm.org/doi/10.1145/3433949 |journal=Communications of the ACM |language=en |volume=64 |issue=4 |pages=136–143 |doi=10.1145/3433949 |s2cid=1769114 |issn=0001-0782}}</ref> अन्य अनुसंधान विषयों में पूर्वाग्रह की उत्पत्ति, पूर्वाग्रह के प्रकार और पूर्वाग्रह को कम करने के प्रकार सम्मिलित हैं।<ref>{{Cite journal |last1=Mehrabi |first1=Ninareh |last2=Morstatter |first2=Fred |last3=Saxena |first3=Nripsuta |last4=Lerman |first4=Kristina |last5=Galstyan |first5=Aram |date=2021-07-13 |title=मशीन लर्निंग में पूर्वाग्रह और निष्पक्षता पर एक सर्वेक्षण|url=https://doi.org/10.1145/3457607 |journal=ACM Computing Surveys |volume=54 |issue=6 |pages=115:1–115:35 |doi=10.1145/3457607 |arxiv=1908.09635 |s2cid=201666566 |issn=0360-0300}}</ref>


आधुनिक वर्षों में तकनीकी कंपनियों ने मशीन लर्निंग में पूर्वाग्रह का पता लगाने और उसे कम करने के प्रकार पर उपकरण और नियमावली बनाए हैं। [[आईबीएम]] के पास सॉफ्टवेयर पूर्वाग्रह को कम करने और इसकी निष्पक्षता बढ़ाने के लिए कई एल्गोरिदम के साथ [[पायथन (प्रोग्रामिंग भाषा)]] और [[आर (प्रोग्रामिंग भाषा)|R (प्रोग्रामिंग भाषा)]] के लिए उपकरण हैं।<ref name="IBM">{{Cite web |title=AI Fairness 360 |url=https://aif360.mybluemix.net/ |access-date=2022-11-18 |website=aif360.mybluemix.net}}</ref><ref>{{cite web |title=IBM AI Fairness 360 open source toolkit adds new functionalities |date=4 June 2020 |url=http://www.techrepublic.com/google-amp/article/ibm-ai-fairness-360-open-source-toolkit-adds-new-functionalities/ |publisher=Tech Republic}}</ref> [[Google|गूगल]] ने मशीन लर्निंग में पूर्वाग्रह का अध्ययन करने और उससे प्रतिरोध के लिए दिशानिर्देश और उपकरण प्रकाशित किए हैं।<ref>{{Cite web |title=जिम्मेदार एआई अभ्यास|url=https://ai.google/responsibilities/responsible-ai-practices/ |access-date=2022-11-18 |website=Google AI |language=en}}</ref><ref>{{Citation |title=Fairness Indicators |date=2022-11-10 |url=https://github.com/tensorflow/fairness-indicators |publisher=tensorflow |access-date=2022-11-18}}</ref> [[फेसबुक]] ने अपनी[[ कृत्रिम होशियारी | एआई]] में पूर्वाग्रह का पता लगाने के लिए एक टूल, निष्पक्षता प्रवाह के उपयोग की सूचना दी है।<ref>{{Cite web |title=हम एआई बनाने में मदद के लिए फेयरनेस फ्लो का उपयोग कैसे कर रहे हैं जो सभी के लिए बेहतर काम करता है|url=https://ai.facebook.com/blog/how-were-using-fairness-flow-to-help-build-ai-that-works-better-for-everyone/ |access-date=2022-11-18 |website=ai.facebook.com |language=en}}</ref> हालाँकि, आलोचकों ने तर्क दिया है कि कंपनी के प्रयास अपर्याप्त हैं, कर्मचारियों द्वारा टूल के बहुत कम उपयोग की सूचना दी गई है क्योंकि इसका उपयोग उनके सभी कार्यक्रमों के लिए नहीं किया जा सकता है और जब हो भी सकता है, टूल का उपयोग वैकल्पिक है।<ref>{{Cite web |date=2021-03-31 |title=एआई विशेषज्ञों ने चेतावनी दी है कि फेसबुक का पूर्वाग्रह-विरोधी उपकरण 'पूरी तरह से अपर्याप्त' है|url=https://venturebeat.com/business/ai-experts-warn-facebooks-anti-bias-tool-is-completely-insufficient/ |access-date=2022-11-18 |website=VentureBeat |language=en-US}}</ref>
आधुनिक वर्षों में तकनीकी कंपनियों ने यंत्र अधिगम में पूर्वाग्रह का पता लगाने और उसे कम करने के प्रकार पर उपकरण और नियमावली बनाते हैं। [[आईबीएम]] के पास सॉफ्टवेयर पूर्वाग्रह को कम करने और इसकी निष्पक्षता बढ़ाने के लिए कई कलनविधि के साथ [[पायथन (प्रोग्रामिंग भाषा)]] और [[आर (प्रोग्रामिंग भाषा)|R (प्रोग्रामिंग भाषा)]] के लिए उपकरण हैं।<ref name="IBM">{{Cite web |title=AI Fairness 360 |url=https://aif360.mybluemix.net/ |access-date=2022-11-18 |website=aif360.mybluemix.net}}</ref><ref>{{cite web |title=IBM AI Fairness 360 open source toolkit adds new functionalities |date=4 June 2020 |url=http://www.techrepublic.com/google-amp/article/ibm-ai-fairness-360-open-source-toolkit-adds-new-functionalities/ |publisher=Tech Republic}}</ref> [[Google|गूगल]] ने यंत्र अधिगम में पूर्वाग्रह का अध्ययन करने और उससे प्रतिरोध के लिए दिशानिर्देश और उपकरण प्रकाशित किए हैं।<ref>{{Cite web |title=जिम्मेदार एआई अभ्यास|url=https://ai.google/responsibilities/responsible-ai-practices/ |access-date=2022-11-18 |website=Google AI |language=en}}</ref><ref>{{Citation |title=Fairness Indicators |date=2022-11-10 |url=https://github.com/tensorflow/fairness-indicators |publisher=tensorflow |access-date=2022-11-18}}</ref> [[फेसबुक]] ने अपनी[[ कृत्रिम होशियारी | एआई]] में पूर्वाग्रह का पता लगाने के लिए एक टूल, निष्पक्षता प्रवाह के उपयोग की सूचना दी है।<ref>{{Cite web |title=हम एआई बनाने में मदद के लिए फेयरनेस फ्लो का उपयोग कैसे कर रहे हैं जो सभी के लिए बेहतर काम करता है|url=https://ai.facebook.com/blog/how-were-using-fairness-flow-to-help-build-ai-that-works-better-for-everyone/ |access-date=2022-11-18 |website=ai.facebook.com |language=en}}</ref> हालाँकि, आलोचकों ने तर्क दिया है कि कंपनी के प्रयास अपर्याप्त हैं, कर्मचारियों द्वारा टूल के बहुत कम उपयोग की सूचना दी गई है क्योंकि इसका उपयोग उनके सभी कार्यक्रमों के लिए नहीं किया जा सकता है और जब यह संभव हो, तब भी उपकरण का उपयोग वैकल्पिक है।<ref>{{Cite web |date=2021-03-31 |title=एआई विशेषज्ञों ने चेतावनी दी है कि फेसबुक का पूर्वाग्रह-विरोधी उपकरण 'पूरी तरह से अपर्याप्त' है|url=https://venturebeat.com/business/ai-experts-warn-facebooks-anti-bias-tool-is-completely-insufficient/ |access-date=2022-11-18 |website=VentureBeat |language=en-US}}</ref>


यह ध्यान रखना महत्वपूर्ण है कि निर्णय लेने में निष्पक्षता और अन्यायपूर्ण भेदभाव का परीक्षण करने के मात्रात्मक प्रकार के बारे में परिचर्चा मशीन लर्निंग में निष्पक्षता पर आधुनिक तर्क वितर्क से कई दशकों पहले हुई थी।<ref name="Hutchinson Mitchell 2019 p.">{{cite conference | last=Hutchinson | first=Ben | last2=Mitchell | first2=Margaret | title=50 Years of Test (Un)fairness | publisher=ACM FAT*'19| publication-place=New York, NY, USA | date=2019-01-29 | doi=10.1145/3287560.3287600 | page=}}</ref> वास्तव में, वैज्ञानिक समुदाय द्वारा इस विषय पर एक सजीव परिचर्चा 1960 और [[1970 के दशक]] के मध्य में उन्नतिशील, जो ज्यादातर अमेरिकी नागरिक अधिकार आंदोलन और विशेष रूप से, 1964 के अमेरिकी नागरिक अधिकार अधिनियम के अनुच्छेद परिणामस्वरूप हुई है। हालाँकि, 1970 के दशक के अंत तक, तर्क वितर्क व्यापक रुप से लुप्त हो गई, क्योंकि निष्पक्षता की अलग-अलग और कभी-कभी प्रतिस्पर्धी धारणाओं ने स्पष्टता के लिए बहुत कम जगह छोड़ी कि कब निष्पक्षता की एक धारणा दूसरे के लिए श्रेष्ठ हो सकती है।
यह ध्यान रखना महत्वपूर्ण है कि निर्णय लेने में निष्पक्षता और अन्यायपूर्ण भेदभाव का परीक्षण करने के मात्रात्मक प्रकार के बारे में परिचर्चा यंत्र अधिगम में निष्पक्षता पर आधुनिक तर्क वितर्क से कई दशकों पहले हुई थी।<ref name="Hutchinson Mitchell 2019 p.">{{cite conference | last=Hutchinson | first=Ben | last2=Mitchell | first2=Margaret | title=50 Years of Test (Un)fairness | publisher=ACM FAT*'19| publication-place=New York, NY, USA | date=2019-01-29 | doi=10.1145/3287560.3287600 | page=}}</ref> वास्तव में, वैज्ञानिक समुदाय द्वारा इस विषय पर एक सजीव परिचर्चा 1960 और [[1970 के दशक]] के मध्य में उन्नतिशील, जो ज्यादातर अमेरिकी नागरिक अधिकार आंदोलन और विशेष रूप से, 1964 के अमेरिकी नागरिक अधिकार अधिनियम के अनुच्छेद परिणामस्वरूप हुई है। हालाँकि, 1970 के दशक के अंत तक, तर्क वितर्क व्यापक रुप से लुप्त हो गए, क्योंकि निष्पक्षता की अलग-अलग और कभी-कभी प्रतिस्पर्धी धारणाओं ने स्पष्टता के लिए बहुत कम जगह छोड़ी कि कब निष्पक्षता की एक धारणा दूसरे के लिए श्रेष्ठ हो सकती है।


==विवाद==
==विवाद==
{{Main|एल्गोरिथम पूर्वाग्रह#प्रभाव}}
{{Main|कलनविधि पूर्वाग्रह#प्रभाव}}


कानूनी प्रणाली में कलनविधीय निर्णय लेने का उपयोग अनुसंधान के अंतर्गत उपयोग का एक उल्लेखनीय क्षेत्र रहा है। 2014 में, तत्कालीन संयुक्त राज्य अमेरिका के अटॉर्नी जनरल [[एरिक होल्डर]] ने चिंता जताई कि "जोखिम निर्धारण" के प्रकार उन कारकों पर अनुचित ध्यान केंद्रित कर सकते हैं जो प्रतिवादी के नियंत्रण में नहीं हैं, जैसे कि उनकी शिक्षा का स्तर या सामाजिक-आर्थिक पृष्ठभूमि हैं।<ref>{{Cite web |date=2014-08-01 |title=Attorney General Eric Holder Speaks at the National Association of Criminal Defense Lawyers 57th Annual Meeting and 13th State Criminal Justice Network Conference |url=https://www.justice.gov/opa/speech/attorney-general-eric-holder-speaks-national-association-criminal-defense-lawyers-57th |access-date=2022-04-16 |website=www.justice.gov |language=en}}</ref> कम्पास (सॉफ्टवेयर) पर प्रोपब्लिका की 2016 की रिपोर्ट में दावा किया गया है कि काले प्रतिवादियों को सफेद प्रतिवादियों की तुलना में गलत प्रकार से उच्च जोखिम के रूप में लेबल किए जाने की संभावना लगभग दोगुनी थी, जबकि सफेद प्रतिवादियों के साथ विपरीत मिथ्याी हुई थी।<ref name=":0">{{Cite web |last=Mattu |first=Julia Angwin,Jeff Larson,Lauren Kirchner,Surya |title=मशीन पूर्वाग्रह|url=https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing |access-date=2022-04-16 |website=ProPublica |language=en}}</ref> कम्पास (सॉफ्टवेयर) के निर्माता, नॉर्थपॉइंट इंक ने रिपोर्ट का खंडन करते हुए दावा किया कि उनका उपकरण निष्पक्ष है और प्रोपब्लिका ने सांख्यिकीय त्रुटियां की हैं,<ref>{{Cite journal |last1=Dieterich |first1=William |last2=Mendoza |first2=Christina |last3=Brennan |first3=Tim |date=2016 |title=COMPAS Risk Scales: Demonstrating Accuracy Equity and Predictive Parity |url=https://njoselson.github.io/pdfs/ProPublica_Commentary_Final_070616.pdf |journal=Northpointe Inc}}</ref> जिसे बाद में प्रोपब्लिका द्वारा फिर से खंडन कर दिया गया हैं।<ref>{{Cite web |last=Angwin |first=Jeff Larson,Julia |title=नॉर्थपॉइंट को तकनीकी प्रतिक्रिया|url=https://www.propublica.org/article/technical-response-to-northpointe |access-date=2022-11-18 |website=ProPublica |date=29 July 2016 |language=en}}</ref>
कानूनी प्रणाली में कलनविधि निर्णय लेने का उपयोग अनुसंधान के अंतर्गत उपयोग का एक उल्लेखनीय क्षेत्र रहा है। 2014 में, तत्कालीन संयुक्त राज्य अमेरिका के अटॉर्नी सार्वजनिक [[एरिक होल्डर]] ने चिंता जताई कि "जोखिम निर्धारण" के प्रकार उन कारकों पर अनुचित ध्यान केंद्रित कर सकते हैं जो प्रतिवादी के नियंत्रण में नहीं हैं, जैसे कि उनकी शिक्षा का स्तर या सामाजिक-आर्थिक पृष्ठभूमि हैं।<ref>{{Cite web |date=2014-08-01 |title=Attorney General Eric Holder Speaks at the National Association of Criminal Defense Lawyers 57th Annual Meeting and 13th State Criminal Justice Network Conference |url=https://www.justice.gov/opa/speech/attorney-general-eric-holder-speaks-national-association-criminal-defense-lawyers-57th |access-date=2022-04-16 |website=www.justice.gov |language=en}}</ref> कम्पास (सॉफ्टवेयर) पर प्रोपब्लिका की 2016 की प्रतिवेदन में दावा किया गया है कि काले प्रतिवादियों को सफेद प्रतिवादियों की तुलना में गलत प्रकार से उच्च जोखिम के रूप में लेबल किए जाने की संभावना लगभग दोगुनी थी, जबकि सफेद प्रतिवादियों के साथ विपरीत गलती हुई थी।<ref name=":0">{{Cite web |last=Mattu |first=Julia Angwin,Jeff Larson,Lauren Kirchner,Surya |title=मशीन पूर्वाग्रह|url=https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing |access-date=2022-04-16 |website=ProPublica |language=en}}</ref> कम्पास (सॉफ्टवेयर) के निर्माता, नॉर्थपॉइंट इंक ने प्रतिवेदन का खंडन करते हुए दावा किया कि उनका उपकरण निष्पक्ष है और प्रोपब्लिका ने सांख्यिकीय त्रुटियां की हैं,<ref>{{Cite journal |last1=Dieterich |first1=William |last2=Mendoza |first2=Christina |last3=Brennan |first3=Tim |date=2016 |title=COMPAS Risk Scales: Demonstrating Accuracy Equity and Predictive Parity |url=https://njoselson.github.io/pdfs/ProPublica_Commentary_Final_070616.pdf |journal=Northpointe Inc}}</ref> जिसे बाद में प्रोपब्लिका द्वारा फिर से खंडन कर दिया गया हैं।<ref>{{Cite web |last=Angwin |first=Jeff Larson,Julia |title=नॉर्थपॉइंट को तकनीकी प्रतिक्रिया|url=https://www.propublica.org/article/technical-response-to-northpointe |access-date=2022-11-18 |website=ProPublica |date=29 July 2016 |language=en}}</ref>


प्रतिबिंब पहचान एल्गोरिदम में प्रजातीय और लिंग पूर्वाग्रह भी नोट किया गया है। कैमरों में चेहरे और गतिविधि का पता लगाने से गैर-श्वेत विषयों के चेहरे के भावों को अनदेखा या मिथ्या लेबल करना पाया गया है।<ref>{{Cite magazine |last=Rose |first=Adam |date=2010-01-22 |language=en-US |magazine=Time |url=http://content.time.com/time/business/article/0,8599,1954643,00.html |title=Are face-detection cameras racist? |access-date=2022-11-18 |issn=0040-781X}}</ref> 2015 में, [[फ़्लिकर]] और [[Google|गूगल]] फ़ोटो दोनों में स्वचालित टैगिंग सुविधा काले लोगों को "जानवर" और "गोरिल्ला" जैसे टैग के साथ लेबल करने के लिए पाई गई थी।<ref>{{Cite web |date=2015-07-01 |title=Google ने फोटो ऐप में नस्लवादी ऑटो-टैग के लिए खेद जताया है|url=http://www.theguardian.com/technology/2015/jul/01/google-sorry-racist-auto-tag-photo-app |access-date=2022-04-16 |website=The Guardian |language=en}}</ref> एआई एल्गोरिदम द्वारा निर्णय ली गई 2016 की एक अंतर्राष्ट्रीय सौंदर्य प्रतियोगिता को हल्की त्वचा वाले व्यक्तियों के प्रति पक्षपाती पाया गया, संभवतः प्रशिक्षण डेटा में पूर्वाग्रह के कारण पाया गया है। <ref>{{Cite web |date=2016-09-08 |title=एक सौंदर्य प्रतियोगिता का मूल्यांकन एआई द्वारा किया गया और रोबोटों को सांवली त्वचा पसंद नहीं आई|url=http://www.theguardian.com/technology/2016/sep/08/artificial-intelligence-beauty-contest-doesnt-like-black-people |access-date=2022-04-16 |website=The Guardian |language=en}}</ref> 2018 में तीन व्यावसायिक लिंग वर्गीकरण एल्गोरिदम के एक अध्ययन में पाया गया कि सभी तीन एल्गोरिदम सामान्यतः गोरी त्वचा वाले पुरुषों को वर्गीकृत करते समय सबसे यथार्थ थे और गहरे रंग की महिलाओं को वर्गीकृत करते समय सबसे खराब थे।<ref name="Buolamwini2018"> {{cite conference |last1=Buolamwini |first1=Joy |author-link1=Joy Buolamwini |last2=Gebru |first2=Timnit |author-link2=Timnit Gebru |date=February 2018 |title=Gender Shades: Intersectional Accuracy Disparities in Commercial Gender Classification |url=http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf |conference=Conference on Fairness, Accountability and Transparency |location=New York, NY, USA |pages=77–91}}</ref> 2020 में, [[ट्विटर]] के एक प्रतिबिंब क्रॉपिंग टूल में पतले त्वचा वाले चेहरों को प्राथमिकता देते हुए दिखाया गया था।<ref>{{Cite web |date=2021-08-10 |title=छात्र ने ट्विटर एल्गोरिदम को हल्के, पतले, युवा चेहरों के प्रति 'पूर्वाग्रह' साबित किया|url=http://www.theguardian.com/technology/2021/aug/10/twitters-image-cropping-algorithm-prefers-younger-slimmer-faces-with-lighter-skin-analysis |access-date=2022-11-18 |website=The Guardian |language=en}}</ref> [[DALL-E]], एक मशीन लर्निंग [[टेक्स्ट-टू-इमेज मॉडल|टेक्स्ट-टू-प्रतिबिंब प्रतिरूप]], जिसे 2021 में जारी किया गया था, जातिवादी और लिंग भेद छवियां बनाने के लिए प्रवृत्त रहा है जो सामाजिक रूढ़िवादिता को मजबूत करता है, जिसे इसके रचनाकारों ने स्वीकार किया है।<ref>{{Citation |title=openai/dalle-2-preview |date=2022-11-17 |url=https://github.com/openai/dalle-2-preview/blob/eeec5a1843b1d17cb9ed113117a2fcaa9206a564/system-card.md |publisher=OpenAI |access-date=2022-11-18}}</ref>
प्रतिबिंब पहचान कलनविधि में प्रजातीय और लिंग पूर्वाग्रह भी विख्यात किया गया है। कैमरों में चेहरे और गतिविधि का पता लगाने से गैर-श्वेत विषयों के चेहरे के भावों को अनदेखा या गलत लेबल करना पाया गया है।<ref>{{Cite magazine |last=Rose |first=Adam |date=2010-01-22 |language=en-US |magazine=Time |url=http://content.time.com/time/business/article/0,8599,1954643,00.html |title=Are face-detection cameras racist? |access-date=2022-11-18 |issn=0040-781X}}</ref> 2015 में, [[फ़्लिकर]] और [[Google|गूगल]] फ़ोटो दोनों में स्वचालित टैगिंग सुविधा काले लोगों को "जानवर" और "गोरिल्ला" जैसे टैग के साथ लेबल करने के लिए पाई गई थी।<ref>{{Cite web |date=2015-07-01 |title=Google ने फोटो ऐप में नस्लवादी ऑटो-टैग के लिए खेद जताया है|url=http://www.theguardian.com/technology/2015/jul/01/google-sorry-racist-auto-tag-photo-app |access-date=2022-04-16 |website=The Guardian |language=en}}</ref> एआई कलनविधि द्वारा निर्णय ली गई 2016 की एक अंतर्राष्ट्रीय सौंदर्य प्रतियोगिता को हल्की त्वचा वाले व्यक्तियों के प्रति पक्षपाती पाया गया, संभवतः प्रशिक्षण डेटा में पूर्वाग्रह के कारण पाया गया है। <ref>{{Cite web |date=2016-09-08 |title=एक सौंदर्य प्रतियोगिता का मूल्यांकन एआई द्वारा किया गया और रोबोटों को सांवली त्वचा पसंद नहीं आई|url=http://www.theguardian.com/technology/2016/sep/08/artificial-intelligence-beauty-contest-doesnt-like-black-people |access-date=2022-04-16 |website=The Guardian |language=en}}</ref> 2018 में तीन व्यावसायिक लिंग वर्गीकरण कलनविधि के एक अध्ययन में पाया गया कि सभी तीन कलनविधि सामान्यतः गोरी त्वचा वाले पुरुषों को वर्गीकृत करते समय सबसे यथार्थ थे और गहरे रंग की महिलाओं को वर्गीकृत करते समय सबसे निकृष्टतम थे।<ref name="Buolamwini2018"> {{cite conference |last1=Buolamwini |first1=Joy |author-link1=Joy Buolamwini |last2=Gebru |first2=Timnit |author-link2=Timnit Gebru |date=February 2018 |title=Gender Shades: Intersectional Accuracy Disparities in Commercial Gender Classification |url=http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf |conference=Conference on Fairness, Accountability and Transparency |location=New York, NY, USA |pages=77–91}}</ref> 2020 में, [[ट्विटर]] के एक प्रतिबिंब क्रॉपिंग टूल में पतले त्वचा वाले चेहरों को प्राथमिकता देते हुए दिखाया गया था।<ref>{{Cite web |date=2021-08-10 |title=छात्र ने ट्विटर एल्गोरिदम को हल्के, पतले, युवा चेहरों के प्रति 'पूर्वाग्रह' साबित किया|url=http://www.theguardian.com/technology/2021/aug/10/twitters-image-cropping-algorithm-prefers-younger-slimmer-faces-with-lighter-skin-analysis |access-date=2022-11-18 |website=The Guardian |language=en}}</ref> [[DALL-E]], एक यंत्र अधिगम [[टेक्स्ट-टू-इमेज मॉडल|टेक्स्ट-टू-प्रतिबिंब प्रतिरूप]], जिसे 2021 में जारी किया गया था, जातिवादी और लिंग भेद प्रतिबिंब बनाने के लिए प्रवृत्त रहा है जो सामाजिक रूढ़िवादिता को मजबूत करता है, जिसे इसके रचनाकारों ने स्वीकार किया है।<ref>{{Citation |title=openai/dalle-2-preview |date=2022-11-17 |url=https://github.com/openai/dalle-2-preview/blob/eeec5a1843b1d17cb9ed113117a2fcaa9206a564/system-card.md |publisher=OpenAI |access-date=2022-11-18}}</ref>


अन्य क्षेत्र जहां मशीन लर्निंग एल्गोरिदम का उपयोग किया जाता है, उन्हें पक्षपातपूर्ण दिखाया गया है, उनमें नौकरी और ऋण आवेदन सम्मिलित हैं। अमेज़ॅन (कंपनी) ने ऐसे नौकरी आवेदनों की समीक्षा करने के लिए सॉफ़्टवेयर का उपयोग किया है जो लैंगिक भेदभाव वाले थे, उदाहरण के लिए उन बायोडाटा को दंडित करके जिनमें महिला शब्द सम्मिलित था।<ref>{{Cite news |date=2018-10-10 |title=अमेज़ॅन ने गुप्त एआई भर्ती उपकरण को रद्द कर दिया जो महिलाओं के खिलाफ पूर्वाग्रह दिखाता था|language=en |work=Reuters |url=https://www.reuters.com/article/us-amazon-com-jobs-automation-insight-idUSKCN1MK08G |access-date=2022-11-18}}</ref> 2019 में, अपने नए [[एप्पल कार्ड]] के लिए क्रेडिट कार्ड की सीमा निर्धारित करने के लिए ऐप्पल इंक के एल्गोरिदम ने महिलाओं की तुलना में पुरुषों को बहुत अधिक सीमाएं दीं हैं, यहां तक ​​​​कि उन जोड़ों के लिए भी जो अपने वित्त को साझा करते हैं।<ref>{{Cite news |title=एप्पल कार्ड एल्गोरिदम ने गोल्डमैन सैक्स के खिलाफ लैंगिक भेदभाव के आरोपों को जन्म दिया|language=en-US |newspaper=Washington Post |url=https://www.washingtonpost.com/business/2019/11/11/apple-card-algorithm-sparks-gender-bias-allegations-against-goldman-sachs/ |access-date=2022-11-18 |issn=0190-8286}}</ref> 2021 में द [[मार्कअप]] की एक रिपोर्ट के अनुसार अमेरिका में उपयोग में आने वाले बंधक-अनुमोदन एल्गोरिदम में गैर-श्वेत आवेदकों को अस्वीकार करने की अधिक संभावना दिखाई गई है।<ref>{{Cite web |last1=Martinez |first1=Emmanuel |last2=Kirchner |first2=Lauren |title=The Secret Bias Hidden in Mortgage-Approval Algorithms – The Markup |url=https://themarkup.org/denied/2021/08/25/the-secret-bias-hidden-in-mortgage-approval-algorithms |access-date=2022-11-18 |website=themarkup.org |date=25 August 2021 |language=en}}</ref>
अन्य क्षेत्र जहां यंत्र अधिगम कलनविधि का उपयोग किया जाता है, उन्हें पक्षपातपूर्ण दिखाया गया है, उनमें नौकरी और ऋण आवेदन सम्मिलित हैं। अमेज़ॅन (कंपनी) ने ऐसे नौकरी आवेदनों की समीक्षा करने के लिए सॉफ़्टवेयर का उपयोग किया है जो लैंगिक भेदभाव वाले थे, उदाहरण के लिए उन बायोडाटा को दंडित करके जिनमें महिला शब्द सम्मिलित था।<ref>{{Cite news |date=2018-10-10 |title=अमेज़ॅन ने गुप्त एआई भर्ती उपकरण को रद्द कर दिया जो महिलाओं के खिलाफ पूर्वाग्रह दिखाता था|language=en |work=Reuters |url=https://www.reuters.com/article/us-amazon-com-jobs-automation-insight-idUSKCN1MK08G |access-date=2022-11-18}}</ref> 2019 में, अपने नए [[एप्पल कार्ड]] के लिए क्रेडिट कार्ड की सीमा निर्धारित करने के लिए ऐप्पल इंक के कलनविधि ने महिलाओं की तुलना में पुरुषों को बहुत अधिक सीमाएं दीं हैं, यहां तक ​​​​कि उन जोड़ों के लिए भी जो अपने वित्त को साझा करते हैं।<ref>{{Cite news |title=एप्पल कार्ड एल्गोरिदम ने गोल्डमैन सैक्स के खिलाफ लैंगिक भेदभाव के आरोपों को जन्म दिया|language=en-US |newspaper=Washington Post |url=https://www.washingtonpost.com/business/2019/11/11/apple-card-algorithm-sparks-gender-bias-allegations-against-goldman-sachs/ |access-date=2022-11-18 |issn=0190-8286}}</ref> 2021 में द [[मार्कअप]] की एक प्रतिवेदन के अनुसार अमेरिका में उपयोग में आने वाले बंधक-अनुमोदन कलनविधि में गैर-श्वेत आवेदकों को अस्वीकार करने की अधिक संभावना दिखाई गई है।<ref>{{Cite web |last1=Martinez |first1=Emmanuel |last2=Kirchner |first2=Lauren |title=The Secret Bias Hidden in Mortgage-Approval Algorithms – The Markup |url=https://themarkup.org/denied/2021/08/25/the-secret-bias-hidden-in-mortgage-approval-algorithms |access-date=2022-11-18 |website=themarkup.org |date=25 August 2021 |language=en}}</ref>
== सीमाएँ ==
== सीमाएँ ==
{{Main|एल्गोरिथम पूर्वाग्रह#अनुसंधान में बाधाएँ}}
{{Main|कलनविधि पूर्वाग्रह#अनुसंधान में बाधाएँ}}


आधुनिक कार्य मशीन लर्निंग में निष्पक्षता के वर्तमान परिदृश्य में कई सीमाओं की उपस्थिति को रेखांकित करते हैं, विशेष रुप से जब बात आती है कि एआई के लगातार बढ़ते वास्तविक दुनिया अनुप्रयोगों में इस संबंध में वास्तविक रूप से क्या प्राप्त किया जा सकता है। <ref name="Buyl De Bie p. ">{{cite journal | last=Buyl | first=Maarten | last2=De Bie | first2=Tijl | title=एआई निष्पक्षता की अंतर्निहित सीमाएँ| journal=arXiv | publisher=arXiv | doi=10.48550/ARXIV.2212.06495 | url=https://arxiv.org/abs/2212.06495 | access-date=2023-11-25 | page=}}</ref><ref name="Castelnovo Inverardi Nanino Penco p. ">{{cite journal | last=Castelnovo | first=Alessandro | last2=Inverardi | first2=Nicole | last3=Nanino | first3=Gabriele | last4=Penco | first4=Ilaria Giuseppina | last5=Regoli | first5=Daniele | title=Fair Enough? A map of the current limitations of the requirements to have "fair'' algorithms | journal=arXiv | doi=10.48550/ARXIV.2311.12435 | url=https://arxiv.org/abs/2311.12435 | access-date=2023-11-25 | page=}}</ref> उदाहरण के लिए, निष्पक्षता को औपचारिक बनाने के लिए गणितीय और मात्रात्मक दृष्टिकोण, और संबंधित "डी-बायसिंग" दृष्टिकोण, बहुत सरल और आसानी से उपेक्षित की जाने वाली धारणाओं पर भरोसा किया जा सकता है, जैसे कि व्यक्तियों को पूर्व-परिभाषित सामाजिक समूहों में वर्गीकृत करना है। अन्य कमज़ोर पहलू हैं, उदाहरण के लिए, कई उचित विशेषताओं के मध्य परस्पर क्रिया,<ref name="Buolamwini2018" />और गैर-भेदभाव की स्पष्ट और साझा दार्शनिक और/या कानूनी धारणा का अभाव है।
आधुनिक कार्य यंत्र अधिगम में निष्पक्षता के वर्तमान परिदृश्य में कई सीमाओं की उपस्थिति को रेखांकित करते हैं, विशेष रुप से जब बात आती है कि एआई के लगातार बढ़ते वास्तविक दुनिया अनुप्रयोगों में इस संबंध में वास्तविक रूप से क्या प्राप्त किया जा सकता है। <ref name="Buyl De Bie p. ">{{cite journal | last=Buyl | first=Maarten | last2=De Bie | first2=Tijl | title=एआई निष्पक्षता की अंतर्निहित सीमाएँ| journal=arXiv | publisher=arXiv | doi=10.48550/ARXIV.2212.06495 | url=https://arxiv.org/abs/2212.06495 | access-date=2023-11-25 | page=}}</ref><ref name="Castelnovo Inverardi Nanino Penco p. ">{{cite journal | last=Castelnovo | first=Alessandro | last2=Inverardi | first2=Nicole | last3=Nanino | first3=Gabriele | last4=Penco | first4=Ilaria Giuseppina | last5=Regoli | first5=Daniele | title=Fair Enough? A map of the current limitations of the requirements to have "fair'' algorithms | journal=arXiv | doi=10.48550/ARXIV.2311.12435 | url=https://arxiv.org/abs/2311.12435 | access-date=2023-11-25 | page=}}</ref> उदाहरण के लिए, निष्पक्षता को औपचारिक बनाने के लिए गणितीय और मात्रात्मक दृष्टिकोण, और संबंधित "डी-बायसिंग" दृष्टिकोण, बहुत सरल और आसानी से उपेक्षित की जाने वाली धारणाओं पर भरोसा किया जा सकता है, जैसे कि व्यक्तियों को पूर्व-परिभाषित सामाजिक समूहों में वर्गीकृत करना है। अन्य कमज़ोर पहलू हैं, उदाहरण के लिए, कई उचित विशेषताओं के मध्य परस्पर क्रिया,<ref name="Buolamwini2018" />और गैर-भेदभाव की स्पष्ट और साझा दार्शनिक और/या कानूनी धारणा का अभाव है।


== समूह निष्पक्षता मानदंड ==
== समूह निष्पक्षता मानदंड ==
[[सांख्यिकीय वर्गीकरण|वर्गीकरण]] समस्याओं में, एक एल्गोरिदम ज्ञात विशेषताओं <math display="inline"> X </math> से एक अलग विशेषता <math display="inline"> Y </math>, लक्ष्य चर की भविष्यवाणी करने के लिए एक फलन सीखता है। हम <math display="inline"> A </math> को एक अलग यादृच्छिक चर के रूप में प्रतिरूप करते हैं जो <math display="inline"> X </math> में निहित या अंतर्निहित रूप से कूटलिखित की गई कुछ विशेषताओं को कूटलेखन करना है  जिन्हें हम संवेदनशील विशेषताओं (लिंग, जातीयता, यौन अभिविन्यास, इत्यादि) के रूप में मानते हैं। हम अंततः वर्गीकरण की भविष्यवाणी को <math display="inline"> R </math> द्वारा निरूपित करते हैं। अब मूल्यांकन करने के लिए तीन मुख्य मानदंडों को परिभाषित करें कि क्या कोई दिया गया वर्गीकरण निष्पक्ष है, अर्थात् इसकी भविष्यवाणियां इनमें से कुछ संवेदनशील चर से प्रभावित नहीं हैं।<ref name="Barocas">Solon Barocas; Moritz Hardt; Arvind Narayanan, [http://www.fairmlbook.org ''Fairness and Machine Learning'']. Retrieved 15 December 2019.</ref>
[[सांख्यिकीय वर्गीकरण|वर्गीकरण]] समस्याओं में, एक कलनविधि ज्ञात विशेषताओं <math display="inline"> X </math> से एक अलग विशेषता <math display="inline"> Y </math>, लक्ष्य चर की भविष्यवाणी करने के लिए एक फलन सीखता है। हम <math display="inline"> A </math> को एक अलग यादृच्छिक चर के रूप में प्रतिरूप करते हैं जो <math display="inline"> X </math> में निहित या अंतर्निहित रूप से कूटलिखित की गई कुछ विशेषताओं को कूटलेखन करना है  जिन्हें हम संवेदनशील विशेषताओं (लिंग, जातीयता, लैंगिक अभिविन्यास, इत्यादि) के रूप में मानते हैं। हम अंततः वर्गीकरण की भविष्यवाणी को <math display="inline"> R </math> द्वारा निरूपित करते हैं। अब मूल्यांकन करने के लिए तीन मुख्य मानदंडों को परिभाषित करें कि क्या कोई दिया गया वर्गीकरण निष्पक्ष है, अर्थात् इसकी भविष्यवाणियां इनमें से कुछ संवेदनशील चर से प्रभावित नहीं हैं।<ref name="Barocas">Solon Barocas; Moritz Hardt; Arvind Narayanan, [http://www.fairmlbook.org ''Fairness and Machine Learning'']. Retrieved 15 December 2019.</ref>
=== स्वतंत्रता ===
=== स्वतंत्रता ===


Line 47: Line 47:
इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं:
इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं:
<math display="block"> P(R = r\ |\ Y = q, A = a) = P(R = r\ |\ Y = q, A = b) \quad \forall r \in R \quad q \in Y \quad \forall a,b \in A </math>
<math display="block"> P(R = r\ |\ Y = q, A = a) = P(R = r\ |\ Y = q, A = b) \quad \forall r \in R \quad q \in Y \quad \forall a,b \in A </math>
इसका अर्थ यह है कि संवेदनशील विशेषता <math>A</math> पर निर्णय <math>R</math>  की सभी निर्भरता को वास्तविक लक्ष्य चर <math>Y</math> की वास्तविक निर्भरता द्वारा उचित ठहराया जाना चाहिए।
इसका अर्थ यह है कि संवेदनशील विशेषता <math>A</math> पर निर्णय <math>R</math>  की सभी निर्भरता को वास्तविक लक्ष्य चर <math>Y</math> की वास्तविक निर्भरता द्वारा उचित ठहराया जाता है।


द्विआधारी लक्ष्य दर के विषय में एक और समतुल्य अभिव्यक्ति यह है कि संवेदनशील विशेषताओं के प्रत्येक मूल्य के लिए [[संवेदनशीलता और विशिष्टता|वास्तविक धनात्मक दर]] और [[संवेदनशीलता और विशिष्टता|आभासी धनात्मक दर]] समान होती है (और इसलिए आभासी धनात्मक दर और वास्तविक धनात्मक दर समान होती है):
द्विआधारी लक्ष्य दर के विषय में एक और समतुल्य अभिव्यक्ति यह है कि संवेदनशील विशेषताओं के प्रत्येक मूल्य के लिए [[संवेदनशीलता और विशिष्टता|यथार्त]] [[संवेदनशीलता और विशिष्टता|धनात्मक दर]] और [[संवेदनशीलता और विशिष्टता|मिथ्या धनात्मक दर]] समान होती है (और इसलिए आभासी धनात्मक दर और वास्तविक धनात्मक दर समान होती है):
<math display="block"> P(R = 1\ |\ Y = 1, A = a) = P(R = 1\ |\ Y = 1, A = b) \quad \forall a,b \in A </math><math display="block"> P(R = 1\ |\ Y = 0, A = a) = P(R = 1\ |\ Y = 0, A = b) \quad \forall a,b \in A </math>
<math display="block"> P(R = 1\ |\ Y = 1, A = a) = P(R = 1\ |\ Y = 1, A = b) \quad \forall a,b \in A </math><math display="block"> P(R = 1\ |\ Y = 0, A = a) = P(R = 1\ |\ Y = 0, A = b) \quad \forall a,b \in A </math>
विशेष परिभाषाओं में एक संभावित छूट यह है कि दरों के मध्य अंतर के मान को शून्य के समान के बदले किसी दिए गए स्लैक <math display="inline"> \epsilon > 0 </math> से कम धनात्मक संख्या दी जाए।
विशेष परिभाषाओं में एक संभावित छूट यह है कि दरों के मध्य अंतर के मान को शून्य के समान के बदले किसी दिए गए स्लैक <math display="inline"> \epsilon > 0 </math> से कम धनात्मक संख्या दी जाती है।


कुछ क्षेत्रों में भ्रम आव्यूह में पृथक्करण (पृथक्करण गुणांक) ''अनुमानित'' संचयी प्रतिशत ऋणात्मक और ''अनुमानित'' संचयी प्रतिशत धनात्मक के मध्य की दूरी (संभावना स्कोर के दिए गए स्तर पर) का एक माप है।
कुछ क्षेत्रों में भ्रम आव्यूह में पृथक्करण (पृथक्करण गुणांक) ''अनुमानित'' संचयी प्रतिशत ऋणात्मक और ''अनुमानित'' संचयी प्रतिशत धनात्मक के मध्य की दूरी (संभावना अंक के दिए गए स्तर पर) का एक माप है।


किसी दिए गए स्कोर मान पर यह पृथक्करण गुणांक जितना अधिक होगा, प्रतिरूप एक विशेष संभाव्यता कट-ऑफ पर धनात्मक और ऋणात्मक के समुच्चय के मध्य अंतर करने में उतना ही अधिक प्रभावी होता है। मेयस के अनुसार:<ref>{{Cite book |last=Mayes |first=Elizabeth |title=क्रेडिट स्कोरिंग की हैंडबुक|publisher=Glenlake Publishing |year=2001 |isbn=0-8144-0619-X |location=NY, NY, USA |pages=282 |language=English}}</ref> "क्रेडिट उद्योग में प्रायः यह देखा जाता है कि सत्यापन उपायों का चयन प्रतिरूपण दृष्टिकोण पर निर्भर करता है। उदाहरण के लिए, यदि प्रतिरूपण प्रक्रिया प्राचलिक या अर्ध-प्राचलिक है, तो [[दो-प्रतिदर्श K-S परीक्षण|'''दो-प्रतिदर्श''' '''K-S परीक्षण''']] प्रायः उपयोग किया जाता है। यदि प्रतिरूप अनुमानी या पुनरावृत्तीय खोज विधियों द्वारा प्राप्त किया गया है, तो प्रतिरूप प्रदर्शन का माप सामान्यतः [[अपसरण|'''अपसरण''']] होता है। तीसरा विकल्प पृथक्करण का गुणांक है... अन्य दो प्रकार की तुलना में पृथक्करण का गुणांक, प्रतिरूप प्रदर्शन के माप के रूप में सबसे उचित प्रतीत होता है क्योंकि यह एक प्रतिरूप के पृथक्करण रूप को दर्शाता है।"
किसी दिए गए अंक मान पर यह पृथक्करण गुणांक जितना अधिक होगा, प्रतिरूप एक विशेष प्रायिकता कट-ऑफ पर धनात्मक और ऋणात्मक के समुच्चय के मध्य अंतर करने में उतना ही अधिक प्रभावी होता है। मेयस के अनुसार:<ref>{{Cite book |last=Mayes |first=Elizabeth |title=क्रेडिट स्कोरिंग की हैंडबुक|publisher=Glenlake Publishing |year=2001 |isbn=0-8144-0619-X |location=NY, NY, USA |pages=282 |language=English}}</ref> "क्रेडिट उद्योग में प्रायः यह देखा जाता है कि यथार्तापन उपायों का चयन प्रतिरूपण दृष्टिकोण पर निर्भर करता है। उदाहरण के लिए, यदि प्रतिरूपण प्रक्रिया प्राचलिक या अर्ध-प्राचलिक है, तो [[दो-प्रतिदर्श K-S परीक्षण|'''दो-प्रतिदर्श''' '''K-S परीक्षण''']] प्रायः उपयोग करते है। यदि प्रतिरूप अनुमानी या पुनरावृत्तीय खोज विधियों द्वारा प्राप्त किया गया है, तो प्रतिरूप प्रदर्शन का माप सामान्यतः [[अपसरण|'''अपसरण''']] होता है। तीसरा विकल्प पृथक्करण का गुणांक है... अन्य दो प्रकार की तुलना में पृथक्करण का गुणांक, प्रतिरूप प्रदर्शन के माप के रूप में सबसे उचित प्रतीत होता है क्योंकि यह एक प्रतिरूप के पृथक्करण रूप को दर्शाता है।"


=== पर्याप्तता ===
=== पर्याप्तता ===


हम कहते हैं कि यादृच्छिक चर <math display="inline">(R,A,Y)</math> '''पर्याप्तता''' को संतुष्ट करते हैं यदि संवेदनशील विशेषताएं <math display="inline"> A </math> भविष्यवाणी <math display="inline"> R </math> को देखते हुए लक्ष्य मूल्य <math display="inline"> Y </math> से सांख्यिकीय रूप से स्वतंत्र हैं, और हम लिखते हैं
हम कहते हैं कि यादृच्छिक चर <math display="inline">(R,A,Y)</math> '''पर्याप्तता''' को संतुष्ट करता हैं यदि संवेदनशील विशेषताएं <math display="inline"> A </math> भविष्यवाणी <math display="inline"> R </math> को देखते हुए लक्ष्य मूल्य <math display="inline"> Y </math> से सांख्यिकीय रूप से स्वतंत्र हैं, और हम लिखते हैं
<math display="block"> Y \bot A\ |\ R. </math>
<math display="block"> Y \bot A\ |\ R. </math>
इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं:
इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं:
Line 70: Line 70:


*यह मानते हुए कि <math display="inline"> Y </math> द्विआधारी है, यदि <math display="inline"> A </math> और <math display="inline"> Y </math> सांख्यिकीय रूप से स्वतंत्र नहीं हैं, और <math display="inline"> R </math> और <math display="inline"> Y </math> भी सांख्यिकीय रूप से स्वतंत्र नहीं हैं, तो अलंकारिक प्रकरण को छोड़कर स्वतंत्रता और पृथक्करण दोनों सम्मिलित नहीं रह सकते हैं।
*यह मानते हुए कि <math display="inline"> Y </math> द्विआधारी है, यदि <math display="inline"> A </math> और <math display="inline"> Y </math> सांख्यिकीय रूप से स्वतंत्र नहीं हैं, और <math display="inline"> R </math> और <math display="inline"> Y </math> भी सांख्यिकीय रूप से स्वतंत्र नहीं हैं, तो अलंकारिक प्रकरण को छोड़कर स्वतंत्रता और पृथक्करण दोनों सम्मिलित नहीं रह सकते हैं।
* यदि [[संयुक्त वितरण]] के रूप में <math display="inline">(R,A,Y)</math> के सभी संभावित मूल्यों के लिए धनात्मक संभाव्यता सिद्धांत है और <math display="inline"> A </math> और <math display="inline"> Y </math> सांख्यिकीय रूप से स्वतंत्र नहीं हैं, तो अलंकारिक प्रकरण को छोड़कर पृथक्करण और पर्याप्तता दोनों सम्मिलित नहीं रह सकते हैं।
* यदि [[संयुक्त वितरण]] के रूप में <math display="inline">(R,A,Y)</math> के सभी संभावित मूल्यों के लिए धनात्मक प्रायिकता सिद्धांत है और <math display="inline"> A </math> और <math display="inline"> Y </math> सांख्यिकीय रूप से स्वतंत्र नहीं हैं, तो अलंकारिक प्रकरण को छोड़कर पृथक्करण और पर्याप्तता दोनों सम्मिलित नहीं रह सकते हैं।


इसे पूर्ण निष्पक्षता कहा जाता है जब स्वतंत्रता, पृथक्करण और पर्याप्तता सभी एक साथ संतुष्ट होते हैं।<ref>{{Cite journal |last1=Berk |first1=Richard |last2=Heidari |first2=Hoda |last3=Jabbari |first3=Shahin |last4=Kearns |first4=Michael |last5=Roth |first5=Aaron |date=February 2021 |title=Fairness in Criminal Justice Risk Assessments: The State of the Art |url=http://journals.sagepub.com/doi/10.1177/0049124118782533 |journal=Sociological Methods & Research |language=en |volume=50 |issue=1 |pages=3–44 |doi=10.1177/0049124118782533 |arxiv=1703.09207 |s2cid=12924416 |issn=0049-1241}}</ref> हालाँकि, विशिष्ट अलंकारिक प्रकरण के अलावा पूर्ण निष्पक्षता प्राप्त करना संभव नहीं है। <ref name= Räz 129–137 >{{Cite book |last=Räz |first=Tim |title=निष्पक्षता, जवाबदेही और पारदर्शिता पर 2021 एसीएम सम्मेलन की कार्यवाही|chapter=Group Fairness: Independence Revisited |date=2021-03-03 |chapter-url=https://dl.acm.org/doi/10.1145/3442188.3445876 |language=en |publisher=ACM |pages=129–137 |doi=10.1145/3442188.3445876 |arxiv=2101.02968 |isbn=978-1-4503-8309-7|s2cid=231667399 }}</ref>
इसे पूर्ण निष्पक्षता कहा जाता है जब स्वतंत्रता, पृथक्करण और पर्याप्तता सभी एक साथ संतुष्ट होते हैं।<ref>{{Cite journal |last1=Berk |first1=Richard |last2=Heidari |first2=Hoda |last3=Jabbari |first3=Shahin |last4=Kearns |first4=Michael |last5=Roth |first5=Aaron |date=February 2021 |title=Fairness in Criminal Justice Risk Assessments: The State of the Art |url=http://journals.sagepub.com/doi/10.1177/0049124118782533 |journal=Sociological Methods & Research |language=en |volume=50 |issue=1 |pages=3–44 |doi=10.1177/0049124118782533 |arxiv=1703.09207 |s2cid=12924416 |issn=0049-1241}}</ref> हालाँकि, विशिष्ट अलंकारिक प्रकरण के अलावा पूर्ण निष्पक्षता प्राप्त करना संभव नहीं है। <ref name= Räz 129–137 >{{Cite book |last=Räz |first=Tim |title=निष्पक्षता, जवाबदेही और पारदर्शिता पर 2021 एसीएम सम्मेलन की कार्यवाही|chapter=Group Fairness: Independence Revisited |date=2021-03-03 |chapter-url=https://dl.acm.org/doi/10.1145/3442188.3445876 |language=en |publisher=ACM |pages=129–137 |doi=10.1145/3442188.3445876 |arxiv=2101.02968 |isbn=978-1-4503-8309-7|s2cid=231667399 }}</ref>
Line 82: Line 82:
निष्पक्षता के अधिकांश सांख्यिकीय उपाय विभिन्न मापन विज्ञान पर निर्भर करते हैं, इसलिए हम उन्हें परिभाषित करके प्रारंभ करते हैं। द्विआधारी वर्गीकारक के साथ काम करते समय, अनुमानित और वास्तविक वर्ग दोनों दो मान ले सकते हैं: धनात्मक और ऋणात्मक। अब हम पूर्वानुमानित और वास्तविक परिणाम के मध्य विभिन्न संभावित संबंधों को समझाना प्रारंभ करें:<ref name="metrics_paper">वर्मा, साहिल, और जूलिया रुबिन। [https://doi.org/10.23919/FAIRWARE.2018.8452913 निष्पक्षता की परिभाषाएँ समझाई गईं। ] 2018 में सॉफ्टवेयर निष्पक्षता (फेयरवेयर) पर आईईईई/एसीएम अंतर्राष्ट्रीय कार्यशाला, पीपी 1-7। आईईईई, 2018।</ref>[[File:Binary confusion matrix.jpg|frame|भ्रम आव्यूह]]
निष्पक्षता के अधिकांश सांख्यिकीय उपाय विभिन्न मापन विज्ञान पर निर्भर करते हैं, इसलिए हम उन्हें परिभाषित करके प्रारंभ करते हैं। द्विआधारी वर्गीकारक के साथ काम करते समय, अनुमानित और वास्तविक वर्ग दोनों दो मान ले सकते हैं: धनात्मक और ऋणात्मक। अब हम पूर्वानुमानित और वास्तविक परिणाम के मध्य विभिन्न संभावित संबंधों को समझाना प्रारंभ करें:<ref name="metrics_paper">वर्मा, साहिल, और जूलिया रुबिन। [https://doi.org/10.23919/FAIRWARE.2018.8452913 निष्पक्षता की परिभाषाएँ समझाई गईं। ] 2018 में सॉफ्टवेयर निष्पक्षता (फेयरवेयर) पर आईईईई/एसीएम अंतर्राष्ट्रीय कार्यशाला, पीपी 1-7। आईईईई, 2018।</ref>[[File:Binary confusion matrix.jpg|frame|भ्रम आव्यूह]]


* '''सत्य धनात्मक (टीपी):''' वह प्रकरण जहां पूर्वानुमानित और वास्तविक परिणाम दोनों धनात्मक वर्ग में हैं।
* '''यथार्त धनात्मक (टीपी):''' वह प्रकरण जहां पूर्वानुमानित और वास्तविक परिणाम दोनों धनात्मक वर्ग में हैं।


* '''सत्य ऋणात्मक (टीएन):''' वह प्रकरण जहां अनुमानित परिणाम और वास्तविक परिणाम दोनों को ऋणात्मक वर्ग को निर्दिष्ट किया गया है।
* '''यथार्त ऋणात्मक (टीएन):''' वह प्रकरण जहां अनुमानित परिणाम और वास्तविक परिणाम दोनों को ऋणात्मक वर्ग को निर्दिष्ट किया गया है।
* '''मिथ्या धनात्मक (एफपी):''' जिस प्रकरण के वास्तविक परिणाम में निर्दिष्ट धनात्मक वर्ग में आने की भविष्यवाणी की गई है, वह ऋणात्मक है।
* '''मिथ्या धनात्मक (एफपी):''' जिस प्रकरण के वास्तविक परिणाम में निर्दिष्ट धनात्मक वर्ग में आने की भविष्यवाणी की गई है, वह ऋणात्मक है।
* '''मिथ्या ऋणात्मक (एफएन):''' जिस प्रकरण के ऋणात्मक वर्ग में होने की भविष्यवाणी की गई है, उसका वास्तविक परिणाम धनात्मक है।
* '''मिथ्या ऋणात्मक (एफएन):''' जिस प्रकरण के ऋणात्मक वर्ग में होने की भविष्यवाणी की गई है, उसका वास्तविक परिणाम धनात्मक है।
इन संबंधों को आसानी से एक भ्रम आव्यूह के साथ दर्शाया जा सकता है, एक सूची जो वर्गीकरण प्रतिरूप की यथार्थता का वर्णन करती है। इस आव्यूह में, कॉलम और पंक्तियाँ क्रमशः अनुमानित और वास्तविक प्रकरण के उदाहरणों का प्रतिनिधित्व करता हैं।
इन संबंधों को आसानी से एक भ्रम आव्यूह के साथ दर्शाया जा सकता है, एक सूची जो वर्गीकरण प्रतिरूप की यथार्थता का वर्णन करती है। इस आव्यूह में, कॉलम और पंक्तियाँ क्रमशः अनुमानित और वास्तविक प्रकरण के उदाहरणों का प्रतिनिधित्व करती हैं।


इन संबंधों का उपयोग करके, हम कई मेट्रिक्स को परिभाषित कर सकते हैं जिनका उपयोग बाद में एल्गोरिदम की निष्पक्षता को मापने के लिए किया जा सकता है:
इन संबंधों का उपयोग करके, हम कई मेट्रिक्स को परिभाषित कर सकते हैं जिनका उपयोग बाद में कलनविधि की निष्पक्षता को मापने के लिए किया जा सकता है:
* '''धनात्मक पूर्वानुमानित मूल्य (पीपीवी)''': धनात्मक प्रकरण का वह भिन्न जिसकी सभी धनात्मक भविष्यवाणियों में से सही भविष्यवाणी की गई थी। इसे सामान्यतः परिशुद्धता के रूप में जाना जाता है, और यह एक सही धनात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है। इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> PPV = P(actual=+\ |\ prediction=+) = \frac{TP}{TP+FP}</math>
* '''धनात्मक पूर्वानुमानित मूल्य (पीपीवी)''': धनात्मक प्रकरण का वह भिन्न जिसकी सभी धनात्मक भविष्यवाणियों में से सही भविष्यवाणी की गई थी। इसे सामान्यतः परिशुद्धता के रूप में जाना जाता है, और यह एक सही धनात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है। इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> PPV = P(actual=+\ |\ prediction=+) = \frac{TP}{TP+FP}</math>
* '''मिथ्या खोज दर (एफडीआर)''': धनात्मक भविष्यवाणियों का वह भिन्न जो वास्तव में सभी धनात्मक भविष्यवाणियों में से ऋणात्मक था। यह एक अशुद्ध धनात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> FDR = P(actual=-\ |\ prediction=+) = \frac{FP}{TP+FP} </math>
* '''मिथ्या खोज दर (एफडीआर)''': धनात्मक भविष्यवाणियों का वह भिन्न जो वास्तव में सभी धनात्मक भविष्यवाणियों में से ऋणात्मक था। यह एक अशुद्ध धनात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> FDR = P(actual=-\ |\ prediction=+) = \frac{FP}{TP+FP} </math>
* '''ऋणात्मक अनुमानित मूल्य (एनपीवी):''' ऋणात्मक प्रकरण का वह भिन्न जिसकी सभी ऋणात्मक भविष्यवाणियों में से सही भविष्यवाणी की गई थी। यह एक सही ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> NPV = P(actual=-\ |\ prediction=-) = \frac{TN}{TN+FN} </math>
* '''ऋणात्मक अनुमानित मूल्य (एनपीवी):''' ऋणात्मक प्रकरण का वह भिन्न जिसकी सभी ऋणात्मक भविष्यवाणियों में से सही भविष्यवाणी की गई थी। यह एक सही ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> NPV = P(actual=-\ |\ prediction=-) = \frac{TN}{TN+FN} </math>
* '''मिथ्या लोप दर (FOR):''' ऋणात्मक भविष्यवाणियों का वह भिन्न जो वास्तव में सभी ऋणात्मक भविष्यवाणियों में से धनात्मक था। यह एक मिथ्या ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> FOR = P(actual=+\ |\ prediction=-) = \frac{FN}{TN+FN} </math>
* '''मिथ्या लोप दर (FOR):''' ऋणात्मक भविष्यवाणियों का वह भिन्न जो वास्तव में सभी ऋणात्मक भविष्यवाणियों में से धनात्मक है। यह एक मिथ्या ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:<math display="block"> FOR = P(actual=+\ |\ prediction=-) = \frac{FN}{TN+FN} </math>
* '''सत्य धनात्मक दर (टीपीआर):''' सभी धनात्मक प्रकरण में से धनात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। इसे सामान्यतः संवेदनशीलता या प्रत्याह्वान के रूप में संदर्भित किया जाता है, और यह धनात्मक विषयों को इस तरह सही प्रकार से र्गीकृत किए जाने की संभावना का प्रतिनिधित्व करता है। यह सूत्र द्वारा दिया गया है:<math display="block"> TPR = P(prediction=+\ |\ actual=+) = \frac{TP}{TP+FN} </math>
* '''यथार्त धनात्मक दर (टीपीआर):''' सभी धनात्मक प्रकरण में से धनात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। इसे सामान्यतः संवेदनशीलता या प्रत्याह्वान के रूप में संदर्भित किया जाता है, और यह धनात्मक विषयों को इस तरह सही प्रकार से र्गीकृत किए जाने की संभावना का प्रतिनिधित्व करता है। यह सूत्र द्वारा दिया गया है:<math display="block"> TPR = P(prediction=+\ |\ actual=+) = \frac{TP}{TP+FN} </math>
* '''मिथ्या ऋणात्मक दर (एफएनआर):''' धनात्मक प्रकरण का वह भिन्न जिसके सभी धनात्मक प्रकरण में से ऋणात्मक होने की गलत भविष्यवाणी की गई थी। यह धनात्मक विषयों को गलत प्रकार से ऋणात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> FNR = P(prediction=-\ |\ actual=+) = \frac{FN}{TP+FN} </math>
* '''मिथ्या ऋणात्मक दर (एफएनआर):''' धनात्मक प्रकरण का वह भिन्न जिसके सभी धनात्मक प्रकरण में से ऋणात्मक होने की गलत भविष्यवाणी की गई थी। यह धनात्मक विषयों को गलत प्रकार से ऋणात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> FNR = P(prediction=-\ |\ actual=+) = \frac{FN}{TP+FN} </math>
* '''सत्य ऋणात्मक दर (टीएनआर):''' सभी ऋणात्मक प्रकरण में से ऋणात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को सही प्रकार से वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> TNR = P(prediction=-\ |\ actual=-) = \frac{TN}{TN+FP} </math>
* '''यथार्त ऋणात्मक दर (टीएनआर):''' सभी ऋणात्मक प्रकरण में से ऋणात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को सही प्रकार से वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> TNR = P(prediction=-\ |\ actual=-) = \frac{TN}{TN+FP} </math>
* '''मिथ्या धनात्मक दर (एफपीआर):''' ऋणात्मक प्रकरण का वह भिन्न जिसके सभी ऋणात्मक प्रकरण में से धनात्मक होने की गलत भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को गलत प्रकार से धनात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> FPR = P(prediction=+\ |\ actual=-) = \frac{FP}{TN+FP} </math>
* '''मिथ्या धनात्मक दर (एफपीआर):''' ऋणात्मक प्रकरण का वह भिन्न जिसके सभी ऋणात्मक प्रकरण में से धनात्मक होने की गलत भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को गलत प्रकार से धनात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:<math display="block"> FPR = P(prediction=+\ |\ actual=-) = \frac{FP}{TN+FP} </math>
[[File:RelationsEng.jpg|frame|निष्पक्षता मानदंडों के मध्य संबंध जैसा कि बारोकास एट अल में दिखाया गया है।<ref name="Barocas"/>]]निम्नलिखित मानदंडों को इस खंड की आरंभ में दी गई तीन सामान्य परिभाषाओं, अर्थात् '''स्वतंत्रता''', '''पृथक्करण''' और '''पर्याप्तता''' के उपायों के रूप में समझा जा सकता है।<ref name="Barocas"/> दाईं ओर, हम उनके मध्य संबंध देख सकते हैं।
[[File:RelationsEng.jpg|frame|निष्पक्षता मानदंडों के मध्य संबंध जैसा कि बारोकास एट अल में दिखाया गया है।<ref name="Barocas"/>]]निम्नलिखित मानदंडों को इस खंड के आरंभ में दी गई तीन सामान्य परिभाषा, अर्थात् '''स्वतंत्रता''', '''पृथक्करण''' और '''पर्याप्तता''' के उपायों के रूप में समझा जा सकता है।<ref name="Barocas"/> दाईं ओर, हम उनके मध्य संबंध देख सकते हैं।


इन उपायों को विशेष रूप से परिभाषित करने के लिए, हम उन्हें तीन बड़े समूहों में विभाजित करेंगे जैसा कि वर्मा एट अल में किया गया है:<ref name="metrics_paper"/> पूर्वानुमानित परिणाम पर आधारित परिभाषाएँ, पूर्वानुमानित और वास्तविक परिणामों पर, और पूर्वानुमानित संभावनाओं और वास्तविक परिणाम पर आधारित परिभाषाएँ है।
इन उपायों को विशेष रूप से परिभाषित करने के लिए, हम उन्हें तीन बड़े समूहों में विभाजित करेंगे जैसा कि वर्मा एट अल में किया गया है:<ref name="metrics_paper"/> पूर्वानुमानित परिणाम पर आधारित परिभाषाएँ, पूर्वानुमानित और वास्तविक परिणामों पर, और पूर्वानुमानित संभावनाओं और वास्तविक परिणाम पर आधारित परिभाषाएँ है।


हम एक द्विआधारी वर्गीकारक और निम्नलिखित नोटेशन के साथ काम करेंगे: <math display="inline"> S </math> वर्गीकारक द्वारा दिए गए स्कोर को संदर्भित करता है, जो एक निश्चित विषय के धनात्मक या ऋणात्मक वर्ग में होने की संभावना है। <math display="inline"> R </math> एल्गोरिदम द्वारा अनुमानित अंतिम वर्गीकरण का प्रतिनिधित्व करता है, और इसका मूल्य सामान्यतः <math display="inline"> S </math>से प्राप्त होता है, उदाहरण के लिए धनात्मक होगा जब <math display="inline"> S </math> एक निश्चित सीमा से ऊपर है। <math display="inline"> Y </math> वास्तविक परिणाम का प्रतिनिधित्व करता है, अर्थात, व्यक्ति का वास्तविक वर्गीकरण और अंततः, <math display="inline"> A </math> विषयों की संवेदनशील विशेषताओं को दर्शाता है।
हम एक द्विआधारी वर्गीकारक और निम्नलिखित नोटेशन के साथ काम करेंगे: <math display="inline"> S </math> वर्गीकारक द्वारा दिए गए अंक को संदर्भित करता है, जो एक निश्चित विषय के धनात्मक या ऋणात्मक वर्ग में होने की संभावना है। <math display="inline"> R </math> कलनविधि द्वारा अनुमानित अंतिम वर्गीकरण का प्रतिनिधित्व करता है, और इसका मूल्य सामान्यतः <math display="inline"> S </math> से प्राप्त होता है, उदाहरण के लिए धनात्मक होगा जब <math display="inline"> S </math> एक निश्चित सीमा से ऊपर है। <math display="inline"> Y </math> वास्तविक परिणाम का प्रतिनिधित्व करता है, अर्थात, व्यक्ति का वास्तविक वर्गीकरण और अंततः, <math display="inline"> A </math> विषयों की संवेदनशील विशेषताओं को दर्शाता है।


==== अनुमानित परिणाम पर आधारित परिभाषाएँ ====
==== पूर्वानुमानित परिणाम पर आधारित परिभाषाएँ ====


इस खंड की परिभाषाएँ अनुमानित परिणाम पर केंद्रित हैं <math display="inline"> R </math> विषयों के विभिन्न संभाव्यता वितरण के लिए। वे निष्पक्षता की सबसे सरल और सबसे सहज धारणाएँ हैं।
इस खंड की परिभाषाएँ विषयों के विभिन्न वितरणों के लिए अनुमानित परिणाम <math display="inline"> R </math> पर ध्यान केंद्रित करता हैं। वे निष्पक्षता की सबसे सरल और सबसे सहज धारणाएँ हैं।


* जनसांख्यिकीय समता, जिसे सांख्यिकीय समता, स्वीकृति दर समता और बेंचमार्किंग भी कहा जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों के विषयों को धनात्मक पूर्वानुमानित वर्ग को सौंपे जाने की समान संभावना है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:<math display="block"> P(R = +\ |\ A = a) = P(R = +\ |\ A = b) \quad \forall a,b \in A </math>
* '''जनसांख्यिकीय समता''', जिसे '''सांख्यिकीय समता''', '''स्वीकृति दर समता''' और '''बेंचमार्किंग''' भी कहा जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों के विषयों को धनात्मक पूर्वानुमानित वर्ग को नियुक्त के समान संभावना है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:<math display="block"> P(R = +\ |\ A = a) = P(R = +\ |\ A = b) \quad \forall a,b \in A </math>
* सशर्त सांख्यिकीय समता. मूल रूप से उपरोक्त परिभाषा में सम्मिलित है, लेकिन केवल उदाहरणों के [[सबसेट|सबसमुच्चय]] तक ही सीमित है। गणितीय संकेतन में यह होगा:<math display="block"> P(R = +\ |\ L = l, A = a) = P(R = +\ |\ L = l, A = b) \quad \forall a,b \in A \quad \forall l \in L </math>
* '''सशर्त सांख्यिकीय समता,''' मूल रूप से उपरोक्त परिभाषा में सम्मिलित है, लेकिन केवल उदाहरणों के [[सबसेट|उपसमुच्चय]] तक ही सीमित है। गणितीय संकेतन में यह होगा:<math display="block"> P(R = +\ |\ L = l, A = a) = P(R = +\ |\ L = l, A = b) \quad \forall a,b \in A \quad \forall l \in L </math>
==== पूर्वानुमानित और वास्तविक परिणामों पर आधारित परिभाषाएँ ====
==== पूर्वानुमानित और वास्तविक परिणामों पर आधारित परिभाषाएँ ====


ये परिभाषाएँ केवल पूर्वानुमानित परिणाम पर विचार करती हैं <math display="inline"> R </math> लेकिन इसकी तुलना वास्तविक परिणाम से भी करें <math display="inline"> Y </math>.
ये परिभाषाएँ नहीं केवल पूर्वानुमानित परिणाम <math display="inline"> R </math> पर विचार करता हैं लेकिन इसकी तुलना वास्तविक परिणाम <math display="inline"> Y </math> से भी होती हैं।


* पूर्वानुमानित समता, जिसे परिणाम परीक्षण भी कहा जाता है। यदि संरक्षित और असुरक्षित समूहों के विषयों में समान पीपीवी है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:<math display="block"> P(Y = +\ |\ R = +, A = a) = P(Y = +\ |\ R = +, A = b) \quad \forall a,b \in A </math>
* '''पूर्वानुमानित समता''', जिसे '''परिणाम परीक्षण''' भी कहा जाता है। यदि संरक्षित और असंरक्षित समूहों के विषयों में समान पीपीवी है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:<math display="block"> P(Y = +\ |\ R = +, A = a) = P(Y = +\ |\ R = +, A = b) \quad \forall a,b \in A </math>
: गणितीय रूप से, यदि किसी वर्गीकारक के पास दोनों समूहों के लिए समान पीपीवी है, तो उसके पास समान एफडीआर भी होगा, जो सूत्र को संतुष्ट करता है:<math display="block"> P(Y = -\ |\ R = +, A = a) = P(Y = -\ |\ R = +, A = b) \quad \forall a,b \in A </math>
: गणितीय रूप से, यदि किसी वर्गीकारक के पास दोनों समूहों के लिए समान पीपीवी है, तो उसके पास समान एफडीआर भी होगा, जो सूत्र को संतुष्ट करता है:<math display="block"> P(Y = -\ |\ R = +, A = a) = P(Y = -\ |\ R = +, A = b) \quad \forall a,b \in A </math>
* मिथ्या धनात्मक त्रुटि दर संतुलन, जिसे पूर्वानुमानित समानता भी कहा जाता है। यदि संरक्षित और असुरक्षित समूहों के विषयों में समान एफपीआर है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:<math display="block"> P(R = +\ |\ Y = -, A = a) = P(R = +\ |\ Y = -, A = b) \quad \forall a,b \in A </math>
* '''मिथ्या धनात्मक त्रुटि दर संतुलन''', जिसे '''पूर्वानुमानित समानता''' भी कहा जाता है। यदि संरक्षित और असंरक्षित समूहों के विषयों में समान एफपीआर है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:<math display="block"> P(R = +\ |\ Y = -, A = a) = P(R = +\ |\ Y = -, A = b) \quad \forall a,b \in A </math>
: गणितीय रूप से, यदि किसी वर्गीकारक में दोनों समूहों के लिए समान एफपीआर है, तो इसका टीएनआर भी समान होगा, जो सूत्र को संतुष्ट करता है:<math display="block"> P(R = -\ |\ Y = -, A = a) = P(R = -\ |\ Y = -, A = b) \quad \forall a,b \in A </math>
: गणितीय रूप से, यदि किसी वर्गीकारक में दोनों समूहों के लिए समान एफपीआर है, तो इसका टीएनआर भी समान होगा, जो सूत्र को संतुष्ट करता है:<math display="block"> P(R = -\ |\ Y = -, A = a) = P(R = -\ |\ Y = -, A = b) \quad \forall a,b \in A </math>
* मिथ्या ऋणात्मक त्रुटि दर संतुलन, जिसे समान अवसर भी कहा जाता है। यदि संरक्षित और असुरक्षित समूहों में विषयों का एफएनआर समान है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:<math display="block"> P(R = -\ |\ Y = +, A = a) = P(R = -\ |\ Y = +, A = b) \quad \forall a,b \in A </math>
* '''मिथ्या ऋणात्मक त्रुटि दर संतुलन''', जिसे '''समान अवसर''' भी कहा जाता है। यदि संरक्षित और असंरक्षित समूहों में विषयों का एफएनआर समान है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:<math display="block"> P(R = -\ |\ Y = +, A = a) = P(R = -\ |\ Y = +, A = b) \quad \forall a,b \in A </math>
: गणितीय रूप से, यदि किसी वर्गीकारक में दोनों समूहों के लिए समान एफएनआर है, तो इसका टीपीआर भी समान होगा, जो सूत्र को संतुष्ट करता है:<math display="block"> P(R = +\ |\ Y = +, A = a) = P(R = +\ |\ Y = +, A = b) \quad \forall a,b \in A </math>
: गणितीय रूप से, यदि किसी वर्गीकारक के पास दोनों समूहों के लिए समान एफएनआर है, तो उसके पास समान टीपीआर भी होगा, जो सूत्र को संतुष्ट करता है:<math display="block"> P(R = +\ |\ Y = +, A = a) = P(R = +\ |\ Y = +, A = b) \quad \forall a,b \in A </math>
* समान अंतर, जिसे सशर्त प्रक्रिया यथार्थता समानता और असमान दुर्व्यवहार भी कहा जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों के विषयों में समान टीपीआर और समान एफपीआर है, जो सूत्र को संतुष्ट करता है:<math display="block"> P(R = +\ |\ Y = y, A = a) = P(R = +\ |\ Y = y, A = b) \quad y \in \{+,-\} \quad \forall a,b \in A </math>
* समान अंतर, जिसे '''सशर्त प्रक्रिया यथार्थता समानता''' और '''असमान दुर्व्यवहार''' भी कहा जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों के विषयों में समान टीपीआर और समान एफपीआर है, जो सूत्र को संतुष्ट करता है:<math display="block"> P(R = +\ |\ Y = y, A = a) = P(R = +\ |\ Y = y, A = b) \quad y \in \{+,-\} \quad \forall a,b \in A </math>
* सशर्त उपयोग यथार्थता समानता। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों के विषयों में समान पीपीवी और समान एनपीवी है, जो सूत्र को संतुष्ट करता है:<math display="block"> P(Y = y\ |\ R = y, A = a) = P(Y = y\ |\ R = y, A = b) \quad y \in \{+,-\} \quad \forall a,b \in A </math>
* '''सशर्त उपयोग यथार्थता समानता''' एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों के विषयों में समान पीपीवी और समान एनपीवी है, जो सूत्र को संतुष्ट करता है:<math display="block"> P(Y = y\ |\ R = y, A = a) = P(Y = y\ |\ R = y, A = b) \quad y \in \{+,-\} \quad \forall a,b \in A </math>
* समग्र यथार्थता समानता। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों में विषय की भविष्यवाणी यथार्थता समान है, अर्थात, एक वर्ग से किसी विषय को उसे सौंपे जाने की संभावना है। यह है, यदि यह निम्नलिखित सूत्र को संतुष्ट करता है:<math display="block"> P(R = Y\ |\ A = a) = P(R = Y\ |\ A = b) \quad \forall a,b \in A </math>
* '''समग्र यथार्थता समानता''' एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों में विषय की भविष्यवाणी यथार्थता समान है, अर्थात, एक वर्ग से किसी विषय को नियुक्त की संभावना है। यदि यह निम्नलिखित सूत्र को संतुष्ट करता है:<math display="block"> P(R = Y\ |\ A = a) = P(R = Y\ |\ A = b) \quad \forall a,b \in A </math>
* उपचार समानता. एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित समूहों के विषयों में एफएन और एफपी का समान अनुपात है, जो सूत्र को संतुष्ट करता है:<math display="block"> \frac{FN_{A=a}}{FP_{A=a}} = \frac{FN_{A=b}}{FP_{A=b}} </math>
* '''अभिक्रिया समानता''' एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों के विषयों में एफएन और एफपी का समान अनुपात है, जो सूत्र को संतुष्ट करता है:<math display="block"> \frac{FN_{A=a}}{FP_{A=a}} = \frac{FN_{A=b}}{FP_{A=b}} </math>
==== अनुमानित संभावनाओं और वास्तविक परिणाम पर आधारित परिभाषाएँ ====
==== पूर्वानुमानित संभावनाओं और वास्तविक परिणाम पर आधारित परिभाषाएँ ====


ये परिभाषाएँ वास्तविक परिणाम पर आधारित हैं <math display="inline"> Y </math> और अनुमानित संभाव्यता स्कोर <math display="inline"> S </math>.
ये परिभाषाएँ वास्तविक परिणाम <math display="inline"> Y </math> और अनुमानित प्रायिकता अंक <math display="inline"> S </math> पर आधारित हैं।


* परीक्षण-निष्पक्षता, जिसे भिन्नांकन या सशर्त आवृत्तियों के मिलान के रूप में भी जाना जाता है। यदि समान पूर्वानुमानित संभाव्यता स्कोर वाले व्यक्ति हों तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है <math display="inline"> S </math> जब वे संरक्षित या असुरक्षित समूह से संबंधित होते हैं तो धनात्मक वर्ग में वर्गीकृत होने की समान संभावना होती है:<math display="block"> P(Y = +\ |\ S = s,A = a) = P(Y = +\ |\ S = s,A = b) \quad \forall s \in S \quad \forall a,b \in A </math>
* '''परीक्षण-निष्पक्षता''', जिसे '''अंशांकन''' या '''सशर्त आवृत्तियों के मिलान''' के रूप में भी जाना जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि समान पूर्वानुमानित प्रायिकता अंक <math display="inline"> S </math> वाले व्यक्तियों को धनात्मक वर्ग में वर्गीकृत होने के समान संभावना होती है जब वे संरक्षित या असंरक्षित समूह से संबंधित होते हैं:<math display="block"> P(Y = +\ |\ S = s,A = a) = P(Y = +\ |\ S = s,A = b) \quad \forall s \in S \quad \forall a,b \in A </math>
* वेल-कैलिब्रेशन पिछली परिभाषा का विस्तार है। इसमें कहा गया है कि जब संरक्षित समूह के अंदर या बाहर के व्यक्तियों का पूर्वानुमानित संभाव्यता स्कोर समान होता है <math display="inline"> S </math> उनके पास धनात्मक वर्ग में वर्गीकृत होने की समान संभावना होनी चाहिए, और यह संभावना बराबर होनी चाहिए <math display="inline"> S </math>:<math display="block"> P(Y = +\ |\ S = s,A = a) = P(Y = +\ |\ S = s,A = b) = s \quad \forall s \in S \quad \forall a,b \in A </math>
* '''अनुकूल-अंशांकन''' पूर्व परिभाषा का विस्तार है। इसमें कहा गया है कि जब संरक्षित समूह के आंतरिक या बाहरी व्यक्तियों के पास समान पूर्वानुमानित प्रायिकता अंक <math display="inline"> S </math> होता है, तो उनके पास धनात्मक वर्ग में वर्गीकृत होने की समान संभावना होनी चाहिए, और यह प्रायिकता <math display="inline"> S </math> के समान होनी चाहिए:<math display="block"> P(Y = +\ |\ S = s,A = a) = P(Y = +\ |\ S = s,A = b) = s \quad \forall s \in S \quad \forall a,b \in A </math>
* धनात्मक वर्ग के लिए संतुलन. एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित दोनों समूहों से धनात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित संभाव्यता स्कोर समान है <math display="inline"> S </math>. इसका अर्थ यह है कि धनात्मक वास्तविक परिणाम के साथ संरक्षित और असुरक्षित समूहों के लिए संभाव्यता स्कोर का अपेक्षित मूल्य <math display="inline"> Y </math> वही है, सूत्र को संतुष्ट करना:<math display="block"> E(S\ |\ Y = +,A = a) = E(S\ |\ Y = +,A = b) \quad \forall a,b \in A </math>
* '''धनात्मक वर्ग के लिए संतुलन''' एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित दोनों समूहों से धनात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित प्रायिकता अंक <math display="inline"> S </math> समान है। इसका अर्थ यह है कि धनात्मक वास्तविक परिणाम <math display="inline"> Y </math> के साथ संरक्षित और असंरक्षित समूहों के लिए प्रायिकता अंक का अपेक्षित मूल्य समान है, जो सूत्र को संतुष्ट करता है:<math display="block"> E(S\ |\ Y = +,A = a) = E(S\ |\ Y = +,A = b) \quad \forall a,b \in A </math>
*ऋणात्मक वर्ग के लिए संतुलन. एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असुरक्षित दोनों समूहों के ऋणात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित संभाव्यता स्कोर समान है <math display="inline"> S </math>. इसका अर्थ यह है कि ऋणात्मक वास्तविक परिणाम वाले संरक्षित और असुरक्षित समूहों के लिए संभाव्यता स्कोर का अपेक्षित मूल्य <math display="inline"> Y </math> वही है, सूत्र को संतुष्ट करना:<math display="block"> E(S\ |\ Y = -,A = a) = E(S\ |\ Y = -,A = b) \quad \forall a,b \in A </math>
*'''ऋणात्मक वर्ग के लिए संतुलन''' एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित दोनों समूहों के ऋणात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित प्रायिकता अंक <math display="inline"> S </math> समान है। इसका अर्थ यह है कि ऋणात्मक वास्तविक परिणाम <math display="inline"> Y </math> वाले संरक्षित और असंरक्षित समूहों के लिए प्रायिकता अंक का अपेक्षित मूल्य समान है, जो सूत्र को संतुष्ट करता है:<math display="block"> E(S\ |\ Y = -,A = a) = E(S\ |\ Y = -,A = b) \quad \forall a,b \in A </math>
=== समान भ्रम निष्पक्षता ===
=== समान भ्रम निष्पक्षता ===


कन्फ्यूजन आव्यूह के संबंध में, स्वतंत्रता, पृथक्करण और पर्याप्तता के लिए नीचे सूचीबद्ध संबंधित मात्राओं की आवश्यकता होती है ताकि संवेदनशील विशेषताओं में सांख्यिकीय रूप से महत्वपूर्ण अंतर न हो।<रेफ नाम = Räz 129–137 />
भ्रम आव्यूह के संबंध में, स्वतंत्रता, पृथक्करण और पर्याप्तता के लिए नीचे सूचीबद्ध संबंधित मात्राओं की आवश्यकता होती है ताकि संवेदनशील विशेषताओं में सांख्यिकीय रूप से महत्वपूर्ण अंतर नहीं है।


* स्वतंत्रता: (टीपी + एफपी) / (टीपी + एफपी + एफएन + टीएन) (यानी, <math>P(\hat{Y} = 1)</math>).
* स्वतंत्रता: (टीपी + एफपी) / (टीपी + एफपी + एफएन + टीएन) (अर्थात, <math>P(\hat{Y} = 1)</math>)
* पृथक्करण: टीएन / (टीएन + एफपी) और टीपी / (टीपी + एफएन) (यानी, विशिष्टता <math>P(\hat{Y} = 0 \mid Y=0)</math> और याद करो <math>P(\hat{Y} = 1 \mid Y = 1)</math>).
* पृथक्करण: टीएन / (टीएन + एफपी) और टीपी / (टीपी + एफएन) (अर्थात, विशिष्टता <math>P(\hat{Y} = 0 \mid Y=0)</math> और याद करें <math>P(\hat{Y} = 1 \mid Y = 1)</math>)
* पर्याप्तता: टीपी / (टीपी + एफपी) और टीएन / (टीएन + एफएन) (यानी, परिशुद्धता <math>P(Y = 1 \mid \hat{Y}=1)</math> और ऋणात्मक पूर्वानुमानित मूल्य <math>P(Y=0 \mid \hat{Y}=0)</math>).
* पर्याप्तता: टीपी / (टीपी + एफपी) और टीएन / (टीएन + एफएन) (अर्थात, परिशुद्धता <math>P(Y = 1 \mid \hat{Y}=1)</math> और ऋणात्मक पूर्वानुमानित मूल्य <math>P(Y=0 \mid \hat{Y}=0)</math>)


समान भ्रम निष्पक्षता की धारणा<ref>{{Cite book |last1=Gursoy |first1=Furkan |last2=Kakadiaris |first2=Ioannis A. |title=2022 IEEE International Conference on Data Mining Workshops (ICDMW) |chapter=Equal Confusion Fairness: Measuring Group-Based Disparities in Automated Decision Systems |date=November 2022 |chapter-url=https://ieeexplore.ieee.org/document/10029385 |publisher=IEEE |pages=137–146 |doi=10.1109/ICDMW58026.2022.00027 |arxiv=2307.00472 |isbn=979-8-3503-4609-1|s2cid=256669476 }}</ref> सभी संवेदनशील विशेषताओं पर स्तरीकृत गणना करते समय किसी दिए गए निर्णय प्रणाली के भ्रम आव्यूह को समान वितरण की आवश्यकता होती है।
समान भ्रम निष्पक्षता की धारणा<ref>{{Cite book |last1=Gursoy |first1=Furkan |last2=Kakadiaris |first2=Ioannis A. |title=2022 IEEE International Conference on Data Mining Workshops (ICDMW) |chapter=Equal Confusion Fairness: Measuring Group-Based Disparities in Automated Decision Systems |date=November 2022 |chapter-url=https://ieeexplore.ieee.org/document/10029385 |publisher=IEEE |pages=137–146 |doi=10.1109/ICDMW58026.2022.00027 |arxiv=2307.00472 |isbn=979-8-3503-4609-1|s2cid=256669476 }}</ref> के लिए किसी दिए गए निर्णय प्रणाली के भ्रम आव्यूह को समान वितरण की आवश्यकता होती है, जब सभी संवेदनशील विशेषताओं पर स्तरीकृत गणना होती है।


=== समाज कल्याण समारोह ===
=== समाज कल्याण कार्य ===


कुछ विद्वानों ने [[सामाजिक कल्याण कार्य]] के संदर्भ में कलनविधीय निष्पक्षता को परिभाषित करने का प्रस्ताव दिया है। उनका तर्क है कि सामाजिक कल्याण फलन का उपयोग एक एल्गोरिदम डिजाइनर को एल्गोरिदम से प्रभावित लोगों को उनके लाभों के संदर्भ में निष्पक्षता और पूर्वानुमान यथार्थता पर विचार करने में सक्षम बनाता है। यह डिजाइनर को सैद्धांतिक प्रकार से दक्षता और इक्विटी का आदान-प्रदान करने की भी अनुमति देता है।<ref name="chen-hooker-2021">{{cite arXiv|eprint=2102.00311|last1=Chen|first1=Violet (Xinying)|last2=Hooker|first2=J. N.|title=अनुकूलन के माध्यम से कल्याण-आधारित निष्पक्षता|year=2021|class=cs.AI}}</ref> [[सेंथिल मुलैनाथन]] ने कहा है कि एल्गोरिदम डिजाइनरों को वंचित समूहों के लिए पूर्ण लाभ की पहचान करने के लिए सामाजिक कल्याण कार्यों का उपयोग करना चाहिए। उदाहरण के लिए, एक अध्ययन में पाया गया कि शुद्ध मानव निर्णय के बदले प्री-ट्रायल हिरासत में निर्णय लेने वाले एल्गोरिदम का उपयोग करने से अपराध दर स्थिर रखते हुए भी कुल मिलाकर काले, हिस्पैनिक और नस्लीय अल्पसंख्यकों के लिए हिरासत दर कम हो गई।<ref name="mullainathan-ec-2018">{{cite AV media|url=https://www.youtube.com/watch?v=rp965fnd3qE|title=एल्गोरिथम निष्पक्षता और सामाजिक कल्याण कार्य|last=Mullainathan|first=Sendhil|author-link=Sendhil Mullainathan|date=June 19, 2018|journal=Keynote at the 19th ACM Conference on Economics and Computation (EC'18)|publisher=YouTube|quote=In other words, if you have a social welfare function where what you care about is harm, and you care about harm to the African Americans, there you go: 12 percent less African Americans in jail overnight.... Before we get into the minutiae of relative harm, the welfare function is defined in absolute harm, so we should actually calculate the absolute harm first.|minutes=48}}</ref>
कुछ विद्वानों ने [[सामाजिक कल्याण कार्य]] के संदर्भ में कलनविधि निष्पक्षता को परिभाषित करने का प्रस्ताव दिया है। उनका तर्क है कि सामाजिक कल्याण फलन का उपयोग एक कलनविधि अभिकल्पक को कलनविधि से प्रभावित लोगों को उनके लाभों के संदर्भ में निष्पक्षता और पूर्वानुमान यथार्थता पर विचार करने में सक्षम बनाता है। यह डिजाइनर को सैद्धांतिक प्रकार से दक्षता और समता का आदान-प्रदान करने की भी अनुमति देता है।<ref name="chen-hooker-2021">{{cite arXiv|eprint=2102.00311|last1=Chen|first1=Violet (Xinying)|last2=Hooker|first2=J. N.|title=अनुकूलन के माध्यम से कल्याण-आधारित निष्पक्षता|year=2021|class=cs.AI}}</ref> [[सेंथिल मुलैनाथन]] ने कहा है कि कलनविधि अभिकल्पक को वंचित समूहों के लिए पूर्ण लाभ की पहचान करने के लिए सामाजिक कल्याण कार्यों का उपयोग करना चाहिए। उदाहरण के लिए, एक अध्ययन में पाया गया कि शुद्ध मानव निर्णय के बदले पूर्व परीक्षण सुधार में निर्णय लेने वाले कलनविधि का उपयोग करने से सुधार दर को स्थिर रखते हुए भी कुल मिलाकर अश्वेतों, हिस्पैनिक और नस्लीय अल्पसंख्यकों के लिए अपराध दर कम हो गई है।<ref name="mullainathan-ec-2018">{{cite AV media|url=https://www.youtube.com/watch?v=rp965fnd3qE|title=एल्गोरिथम निष्पक्षता और सामाजिक कल्याण कार्य|last=Mullainathan|first=Sendhil|author-link=Sendhil Mullainathan|date=June 19, 2018|journal=Keynote at the 19th ACM Conference on Economics and Computation (EC'18)|publisher=YouTube|quote=In other words, if you have a social welfare function where what you care about is harm, and you care about harm to the African Americans, there you go: 12 percent less African Americans in jail overnight.... Before we get into the minutiae of relative harm, the welfare function is defined in absolute harm, so we should actually calculate the absolute harm first.|minutes=48}}</ref>
== व्यक्तिगत निष्पक्षता मानदंड ==
== व्यक्तिगत निष्पक्षता मानदंड ==


निष्पक्षता परिभाषाओं के मध्य एक महत्वपूर्ण अंतर समूह और व्यक्तिगत धारणाओं के मध्य है।<ref name="mitchell2021">{{cite journal | doi=10.1146/annurev-statistics-042720-125902 | title=Algorithmic Fairness: Choices, Assumptions, and Definitions | year=2021 | last1=Mitchell | first1=Shira | last2=Potash | first2=Eric | last3=Barocas | first3=Solon | last4=d'Amour | first4=Alexander | last5=Lum | first5=Kristian | journal=Annual Review of Statistics and Its Application | volume=8 | issue=1 | pages=141–163 | bibcode=2021AnRSA...8..141M | s2cid=228893833 | doi-access=free }}</ref><ref  name="castelnovo2022">{{cite journal | url=https://doi.org/10.1038/s41598-022-07939-1 | doi=10.1038/s41598-022-07939-1 | title=निष्पक्षता मेट्रिक्स परिदृश्य में बारीकियों का स्पष्टीकरण| year=2022 | last1=Castelnovo | first1=Alessandro | last2=Crupi | first2=Riccardo | last3=Greco | first3=Greta | last4=Regoli | first4=Daniele | last5=Penco | first5=Ilaria Giuseppina | last6=Cosentini | first6=Andrea Claudio | journal=Scientific Reports | volume=12 | issue=1 | page=4209 | pmid=35273279 | pmc=8913820 | arxiv=2106.00467 | bibcode=2022NatSR..12.4209C }}</ref><ref name="metrics_paper"/><ref  name="mehrabi2021">Mehrabi, Ninareh, Fred Morstatter, Nripsuta Saxena, [[Kristina Lerman]], and Aram Galstyan. [https://doi.org/10.1145/3457607 "A survey on bias and fairness in machine learning."] ACM Computing Surveys (CSUR) 54, no. 6 (2021): 1-35.</ref> मोटे तौर पर कहें तो, जबकि समूह निष्पक्षता मानदंड समूह स्तर पर मात्राओं की तुलना करते हैं, सामान्यतः संवेदनशील विशेषताओं (जैसे लिंग, जातीयता, आयु, आदि ...) द्वारा पहचाने जाते हैं, व्यक्तिगत मानदंड व्यक्तियों की तुलना करते हैं। शब्दों में, व्यक्तिगत निष्पक्षता इस सिद्धांत का पालन करती है कि समान व्यक्तियों को समान उपचार प्राप्त होना चाहिए।
निष्पक्षता परिभाषाओं के मध्य एक महत्वपूर्ण अंतर समूह और व्यक्तिगत धारणाओं के मध्य है।<ref name="mitchell2021">{{cite journal | doi=10.1146/annurev-statistics-042720-125902 | title=Algorithmic Fairness: Choices, Assumptions, and Definitions | year=2021 | last1=Mitchell | first1=Shira | last2=Potash | first2=Eric | last3=Barocas | first3=Solon | last4=d'Amour | first4=Alexander | last5=Lum | first5=Kristian | journal=Annual Review of Statistics and Its Application | volume=8 | issue=1 | pages=141–163 | bibcode=2021AnRSA...8..141M | s2cid=228893833 | doi-access=free }}</ref><ref  name="castelnovo2022">{{cite journal | url=https://doi.org/10.1038/s41598-022-07939-1 | doi=10.1038/s41598-022-07939-1 | title=निष्पक्षता मेट्रिक्स परिदृश्य में बारीकियों का स्पष्टीकरण| year=2022 | last1=Castelnovo | first1=Alessandro | last2=Crupi | first2=Riccardo | last3=Greco | first3=Greta | last4=Regoli | first4=Daniele | last5=Penco | first5=Ilaria Giuseppina | last6=Cosentini | first6=Andrea Claudio | journal=Scientific Reports | volume=12 | issue=1 | page=4209 | pmid=35273279 | pmc=8913820 | arxiv=2106.00467 | bibcode=2022NatSR..12.4209C }}</ref><ref name="metrics_paper"/><ref  name="mehrabi2021">Mehrabi, Ninareh, Fred Morstatter, Nripsuta Saxena, [[Kristina Lerman]], and Aram Galstyan. [https://doi.org/10.1145/3457607 "A survey on bias and fairness in machine learning."] ACM Computing Surveys (CSUR) 54, no. 6 (2021): 1-35.</ref> स्थूलतः कहें तो, जबकि समूह निष्पक्षता मानदंड समूह स्तर पर मात्राओं की तुलना करते हैं, सामान्यतः संवेदनशील विशेषताओं (जैसे लिंग, जातीयता, आयु, आदि ...) द्वारा पहचाने जाते हैं, व्यक्तिगत मानदंड व्यक्तियों की तुलना करते हैं। शब्दों में, व्यक्तिगत निष्पक्षता इस सिद्धांत का अनुकरण करते है कि समान व्यक्तियों को समान अभिक्रिया प्राप्त होना चाहिए।


निष्पक्षता के लिए एक बहुत ही सहज दृष्टिकोण है, जिसे आम तौर पर फेयरनेस थ्रू अनअवेयरनेस (एफटीयू), या ''ब्लाइंडनेस'' के नाम से जाना जाता है, जो (स्वचालित) निर्णय लेते समय स्पष्ट रूप से संवेदनशील सुविधाओं को नियोजित नहीं करने का निर्देश देता है। यह प्रभावी रूप से व्यक्तिगत निष्पक्षता की धारणा है, क्योंकि दो व्यक्ति केवल अपनी संवेदनशील विशेषताओं के मूल्य के लिए भिन्न होते हैं, उन्हें एक ही परिणाम प्राप्त होगा।
निष्पक्षता के लिए एक बहुत ही सहज दृष्टिकोण है, जिसे सामान्यतः '''अनभिज्ञता के माध्यम से निष्पक्षता''' (एफटीयू), या ''दृष्टिहीनता'' के नाम से जाना जाता है, जो (स्वचालित) निर्णय लेते समय स्पष्ट रूप से संवेदनशील विशेषताओं को स्पष्ट रूप से नियोजित नहीं करने का निर्देश देता है। यह प्रभावी रूप से व्यक्तिगत निष्पक्षता की धारणा है, क्योंकि दो व्यक्ति केवल अपनी संवेदनशील विशेषताओं के मूल्य के लिए भिन्न होते हैं, उन्हें एक ही परिणाम प्राप्त होता है।


हालाँकि, सामान्य तौर पर, FTU में कई कमियाँ हैं, मुख्य बात यह है कि यह निर्णय लेने की प्रक्रिया में नियोजित संवेदनशील विशेषताओं और गैर-संवेदनशील विशेषताओं के मध्य संभावित सहसंबंधों को ध्यान में नहीं रखता है। उदाहरण के लिए, लिंग के आधार पर भेदभाव करने के (घातक) इरादे वाला एक एजेंट प्रतिरूप में लिंग के लिए एक प्रॉक्सी वैरिएबल (यानी लिंग के साथ अत्यधिक सहसंबंधित वैरिएबल) प्रस्तावित कर सकता है और प्रभावी ढंग से लिंग जानकारी का उपयोग कर सकता है जबकि साथ ही साथ इसका अनुपालन भी कर सकता है। एफटीयू नुस्खा.
हालाँकि, सामान्य रूप में, एफटीयू में कई कमियाँ हैं, मुख्य बात यह है कि यह निर्णय लेने की प्रक्रिया में नियोजित संवेदनशील विशेषताओं और गैर-संवेदनशील विशेषताओं के मध्य संभावित सहसंबंधों को ध्यान में नहीं रखता है। उदाहरण के लिए, लिंग के आधार पर भेदभाव करने के (घातक) अभिप्राय एक कर्ता प्रतिरूप में लिंग के लिए एक प्रतिनिधि चर प्रस्तावित कर सकता है (अर्थात लिंग के साथ अत्यधिक सहसंबंधित चर) और एफटीयू औषधयोजन के अनुरूप होने के साथ-साथ लिंग संबंधी जानकारी का प्रभावकारी रूप से उपयोग कर सकता है।  


निर्णय लेने की प्रक्रिया में ''संवेदनशील लोगों से संबंधित कौन से चर एक प्रतिरूप द्वारा काफी रोजगार योग्य हैं'' की समस्या एक महत्वपूर्ण है, और #समूह निष्पक्षता मानदंड के लिए भी प्रासंगिक है: स्वतंत्रता मेट्रिक्स को संवेदनशील जानकारी को पूरी तरह से हटाने की आवश्यकता होती है , जबकि पृथक्करण-आधारित मेट्रिक्स सहसंबंध की अनुमति देते हैं, लेकिन केवल तब तक जहां तक ​​लेबल किए गए लक्ष्य चर उन्हें उचित ठहराते हैं।
''संवेदनशील चर से संबंधित कौन से चर निर्णय लेने की प्रक्रिया में एक प्रतिरूप द्वारा पूरी तरह से रोजगार योग्य हैं'', यह समस्या एक महत्वपूर्ण, और समूह अवधारणाओं के लिए भी प्रासंगिक है: स्वतंत्रता मेट्रिक्स के लिए संवेदनशील जानकारी को पूरी तरह से अलग करने की आवश्यकता होती है, जबकि पृथक्करण-आधारित मेट्रिक्स सहसंबंध की अनुमति देते हैं, लेकिन केवल तब तक जहां तक ​​लेबल किए गए लक्ष्य चर उन्हें "उचित" ठहराते हैं।


व्यक्तिगत निष्पक्षता की सबसे सामान्य अवधारणा को 2012 में [[सिंथिया डवर्क]] और सहयोगियों द्वारा अग्रणी कार्य में प्रस्तावित किया गया था।<ref>{{cite book | chapter-url=https://doi.org/10.1145/2090236.2090255 | doi=10.1145/2090236.2090255 | chapter=Fairness through awareness | title=Proceedings of the 3rd Innovations in Theoretical Computer Science Conference on - ITCS '12 | year=2012 | last1=Dwork | first1=Cynthia | last2=Hardt | first2=Moritz | last3=Pitassi | first3=Toniann | last4=Reingold | first4=Omer | last5=Zemel | first5=Richard | pages=214–226 | isbn=9781450311151 | s2cid=13496699 }}</ref> और इसे इस सिद्धांत के गणितीय अनुवाद के रूप में सोचा जा सकता है कि इनपुट के रूप में सुविधाओं को लेने वाले निर्णय मानचित्र को इस तरह बनाया जाना चाहिए कि यह समान व्यक्तियों को समान रूप से मैप करने में सक्षम हो, जिसे प्रतिरूप मानचित्र पर [[लिप्सचिट्ज़ निरंतरता]] के रूप में व्यक्त किया गया है। वे इस दृष्टिकोण को फेयरनेस थ्रू अवेयरनेस (एफटीए) कहते हैं, जो यथार्थ रूप से एफटीयू का प्रतिरूप है, क्योंकि वे यह आकलन करने के लिए उपयुक्त लक्ष्य-संबंधित दूरी मीट्रिक चुनने के महत्व को रेखांकित करते हैं कि कौन से व्यक्ति विशिष्ट परिस्थितियों में ''समान'' हैं। फिर, यह समस्या ऊपर उठाए गए बिंदु से बहुत संबंधित है कि विशेष संदर्भों में किन चरों को वैध माना जा सकता है।
व्यक्तिगत निष्पक्षता की सबसे सामान्य अवधारणा को 2012 में [[सिंथिया डवर्क]] और सहयोगियों द्वारा अग्रणी कार्य में प्रस्तावित किया गया था<ref>{{cite book | chapter-url=https://doi.org/10.1145/2090236.2090255 | doi=10.1145/2090236.2090255 | chapter=Fairness through awareness | title=Proceedings of the 3rd Innovations in Theoretical Computer Science Conference on - ITCS '12 | year=2012 | last1=Dwork | first1=Cynthia | last2=Hardt | first2=Moritz | last3=Pitassi | first3=Toniann | last4=Reingold | first4=Omer | last5=Zemel | first5=Richard | pages=214–226 | isbn=9781450311151 | s2cid=13496699 }}</ref> और इसे इस सिद्धांत के गणितीय अनुवाद के रूप में सोचा जा सकता है कि निवेश के रूप में सुविधाओं को इस तरह बनाया जाना चाहिए कि यह "समान व्यक्तियों को समान रूप से मानचित्रित करें", जिसे प्रतिरूप मानचित्र पर [[लिप्सचिट्ज़ निरंतरता]] के रूप में व्यक्त किया गया है। वे इस दृष्टिकोण को जानकारी के माध्यम से निष्पक्षता (एफटीए) कहते हैं, जो कि एफटीयू के विपरीत है, क्योंकि वे यह आकलन करने के लिए उपयुक्त लक्ष्य-संबंधित दूरी मीट्रिक चयन करने के महत्व को रेखांकित करते हैं कि कौन से व्यक्ति विशिष्ट परिस्थितियों में ''समान'' हैं। फिर, यह समस्या ऊपर उठाए गए बिंदु से बहुत संबंधित है कि विशेष संदर्भों में किन चरों को "उचित" रूप में देखा जा सकता है।


== कार्य-कारण-आधारित मेट्रिक्स ==
== कार्य-कारण-आधारित मेट्रिक्स ==
कारण निष्पक्षता उस आवृत्ति को मापती है जिसके साथ दो लगभग समान उपयोगकर्ता या एप्लिकेशन जो केवल विशेषताओं के एक समुच्चय में भिन्न होते हैं जिसके संबंध में संसाधन आवंटन उचित होना चाहिए, समान उपचार प्राप्त करते हैं।<ref name="causal">{{cite book |last1=Galhotra |first1=Sainyam |last2=Brun |first2=Yuriy |last3=Meliou |first3=Alexandra |title=Proceedings of the 2017 11th Joint Meeting on Foundations of Software Engineering |chapter=Fairness testing: Testing software for discrimination |date=2017 |pages=498–510 |doi=10.1145/3106237.3106277|isbn=9781450351058 |arxiv=1709.03221 |s2cid=6324652 }}</ref> {{Dubious|date=November 2023}}
कारण निष्पक्षता उस आवृत्ति को मापती है जिसके साथ दो लगभग समान उपयोगकर्ता या अनुप्रयोग जो केवल विशेषताओं के एक समुच्चय में भिन्न होते हैं जिसके संबंध में संसाधन आवंटन उचित होना चाहिए, समान अभिक्रिया प्राप्त करते हैं।<ref name="causal">{{cite book |last1=Galhotra |first1=Sainyam |last2=Brun |first2=Yuriy |last3=Meliou |first3=Alexandra |title=Proceedings of the 2017 11th Joint Meeting on Foundations of Software Engineering |chapter=Fairness testing: Testing software for discrimination |date=2017 |pages=498–510 |doi=10.1145/3106237.3106277|isbn=9781450351058 |arxiv=1709.03221 |s2cid=6324652 }}</ref> {{Dubious|date=November 2023}}


निष्पक्षता मेट्रिक्स पर अकादमिक अनुसंधान की एक पूरी शाखा मशीन लर्निंग प्रतिरूप में पूर्वाग्रह का आकलन करने के लिए कारण प्रतिरूप का लाभ उठाने के लिए समर्पित है। यह दृष्टिकोण आम तौर पर इस तथ्य से उचित है कि डेटा का एक ही अवलोकन वितरण खेल में चर के मध्य अलग-अलग कारण संबंधों को छुपा सकता है, संभवतः अलग-अलग व्याख्याओं के साथ कि परिणाम किसी प्रकार के पूर्वाग्रह से प्रभावित होते हैं या नहीं।<ref name="Barocas"/>
निष्पक्षता मेट्रिक्स पर अकादमिक अनुसंधान की एक पूरी शाखा यंत्र अधिगम प्रतिरूप में पूर्वाग्रह का आकलन करने के लिए कारण प्रतिरूप का लाभ उठाने के लिए समर्पित है। यह दृष्टिकोण सामान्यतः इस तथ्य से उचित है कि डेटा का एक ही अवलोकन वितरण खेल में चर के मध्य अलग-अलग कारण संबंधों को गुप्त रखता है, संभवतः अलग-अलग व्याख्याओं के साथ कि परिणाम किसी प्रकार के पूर्वाग्रह से प्रभावित होते हैं या नहीं होते हैं।<ref name="Barocas"/>


कुस्नर एट अल.<ref name="cff">Kusner, M. J., Loftus, J., Russell, C., & Silva, R. (2017). [https://proceedings.neurips.cc/paper/2017/hash/a486cd07e4ac3d270571622f4f316ec5-Abstract.html Counterfactual fairness]. Advances in neural information processing systems, 30.</ref> कॉसल प्रतिरूप#काउंटरफैक्टुअल को नियोजित करने का प्रस्ताव, और निर्णय लेने की प्रक्रिया को प्रतितथ्यात्मक रूप से निष्पक्ष रूप से परिभाषित करना, यदि किसी भी व्यक्ति के लिए, प्रतितथ्यात्मक परिदृश्य में परिणाम नहीं बदलता है जहां संवेदनशील गुण बदल जाते हैं। गणितीय सूत्रीकरण पढ़ता है:
कुस्नर एट अल.<ref name="cff">Kusner, M. J., Loftus, J., Russell, C., & Silva, R. (2017). [https://proceedings.neurips.cc/paper/2017/hash/a486cd07e4ac3d270571622f4f316ec5-Abstract.html Counterfactual fairness]. Advances in neural information processing systems, 30.</ref> प्रतितथ्यात्मक को नियोजित करने का प्रस्ताव, और निर्णय लेने की प्रक्रिया को '''प्रतितथ्यात्मक रूप से निष्पक्ष''' रूप से परिभाषित करते है, यदि किसी भी व्यक्ति के लिए, प्रतितथ्यात्मक परिदृश्य में परिणाम नहीं बदलता है जहां संवेदनशील गुण बदल जाता हैं। गणितीय सूत्रीकरण पढ़ता है:


<math>     
<math>     
P(R_{A\leftarrow a}=1 \mid A=a,X=x) = P(R_{A\leftarrow b}=1 \mid A=a,X=x),\quad\forall a,b;
P(R_{A\leftarrow a}=1 \mid A=a,X=x) = P(R_{A\leftarrow b}=1 \mid A=a,X=x),\quad\forall a,b;
</math>
</math>
वह है: संवेदनशील विशेषता वाले एक यादृच्छिक व्यक्ति को लिया गया <math>A=a</math> और अन्य सुविधाएँ <math>X=x</math> और वही व्यक्ति यदि उसके पास होता <math>A = b</math>, उन्हें स्वीकार किये जाने का समान अवसर मिलना चाहिए।
प्रतीक <math>\hat{R}_{A\leftarrow a}</math> प्रतितथ्यात्मक यादृच्छिक चर का प्रतिनिधित्व करता है <math>R</math> उस परिदृश्य में जहां संवेदनशील विशेषता <math>A</math> के लिए तय है <math>A=a</math>. कंडीशनिंग चालू <math>A=a, X=x</math> इसका अर्थ है कि यह आवश्यकता व्यक्तिगत स्तर पर है, इसमें हम एक ही अवलोकन की पहचान करने वाले सभी चर पर कंडीशनिंग कर रहे हैं।


मशीन लर्निंग प्रतिरूप को प्रायः डेटा पर प्रशिक्षित किया जाता है जहां परिणाम उस समय लिए गए निर्णय पर निर्भर करता है।<ref>{{Cite book |last1=Coston |first1=Amanda |last2=Mishler |first2=Alan |last3=Kennedy |first3=Edward H. |last4=Chouldechova |first4=Alexandra |title=Proceedings of the 2020 Conference on Fairness, Accountability, and Transparency |chapter=Counterfactual risk assessments, evaluation, and fairness |date=2020-01-27 |series=FAT* '20 |location=New York, NY, USA |publisher=Association for Computing Machinery |pages=582–593 |doi=10.1145/3351095.3372851 |isbn=978-1-4503-6936-7|s2cid=202539649 |doi-access=free }}</ref> उदाहरण के लिए, यदि मशीन लर्निंग प्रतिरूप को यह निर्धारित करना है कि क्या कोई कैदी दोबारा अपराध करेगा या नहीं और यह निर्धारित करेगा कि क्या कैदी को जल्दी रिहा किया जाना चाहिए, तो परिणाम इस पर निर्भर हो सकता है कि कैदी को जल्दी रिहा किया गया था या नहीं। मिशलर एट अल.<ref>{{Cite book |last1=Mishler |first1=Alan |last2=Kennedy |first2=Edward H. |last3=Chouldechova |first3=Alexandra |title=Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency |chapter=Fairness in Risk Assessment Instruments |date=2021-03-01 |series=FAccT '21 |location=New York, NY, USA |publisher=Association for Computing Machinery |pages=386–400 |doi=10.1145/3442188.3445902 |isbn=978-1-4503-8309-7|s2cid=221516412 |doi-access=free }}</ref> प्रतितथ्यात्मक समान बाधाओं के लिए एक सूत्र प्रस्तावित करें:
अर्थात्: संवेदनशील विशेषता <math>A=a</math> और अन्य विशेषताओं <math>X=x</math> के साथ एक यादृच्छिक व्यक्ति लिया गया और उसी व्यक्ति के पास यदि <math>A = b</math> है, तो उन्हें स्वीकार किए जाने की समान संभावना होनी चाहिए। प्रतीक <math>\hat{R}_{A\leftarrow a}</math> उस परिदृश्य में प्रतितथ्यात्मक यादृच्छिक चर <math>R</math> का प्रतिनिधित्व करता है जहां संवेदनशील विशेषता <math>A</math> को <math>A=a</math> पर तय किया गया है। <math>A=a, X=x</math> पर प्रतिबंधन का अर्थ है कि यह आवश्यकता व्यक्तिगत स्तर पर है, जिसमें हम एक ही अवलोकन की पहचान करने वाले सभी चर पर प्रतिबंधन कर रहे हैं।
 
यंत्र अधिगम प्रतिरूप को प्रायः डेटा पर प्रशिक्षित किया जाता है जहां परिणाम उस समय लिए गए निर्णय पर निर्भर करता है।<ref>{{Cite book |last1=Coston |first1=Amanda |last2=Mishler |first2=Alan |last3=Kennedy |first3=Edward H. |last4=Chouldechova |first4=Alexandra |title=Proceedings of the 2020 Conference on Fairness, Accountability, and Transparency |chapter=Counterfactual risk assessments, evaluation, and fairness |date=2020-01-27 |series=FAT* '20 |location=New York, NY, USA |publisher=Association for Computing Machinery |pages=582–593 |doi=10.1145/3351095.3372851 |isbn=978-1-4503-6936-7|s2cid=202539649 |doi-access=free }}</ref> उदाहरण के लिए, यदि यंत्र अधिगम प्रतिरूप को यह निर्धारित करना है कि क्या कोई कैदी दोबारा अपराध करेगा या नहीं और यह निर्धारित करेगा कि क्या कैदी को जल्दी विमुक्त किया जाना चाहिए, तो परिणाम इस पर निर्भर हो सकता है कि कैदी को जल्दी विमुक्त किया गया था या नहीं किया गया था। मिशलर एट अल.<ref>{{Cite book |last1=Mishler |first1=Alan |last2=Kennedy |first2=Edward H. |last3=Chouldechova |first3=Alexandra |title=Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency |chapter=Fairness in Risk Assessment Instruments |date=2021-03-01 |series=FAccT '21 |location=New York, NY, USA |publisher=Association for Computing Machinery |pages=386–400 |doi=10.1145/3442188.3445902 |isbn=978-1-4503-8309-7|s2cid=221516412 |doi-access=free }}</ref> प्रतितथ्यात्मक समान बाधाओं के लिए एक सूत्र प्रस्तावित करता है:


<math>P(R=1 \mid Y^0=0, A=a) = P(R=1 \mid Y^0=0, A=b) \wedge P(R=0 \mid Y^1=1, A=a) = P(R=0 \mid Y^1=1, A=b),\quad\forall a,b;</math>
<math>P(R=1 \mid Y^0=0, A=a) = P(R=1 \mid Y^0=0, A=b) \wedge P(R=0 \mid Y^1=1, A=a) = P(R=0 \mid Y^1=1, A=b),\quad\forall a,b;</math>
कहाँ <math>R</math> एक यादृच्छिक चर है, <math>Y^x</math> निर्णय दिए गए परिणाम को दर्शाता है <math>x</math> लिया गया, और <math>A</math> एक संवेदनशील विशेषता है.


प्लेको और बरेइनबोइम<ref name="Plecko Bareinboim p. ">{{cite journal | last=Plecko | first=Drago | last2=Bareinboim | first2=Elias | title=कारण निष्पक्षता विश्लेषण| publisher=arXiv | doi=10.48550/ARXIV.2207.11385 | url=https://arxiv.org/abs/2207.11385 | access-date=2023-11-25 | page=}}</ref> निष्पक्षता के कारणात्मक विश्लेषण से निपटने के लिए एक एकीकृत ढांचे का प्रस्ताव करें। वे एक मानक निष्पक्षता प्रतिरूप के उपयोग का सुझाव देते हैं, जिसमें 4 प्रकार के चर के साथ एक कारण ग्राफ सम्मिलित है:
जहां <math>R</math> एक यादृच्छिक चर है, <math>Y^x</math> उस परिणाम को दर्शाता है जो निर्णय <math>x</math> लिया गया था, और <math>A</math> एक संवेदनशील विशेषता हैं।
 
प्लेको और बरेइनबोइम<ref name="Plecko Bareinboim p.">{{cite journal | last=Plecko | first=Drago | last2=Bareinboim | first2=Elias | title=कारण निष्पक्षता विश्लेषण| publisher=arXiv | doi=10.48550/ARXIV.2207.11385 | url=https://arxiv.org/abs/2207.11385 | access-date=2023-11-25 | page=}}</ref> निष्पक्षता के कारणात्मक विश्लेषण से समझौते के लिए एक एकीकृत संरचना का प्रस्ताव हैं। वे एक '''मानक निष्पक्षता प्रतिरूप''' के उपयोग का सुझाव देते हैं, जिसमें 4 प्रकार के चर के साथ एक कारण आरेख सम्मिलित है:


* संवेदनशील गुण (<math>A</math>),
* संवेदनशील गुण (<math>A</math>),
* लक्ष्य चर (<math>Y</math>),
* लक्ष्य चर (<math>Y</math>),
* मध्यस्थ (<math>W</math>) मध्य में <math>A</math> और <math>Y</math>, परिणाम पर संवेदनशील विशेषताओं के संभावित अप्रत्यक्ष प्रभावों का प्रतिनिधित्व करते हुए,
* <math>A</math> और <math>Y</math> के मध्य ''मध्यस्थ'' (<math>W</math>), परिणाम पर संवेदनशील विशेषताओं के संभावित ''अप्रत्यक्ष प्रभावों'' का प्रतिनिधित्व करता हैं,
* चर संभवतः एक सामान्य कारण साझा करते हैं <math>A</math> (<math>Z</math>), परिणाम पर संवेदनशील विशेषताओं के संभावित नकली (यानी, गैर-कारणात्मक) प्रभावों का प्रतिनिधित्व करता है।
* चर संभवतः <math>A</math> (<math>Z</math>) के साथ एक सामान्य कारण साझा करते हैं, जो परिणाम पर संवेदनशील विशेषताओं के संभावित ''मिथ्या'' (अर्थात, गैर-कारण) प्रभावों का प्रतिनिधित्व करते है।


इस ढांचे के भीतर, प्लेको और बरेइनबोइम<ref name="Plecko Bareinboim p. "/>इसलिए संवेदनशील विशेषताओं के परिणाम पर पड़ने वाले संभावित प्रभावों को वर्गीकृत करने में सक्षम हैं।
इस रूपरेखा के अंतर्गत, प्लेको और बरेइनबोइम<ref name="Plecko Bareinboim p." /> उन संभावित प्रभावों को वर्गीकृत करने में सक्षम हैं जो संवेदनशील विशेषताओं के परिणाम पर हो सकते हैं। इसके अलावा, वह ग्रैन्युलैरिटी जिस पर इन प्रभावों को मापा जाता है - अर्थात्, प्रभाव को औसत करने के लिए उपयोग किए जाने वाले प्रतिबंधन चर - निष्पक्षता मूल्यांकन के "व्यक्तिगत बनाम समूह" दृष्टिकोण से सीधे जुड़े हुए हैं।
इसके अलावा, जिस ग्रैन्युलैरिटी पर इन प्रभावों को मापा जाता है - अर्थात्, प्रभाव को औसत करने के लिए उपयोग किए जाने वाले कंडीशनिंग चर - निष्पक्षता मूल्यांकन के व्यक्तिगत बनाम समूह पहलू से सीधे जुड़े हुए हैं।


== पूर्वाग्रह शमन रणनीतियाँ ==
== पूर्वाग्रह न्यूनीकरण योजना ==


मशीन लर्निंग एल्गोरिदम पर निष्पक्षता को तीन अलग-अलग प्रकार से लागू किया जा सकता है: [[डेटा प्रीप्रोसेसिंग]], सॉफ्टवेयर प्रशिक्षण के दौरान [[गणितीय अनुकूलन]], या एल्गोरिदम के पोस्ट-प्रोसेसिंग परिणाम।
यंत्र अधिगम कलनविधि पर निष्पक्षता को तीन अलग-अलग प्रकार से उपयोजित किया जा सकता है: [[डेटा प्रीप्रोसेसिंग|डेटा पूर्वसंस्करण]], सॉफ्टवेयर प्रशिक्षण के समय [[गणितीय अनुकूलन]], या कलनविधि के प्रसंस्करण के बाद परिणाम से उपयोजित किया जा सकता है।


=== प्रीप्रोसेसिंग ===
=== [[डेटा प्रीप्रोसेसिंग|पूर्वसंस्करण]] ===


सामान्यतः, वर्गीकारक ही एकमात्र समस्या नहीं है; [[ डाटासेट | डाटासमुच्चय]] भी पक्षपाती है. डेटासमुच्चय का भेदभाव <math display="inline"> D </math> समूह के संबंध में <math display="inline"> A = a </math> इसे इस प्रकार परिभाषित किया जा सकता है:
सामान्यतः, वर्गीकारक ही एकमात्र समस्या नहीं है;[[ डाटासेट | डाटासमुच्चय]] भी पक्षपाती हैं। समूह <math display="inline"> A = a </math> के संबंध में डेटासमुच्चय <math display="inline"> D </math> का भेदभाव निम्नानुसार परिभाषित किया जा सकता है:
<math display="block"> disc_{A=a}(D) = \frac{|\{X\in D| X(A) \neq a, X(Y) = +\}|}{|\{X \in D | X(A) \neq a \}|} - \frac{|\{X\in D| X(A) = a, X(Y) = +\}|}{|\{X \in D | X(A) = a \}|}</math>
<math display="block"> disc_{A=a}(D) = \frac{|\{X\in D| X(A) \neq a, X(Y) = +\}|}{|\{X \in D | X(A) \neq a \}|} - \frac{|\{X\in D| X(A) = a, X(Y) = +\}|}{|\{X \in D | X(A) = a \}|}</math>
अर्थात्, धनात्मक वर्ग में सम्मिलित होने की संभावनाओं के मध्य अंतर का एक अनुमान यह देखते हुए कि विषय में संरक्षित विशेषता अलग है <math display="inline"> a </math> और के बराबर <math display="inline"> a </math>.
अर्थात्, धनात्मक वर्ग में सम्मिलित होने की संभावनाओं के मध्य अंतर का एक अनुमान यह देखते हुए कि विषय में <math display="inline"> a </math> से अलग और <math display="inline"> a </math> के समान संरक्षित विशेषता है।


प्रीप्रोसेसिंग में पूर्वाग्रह को सही करने वाले एल्गोरिदम डेटासमुच्चय वेरिएबल्स के बारे में जानकारी हटा देते हैं जिसके परिणामस्वरूप अनुचित निर्णय हो सकते हैं, जबकि जितना संभव हो उतना कम बदलाव करने की कोशिश की जाती है। यह केवल संवेदनशील चर को हटाने जितना आसान नहीं है, क्योंकि अन्य विशेषताओं को संरक्षित चर से सहसंबद्ध किया जा सकता है।
पूर्वसंस्करण में पूर्वाग्रह को सही करने वाले कलनविधि डेटासमुच्चय चर के बारे में जानकारी अलग कर देते हैं जिसके परिणामस्वरूप अनुचित निर्णय हो सकते हैं, जबकि जितना संभव हो उतना कम बदलाव करने का प्रयत्न किया जाता है। यह केवल संवेदनशील चर को अलग करने जितना आसान नहीं है, क्योंकि अन्य विशेषताओं को संरक्षित चर से सहसंबद्ध किया जा सकता है।


ऐसा करने का एक प्रकार प्रारंभिक डेटासमुच्चय में प्रत्येक व्यक्ति को एक मध्यवर्ती प्रतिनिधित्व के लिए मैप करना है जिसमें यथासंभव अधिक जानकारी बनाए रखते हुए यह पहचानना असंभव है कि यह किसी विशेष संरक्षित समूह से संबंधित है या नहीं। फिर, एल्गोरिदम में अधिकतम यथार्थता प्राप्त करने के लिए डेटा के नए प्रतिनिधित्व को समायोजित किया जाता है।
ऐसा करने का एक प्रकार प्रारंभिक डेटासमुच्चय में प्रत्येक व्यक्ति को एक मध्यवर्ती प्रतिनिधित्व के लिए मानचित्र करना है जिसमें यथासंभव अधिक जानकारी बनाए रखते हुए यह पहचानना असंभव है कि यह किसी विशेष संरक्षित समूह से संबंधित है या नहीं है। फिर, कलनविधि में अधिकतम यथार्थता प्राप्त करने के लिए डेटा के नए प्रतिनिधित्व को समायोजित किया जाता है।
   
   
इस तरह, व्यक्तियों को एक नए बहुपरिवर्तनीय प्रतिनिधित्व में मैप किया जाता है जहां संरक्षित समूह के किसी भी सदस्य को नए प्रतिनिधित्व में एक निश्चित मूल्य पर मैप किए जाने की संभावना उस व्यक्ति की संभावना के समान होती है जो संरक्षित समूह से संबंधित नहीं है . फिर, प्रारंभिक डेटा के बदले, इस प्रतिनिधित्व का उपयोग व्यक्ति के लिए भविष्यवाणी प्राप्त करने के लिए किया जाता है। चूंकि मध्यवर्ती प्रतिनिधित्व का निर्माण संरक्षित समूह के अंदर या बाहर के व्यक्तियों को समान संभावना देते हुए किया गया है, इसलिए यह विशेषता वर्गीकरणकर्ता के लिए छिपी हुई है।
इस तरह, व्यक्तियों को एक नए बहुपरिवर्तनीय प्रतिनिधित्व में मानचित्र किया जाता है जहां संरक्षित समूह के किसी भी सदस्य को नए प्रतिनिधित्व में एक निश्चित मूल्य पर मानचित्र किए जाने की संभावना उस व्यक्ति की संभावना के समान होती है जो संरक्षित समूह से संबंधित नहीं है। फिर, प्रारंभिक डेटा के बदले, इस प्रतिनिधित्व का उपयोग व्यक्ति के लिए भविष्यवाणी प्राप्त करने के लिए किया जाता है। मध्यवर्ती प्रतिनिधित्व का निर्माण संरक्षित समूह के आंतरिक या बाहरी के व्यक्तियों को समान संभावना देते हुए किया गया है, इसलिए यह विशेषता वर्गीकरणकर्ता के लिए गुप्त है।
 
ज़ेमेल एट अल में एक उदाहरण समझाया गया है।<ref name="zemel">Richard Zemel; Yu (Ledell) Wu; Kevin Swersky; Toniann Pitassi; Cyntia Dwork, [https://www.cs.toronto.edu/~toni/Papers/icml-final.pdf ''Learning Fair Representations'']. Retrieved 1 December 2019</ref> जहां एक [[बहुपद वितरण|बहुपद यादृच्छिक चर]] का उपयोग मध्यवर्ती प्रतिनिधित्व के रूप में किया जाता है। इस प्रक्रिया में, व्यवस्था को उन सूचनाओं को छोड़कर सभी सूचनाओं को संरक्षित करने के लिए प्रोत्साहित किया जाता है जो पक्षपातपूर्ण निर्णय ले सकती हैं, और यथासंभव यथार्थ भविष्यवाणी प्राप्त करने के लिए प्रोत्साहित हो सकती हैं।


ज़ेमेल एट अल में एक उदाहरण समझाया गया है।<ref name="zemel">Richard Zemel; Yu (Ledell) Wu; Kevin Swersky; Toniann Pitassi; Cyntia Dwork, [https://www.cs.toronto.edu/~toni/Papers/icml-final.pdf ''Learning Fair Representations'']. Retrieved 1 December 2019</ref> जहां एक [[बहुपद वितरण]] का उपयोग मध्यवर्ती प्रतिनिधित्व के रूप में किया जाता है। इस प्रक्रिया में, सिस्टम को उन सूचनाओं को छोड़कर सभी सूचनाओं को संरक्षित करने के लिए प्रोत्साहित किया जाता है जो पक्षपातपूर्ण निर्णय ले सकती हैं, और यथासंभव यथार्थ भविष्यवाणी प्राप्त करने के लिए प्रोत्साहित किया जाता है।
एक ओर, इस प्रक्रिया का लाभ यह है कि पूर्व-संसाधित डेटा का उपयोग किसी भी यंत्र अधिगम कार्य के लिए किया जा सकता है। इसके अलावा, वर्गीकारक को संशोधित करने की आवश्यकता नहीं है, क्योंकि प्रसंस्करण से पहले सुधार को [[डेटा सेट|डेटा समुच्चय]] पर उपयोजित किया जाता है। दूसरी ओर, अन्य विधियाँ यथार्थता और निष्पक्षता में श्रेष्ठतर परिणाम प्राप्त करती हैं।<ref name="datascience">Ziyuan Zhong, [https://towardsdatascience.com/a-tutorial-on-fairness-in-machine-learning-3ff8ba1040cb ''Tutorial on Fairness in Machine Learning'']. Retrieved 1 December 2019</ref>
==== पुनःभारण ====


एक ओर, इस प्रक्रिया का लाभ यह है कि पूर्व-संसाधित डेटा का उपयोग किसी भी मशीन सीखने के कार्य के लिए किया जा सकता है। इसके अलावा, वर्गीकारक को संअनुसंधानित करने की आवश्यकता नहीं है, क्योंकि प्रसंस्करण से पहले [[डेटा सेट|डेटा समुच्चय]] पर सुधार लागू किया जाता है। दूसरी ओर, अन्य विधियाँ यथार्थता और निष्पक्षता में बेहतर परिणाम प्राप्त करती हैं।<ref name="datascience">Ziyuan Zhong, [https://towardsdatascience.com/a-tutorial-on-fairness-in-machine-learning-3ff8ba1040cb ''Tutorial on Fairness in Machine Learning'']. Retrieved 1 December 2019</ref>
पुनःभारण करना पूर्वसंस्करण कलनविधि का एक उदाहरण है। विचार यह है कि प्रत्येक डेटासमुच्चय बिंदु को एक भार दिया जाए ताकि निर्दिष्ट समूह के संबंध में भारित [[भेदभाव]] 0 हैं।<ref name="reweighing">Faisal Kamiran; Toon Calders, [https://link.springer.com/content/pdf/10.1007%2Fs10115-011-0463-8.pdf ''Data preprocessing techniques for classification without discrimination'']. Retrieved 17 December 2019</ref>
==== पुनः तौलना ====


पुनः वजन करना प्रीप्रोसेसिंग कलनविधीय का एक उदाहरण है। विचार यह है कि प्रत्येक डेटासमुच्चय बिंदु को एक भार दिया जाए ताकि निर्दिष्ट समूह के संबंध में भारित [[भेदभाव]] 0 हो।<ref name="reweighing">Faisal Kamiran; Toon Calders, [https://link.springer.com/content/pdf/10.1007%2Fs10115-011-0463-8.pdf ''Data preprocessing techniques for classification without discrimination'']. Retrieved 17 December 2019</ref>
यदि डेटासमुच्चय <math display="inline"> D </math> निष्पक्ष था तो संवेदनशील चर <math display="inline"> A </math> और लक्ष्य चर <math display="inline"> Y </math> सांख्यिकीय रूप से स्वतंत्र हैं और [[संयुक्त संभाव्यता वितरण|संयुक्त वितरण]] की संभावना निम्नानुसार संभावनाओं का उत्पाद होगा:
यदि डेटासमुच्चय <math display="inline"> D </math> संवेदनशील चर निष्पक्ष था <math display="inline"> A </math> और लक्ष्य चर <math display="inline"> Y </math> स्वतंत्रता (संभावना सिद्धांत) होगी और [[संयुक्त संभाव्यता वितरण]] की संभावना निम्नानुसार संभावनाओं का उत्पाद होगी:
<math display="block"> P_{exp}(A = a \wedge Y = +) = P(A = a) \times P(Y = +) = \frac{|\{X \in D | X(A) = a\}|}{|D|} \times \frac{|\{X \in D| X(Y) = + \}|}{|D|}</math>
<math display="block"> P_{exp}(A = a \wedge Y = +) = P(A = a) \times P(Y = +) = \frac{|\{X \in D | X(A) = a\}|}{|D|} \times \frac{|\{X \in D| X(Y) = + \}|}{|D|}</math>
वास्तविकता में, हालाँकि, डेटासमुच्चय निष्पक्ष नहीं है और चर स्वतंत्रता (संभावना सिद्धांत) नहीं हैं, इसलिए देखी गई संभावना है:
हालाँकि, वास्तविकता में, डेटासमुच्चय निष्पक्ष नहीं है और चर सांख्यिकीय रूप से स्वतंत्रता (संभावना सिद्धांत) नहीं हैं, इसलिए देखी गई संभावना है:
<math display="block"> P_{obs}(A = a \wedge Y = +) = \frac{|\{X \in D | X(A) = a \wedge X(Y) = +\}|}{|D|} </math>
<math display="block"> P_{obs}(A = a \wedge Y = +) = \frac{|\{X \in D | X(A) = a \wedge X(Y) = +\}|}{|D|} </math>
पूर्वाग्रह की भरपाई के लिए, सॉफ़्टवेयर एक वज़न फलन जोड़ता है, पसंदीदा वस्तुओं के लिए कम और प्रतिकूल वस्तुओं के लिए अधिक। प्रत्येक के लिए <math display="inline"> X \in D </math> हम पाते हैं:
पूर्वाग्रह की भरपाई के लिए, सॉफ़्टवेयर एक भार जोड़ता है, पसंदीदा वस्तुओं के लिए कम और प्रतिकूल वस्तुओं के लिए अधिक है। प्रत्येक <math display="inline"> X \in D </math> के लिए हमें मिलता है:
<math display="block"> W(X) = \frac{P_{exp}(A = X(A) \wedge Y = X(Y))}{P_{obs}(A = X(A) \wedge Y = X(Y))} </math>
<math display="block"> W(X) = \frac{P_{exp}(A = X(A) \wedge Y = X(Y))}{P_{obs}(A = X(A) \wedge Y = X(Y))} </math>
जब हमारे पास प्रत्येक के लिए है <math display="inline"> X </math> एक वजन जुड़ा हुआ <math display="inline"> W(X) </math> हम समूह के संबंध में भारित भेदभाव की गणना करते हैं <math display="inline"> A = a </math> निम्नलिखित नुसार:
जब हमारे पास प्रत्येक <math display="inline"> X </math> के लिए एक भार संबद्ध <math display="inline"> W(X) </math> हम समूह <math display="inline"> A = a </math> के संबंध में भारित भेदभाव की गणना इस प्रकार करते हैं:
<math display="block"> disc_{A = a}(D) = \frac{\sum W(X) X \in \{X\in D| X(A) \neq a, X(Y) = +\}}{\sum W(X) X \in \{X \in D | X(A) \neq a \}} - \frac{\sum W(X) X \in \{X\in D| X(A) = a, X(Y) = +\}}{\sum W(X) X \in \{X \in D | X(A) = a \}} </math>
<math display="block"> disc_{A = a}(D) = \frac{\sum W(X) X \in \{X\in D| X(A) \neq a, X(Y) = +\}}{\sum W(X) X \in \{X \in D | X(A) \neq a \}} - \frac{\sum W(X) X \in \{X\in D| X(A) = a, X(Y) = +\}}{\sum W(X) X \in \{X \in D | X(A) = a \}} </math>
यह दिखाया जा सकता है कि पुनः वजन करने के बाद यह भारित भेदभाव 0 है।
यह दिखाया जा सकता है कि पुनःभारण करने के बाद यह भारित भेदभाव 0 है।
 
===प्रसंस्करण में===


===इनप्रोसेसिंग===
दूसरा प्रकार प्रशिक्षण के समय पूर्वाग्रह को सही करना है। यह कलनविधि के अनुकूलन उद्देश्य में बाधाएँ जोड़कर किया जा सकता है।<ref name="zafar">Muhammad Bilal Zafar; Isabel Valera; Manuel Gómez Rodríguez; Krishna P. Gummadi, [https://people.mpi-sws.org/~mzafar/papers/disparate_mistreatment.pdf ''Fairness Beyond Disparate Treatment & Disparate Impact: Learning Classification without Disparate Mistreatment'']. Retrieved 1 December 2019</ref> ये बाधाएं कलनविधि को संरक्षित समूह और अन्य व्यक्तियों के लिए कुछ उपायों की समान दरें रखकर, निष्पक्षता में सुधार करने के लिए बलपूर्वक हैं। उदाहरण के लिए, हम कलनविधि के उद्देश्य में यह प्रतिबंध जोड़ सकते हैं कि मिथ्या धनात्मक दर संरक्षित समूह के व्यक्तियों और संरक्षित समूह के बाहर के व्यक्तियों के लिए समान है।


दूसरा प्रकार प्रशिक्षण के समय पूर्वाग्रह को ठीक करना है। यह कलनविधीय के अनुकूलन उद्देश्य में बाधाएँ जोड़कर किया जा सकता है।<ref name="zafar">Muhammad Bilal Zafar; Isabel Valera; Manuel Gómez Rodríguez; Krishna P. Gummadi, [https://people.mpi-sws.org/~mzafar/papers/disparate_mistreatment.pdf ''Fairness Beyond Disparate Treatment & Disparate Impact: Learning Classification without Disparate Mistreatment'']. Retrieved 1 December 2019</ref> ये बाधाएं एल्गोरिदम को संरक्षित समूह और बाकी व्यक्तियों के लिए कुछ उपायों की समान दरें रखकर, निष्पक्षता में सुधार करने के लिए मजबूर करती हैं। उदाहरण के लिए, हम एल्गोरिदम के उद्देश्य में यह शर्त जोड़ सकते हैं कि मिथ्या धनात्मक दर संरक्षित समूह के व्यक्तियों और संरक्षित समूह के बाहर के व्यक्तियों के लिए समान है।
इस दृष्टिकोण में उपयोग किए जाने वाले मुख्य उपाय मिथ्या धनात्मक दर, गलत ऋणात्मक दर और समग्र गलत वर्गीकरण दर हैं।[[ कलन विधि | कलनविधि]] के उद्देश्य में इनमें से केवल एक या कई बाधाओं को जोड़ना संभव है। ध्यान दें कि गलत ऋणात्मक दरों की समानता का तात्पर्य वास्तविक धनात्मक दरों की समानता से है, इसलिए इसका तात्पर्य अवसर की समानता से है। प्रतिबंध जोड़ने के बाद समस्या प्रचण्ड हो सकती है, इसलिए उन पर छूट की आवश्यकता हो सकती है।


इस दृष्टिकोण में उपयोग किए जाने वाले मुख्य उपाय मिथ्या धनात्मक दर, मिथ्या ऋणात्मक दर और समग्र मिथ्या वर्गीकरण दर हैं। [[ कलन विधि ]] के उद्देश्य में इनमें से केवल एक या कई बाधाओं को जोड़ना संभव है। ध्यान दें कि मिथ्या ऋणात्मक दरों की समानता का तात्पर्य वास्तविक धनात्मक दरों की समानता से है, इसलिए इसका तात्पर्य अवसर की समानता से है। प्रतिबंध जोड़ने के बाद समस्या विकट हो सकती है, इसलिए उन पर छूट की आवश्यकता हो सकती है।
यह तकनीक उच्च यथार्थता बनाए रखते हुए निष्पक्षता में सुधार लाने में अच्छे परिणाम प्राप्त करती है और [[प्रोग्रामर]] को सुधार के लिए निष्पक्षता उपायों को चयन करने की सुविधा देती है। हालाँकि, प्रत्येक यंत्र अधिगम कार्य को उपयोजित करने के लिए एक अलग विधि की आवश्यकता हो सकती है और वर्गीकारक में कोड को संशोधित करने की आवश्यकता होती है, जो हमेशा संभव नहीं होती है।<ref name="datascience" />
==== विरोधात्मक तर्क वितर्क ====


यह तकनीक उच्च यथार्थता बनाए रखते हुए निष्पक्षता में सुधार लाने में अच्छे परिणाम प्राप्त करती है और [[प्रोग्रामर]] को सुधार के लिए निष्पक्षता उपायों को चुनने की सुविधा देती है। हालाँकि, प्रत्येक मशीन लर्निंग कार्य को लागू करने के लिए एक अलग विधि की आवश्यकता हो सकती है और वर्गीकारक में कोड को संअनुसंधानित करने की आवश्यकता होती है, जो हमेशा संभव नहीं होता है।<ref name="datascience"/>
हम कुछ प्रवणता-आधारित विधि (जैसे: [[ ढतला हुआ वंश |प्रवणता अवरोहण]]) के माध्यम से एक ही समय में दो सांख्यिकीय को प्रशिक्षित करते हैं। पहला, भविष्यवक्ता कुछ हानि फलन <math display="inline">L_{P}(\hat{y},y)</math> को कम करने के लिए अपने भार <math display="inline"> W </math> को संशोधित करके, निवेश <math display="inline"> X </math> दिए गए लक्ष्य चर <math display="inline"> Y </math> की भविष्यवाणी करने का कार्य पूरा करने का प्रयास करता है। दूसरा, प्रतिद्वंद्वी कुछ हानि फलन <math display="inline">L_{A}(\hat{a},a) </math> को कम करने के लिए अपने भार <math display="inline"> U </math> को संशोधित करके <math display="inline"> \hat{Y} </math> दिए गए संवेदनशील चर <math display="inline"> A </math> की भविष्यवाणी करने का कार्य पूरा करने का प्रयास करता है।<ref name="adversarial1">Brian Hu Zhang; Blake Lemoine; Margaret Mitchell, [https://arxiv.org/abs/1801.07593 ''Mitigating Unwanted Biases with Adversarial Learning'']. Retrieved 17 December 2019</ref><ref name="adversarial2">Joyce Xu, [https://towardsdatascience.com/algorithmic-solutions-to-algorithmic-bias-aef59eaf6565 ''Algorithmic Solutions to Algorithmic Bias: A Technical Guide'']. Retrieved 17 December 2019</ref>
==== प्रतिकूल तर्क वितर्क ====


हम कुछ ग्रेडिएंट-आधारित विधि (जैसे: [[ ढतला हुआ वंश ]]) के माध्यम से एक ही समय में दो सांख्यिकीय वर्गीकरण को प्रशिक्षित करते हैं। पहला, भविष्यवक्ता भविष्यवाणी के कार्य को पूरा करने का प्रयास करता है <math display="inline"> Y </math>, लक्ष्य चर, दिया गया <math display="inline"> X </math>, इनपुट, इसके वजन को संअनुसंधानित करके <math display="inline"> W </math> कुछ हानि फलन को कम करने के लिए <math display="inline">L_{P}(\hat{y},y)</math>. दूसरा, विरोधी भविष्यवाणी करने का कार्य पूरा करने का प्रयास करता है <math display="inline"> A </math>, संवेदनशील चर, दिया गया <math display="inline"> \hat{Y} </math> इसके वजन को संअनुसंधानित करके <math display="inline"> U </math> कुछ हानि फलन को कम करने के लिए <math display="inline">L_{A}(\hat{a},a) </math>.<ref name="adversarial1">Brian Hu Zhang; Blake Lemoine; Margaret Mitchell, [https://arxiv.org/abs/1801.07593 ''Mitigating Unwanted Biases with Adversarial Learning'']. Retrieved 17 December 2019</ref><ref name="adversarial2">Joyce Xu, [https://towardsdatascience.com/algorithmic-solutions-to-algorithmic-bias-aef59eaf6565 ''Algorithmic Solutions to Algorithmic Bias: A Technical Guide'']. Retrieved 17 December 2019</ref>
यहां एक महत्वपूर्ण बिंदु यह है कि, सही प्रकार से प्रचारित करने के लिए, उपरोक्त <math display="inline"> \hat{Y} </math> को वर्गीकारक के असंसाधित निर्गत को संदर्भित करना चाहिए, असतत भविष्यवाणी नहीं; उदाहरण के लिए, एक [[कृत्रिम तंत्रिका नेटवर्क]] और एक वर्गीकरण समस्या के साथ, <math display="inline"> \hat{Y} </math> [[सॉफ्टमैक्स फ़ंक्शन|सॉफ्टमैक्स स्तर]] के निर्गत को संदर्भित कर सकता है।
यहां एक महत्वपूर्ण बात यह है कि, सही ढंग से प्रचार-प्रसार करने के लिए, <math display="inline"> \hat{Y} </math> उपरोक्त को वर्गीकारक के कच्चे आउटपुट को संदर्भित करना चाहिए, न कि अलग भविष्यवाणी को; उदाहरण के लिए, एक [[कृत्रिम तंत्रिका नेटवर्क]] और एक वर्गीकरण समस्या के साथ, <math display="inline"> \hat{Y} </math> [[सॉफ्टमैक्स फ़ंक्शन|सॉफ्टमैक्स फलन]] के आउटपुट को संदर्भित कर सकता है।


फिर हम अपडेट करते हैं <math display="inline"> U </math> कम से कम करने के लिए <math display="inline"> L_{A} </math> [[ ग्रेडियेंट ]] के अनुसार प्रत्येक प्रशिक्षण चरण पर <math display="inline"> \nabla_{U}L_{A} </math> और हम संअनुसंधानित करते हैं <math display="inline"> W </math> अभिव्यक्ति के अनुसार:
फिर हम [[ ग्रेडियेंट |प्रवणता]] <math display="inline"> \nabla_{U}L_{A} </math> के अनुसार प्रत्येक प्रशिक्षण स्तर में <math display="inline"> L_{A} </math>को कम करने के लिए <math display="inline"> U </math> को अद्यनीकृत करते हैं और हम अभिव्यक्ति के अनुसार <math display="inline"> W </math> को संशोधित करते हैं:
<math display="block"> \nabla_{W}L_{P} - proj_{\nabla_{W}L_{A}}\nabla_{W}L_{P} - \alpha \nabla_{W}L_{A} </math>
<math display="block"> \nabla_{W}L_{P} - proj_{\nabla_{W}L_{A}}\nabla_{W}L_{P} - \alpha \nabla_{W}L_{A} </math>
कहाँ <math display="alpha"> \alpha </math> एक ट्यून करने योग्य [[हाइपरपैरामीटर अनुकूलन]] है जो प्रत्येक समय चरण पर भिन्न हो सकता है।
जहां <math display="alpha"> \alpha </math> एक ट्यून करने योग्य [[हाइपरपैरामीटर अनुकूलन|अतिप्राचल]] है जो प्रत्येक समय स्तर पर भिन्न हो सकता है।


[[File:AdvFig2.jpg|frame|जैसा कि झांग एट अल में दिखाया गया है, प्रतिकूल डिबियासिंग में प्रयुक्त वैक्टर का ग्राफिक प्रतिनिधित्व।<ref name=adversarial1/>]]सहज विचार यह है कि हम चाहते हैं कि भविष्यवक्ता न्यूनतम करने का प्रयास करे <math display="inline"> L_{P} </math> (इसलिए शब्द <math display="inline"> \nabla_{W}L_{P} </math>) जबकि, एक ही समय में, अधिकतम करें <math display="inline"> L_{A} </math> (इसलिए शब्द <math display="inline"> - \alpha \nabla_{W}L_{A} </math>), ताकि प्रतिद्वंद्वी संवेदनशील परिवर्तन की भविष्यवाणी करने में विफल हो जाए  <math display="inline"> \hat{Y} </math>.
[[File:AdvFig2.jpg|frame|जैसा कि झांग एट अल में दिखाया गया है, विरोधात्मक डिबियासिंग में प्रयुक्त सदिश का आरेखीय प्रतिनिधित्व।<ref name="adversarial1" />]]सहज विचार यह है कि हम चाहते हैं कि भविष्यवक्ता <math display="inline"> L_{P} </math> को कम करने का प्रयास करे (इसलिए शब्द <math display="inline"> \nabla_{W}L_{P} </math>, जबकि, एक ही समय में, <math display="inline"> L_{A} </math> को अधिकतम करें (इसलिए शब्द <math display="inline"> - \alpha \nabla_{W}L_{A} </math>), ताकि प्रतिद्वंद्वी <math display="inline"> \hat{Y} </math> से संवेदनशील चर की भविष्यवाणी करने में विफल है)।


शब्द <math display="inline"> -proj_{\nabla_{W}L_{A}}\nabla_{W}L_{P} </math> भविष्यवक्ता को उस दिशा में जाने से रोकता है जो प्रतिद्वंद्वी को उसके नुकसान के कार्य को कम करने में मदद करता है।
शब्द <math display="inline"> -proj_{\nabla_{W}L_{A}}\nabla_{W}L_{P} </math> भविष्यवक्ता को उस दिशा में जाने से रोकता है जो प्रतिद्वंद्वी को उसके ह्रास के फलन को कम करने में सहायता करता है।


यह दिखाया जा सकता है कि इस एल्गोरिदम के साथ एक भविष्यवक्ता वर्गीकरण प्रतिरूप को प्रशिक्षित करने से प्रतिकूल परिस्थितियों के बिना इसे प्रशिक्षित करने के संबंध में अनुमानित परिणाम के आधार पर #परिभाषाओं में सुधार होता है।
यह दिखाया जा सकता है कि इस कलनविधि के साथ एक ''भविष्यवक्ता'' वर्गीकरण प्रतिरूप को प्रशिक्षित करने से ''प्रतिद्वंद्वी'' के बिना इसे प्रशिक्षित करने के संबंध में जनसांख्यिकीय समानता में सुधार होता है।


===पोस्टप्रोसेसिंग===
===पश्चप्रसंस्करण===


अंतिम विधि निष्पक्षता प्राप्त करने के लिए वर्गीकारक के परिणामों को सही करने का प्रयास करती है। इस पद्धति में, हमारे पास एक वर्गीकारक है जो प्रत्येक व्यक्ति के लिए एक अंक लौटाता है और हमें उनके लिए एक द्विआधारी भविष्यवाणी करने की आवश्यकता होती है। उच्च स्कोर से धनात्मक परिणाम मिलने की संभावना है, जबकि कम स्कोर से ऋणात्मक परिणाम मिलने की संभावना है, लेकिन हम यह निर्धारित करने के लिए [[महत्वपूर्ण मान]] को समायोजित कर सकते हैं कि इच्छानुसार हां में कब उत्तर देना है। ध्यान दें कि सीमा मूल्य में भिन्नता वास्तविक धनात्मक और वास्तविक ऋणात्मक दरों के मध्य व्यापार-बंद को प्रभावित करती है।
अंतिम विधि निष्पक्षता प्राप्त करने के लिए वर्गीकारक के परिणामों को सही करने का प्रयास करती है। इस पद्धति में, हमारे पास एक वर्गीकारक है जो प्रत्येक व्यक्ति के लिए एक अंक लौटाता है और हमें उनके लिए एक द्विआधारी भविष्यवाणी करने की आवश्यकता होती है। उच्च अंक प्राप्त करने पर धनात्मक परिणाम मिलने की संभावना है, जबकि कम अंक प्राप्त करने पर ऋणात्मक परिणाम मिलने की संभावना है, लेकिन हम इच्छानुसार हाँ में उत्तर कब देना है यह निर्धारित करने के लिए सीमा को समायोजित कर सकते हैं। ध्यान दें कि सीमा मूल्य में भिन्नता वास्तविक धनात्मक और वास्तविक ऋणात्मक दरों के मध्य व्यापार-बंद को प्रभावित करता है।


यदि स्कोर फलन इस अर्थ में उचित है कि यह संरक्षित विशेषता से स्वतंत्र है, तो सीमा का कोई भी विकल्प उचित होगा, लेकिन इस प्रकार के वर्गीकारक पक्षपातपूर्ण होते हैं, इसलिए प्रत्येक संरक्षित समूह के लिए एक अलग सीमा की आवश्यकता हो सकती है निष्पक्षता प्राप्त करने के लिए.<ref name="hardt" />ऐसा करने का एक प्रकार विभिन्न थ्रेशोल्ड समुच्चयिंग्स (इसे आरओसी वक्र कहा जाता है) पर मिथ्या ऋणात्मक दर के विरुद्ध वास्तविक धनात्मक दर की साजिश रचना है और एक सीमा ढूंढना है जहां संरक्षित समूह और अन्य व्यक्तियों के लिए दरें समान हैं।<ref name="hardt">Moritz Hardt; Eric Price; Nathan Srebro, [https://arxiv.org/abs/1610.02413 ''Equality of Opportunity in Supervised Learning'']. Retrieved 1 December 2019</ref>
यदि अंक फलन इस अर्थ में उचित है कि यह संरक्षित विशेषता से स्वतंत्र है, तो सीमा का कोई भी विकल्प उचित होगा, लेकिन इस प्रकार के वर्गीकारक पक्षपातपूर्ण होते हैं, इसलिए निष्पक्षता प्राप्त करने के लिए प्रत्येक संरक्षित समूह के लिए एक अलग सीमा की आवश्यकता हो सकती है। <ref name="hardt" />ऐसा करने का एक प्रकार विभिन्न प्रभावसीमा विन्यास (इसे आरओसी वक्र कहा जाता है) पर मिथ्या ऋणात्मक दर के विरुद्ध वास्तविक धनात्मक दर की आलेखन रचना है और एक सीमा खोजें जहां संरक्षित समूह और अन्य व्यक्तियों के लिए दरें समान हैं।<ref name="hardt">Moritz Hardt; Eric Price; Nathan Srebro, [https://arxiv.org/abs/1610.02413 ''Equality of Opportunity in Supervised Learning'']. Retrieved 1 December 2019</ref>
पोस्टप्रोसेसिंग के फायदों में यह सम्मिलित है कि तकनीक को किसी भी क्लासिफायर के बाद बिना संअनुसंधानित किए लागू किया जा सकता है, और निष्पक्षता उपायों में इसका प्रदर्शन अच्छा है। विपक्ष में परीक्षण के समय संरक्षित विशेषता तक पहुंचने की आवश्यकता और यथार्थता और निष्पक्षता के मध्य संतुलन में विकल्प की कमी सम्मिलित है।<ref name="datascience"/>
 
पश्चप्रसंस्करण के लाभ में यह सम्मिलित है कि तकनीक को किसी भी वर्गीकारक के बाद बिना संशोधित किए उपयोजित किया जा सकता है, और निष्पक्षता उपायों में इसका प्रदर्शन अच्छा है। विपक्ष में परीक्षण के समय संरक्षित विशेषता तक पहुंचने की आवश्यकता और यथार्थता और निष्पक्षता के मध्य संतुलन में विकल्प की कमी सम्मिलित है।<ref name="datascience" />
==== विकल्प आधारित वर्गीकरण को अस्वीकार करें ====
==== विकल्प आधारित वर्गीकरण को अस्वीकार करें ====


एक सांख्यिकीय वर्गीकरण दिया गया है <math display="inline"> P(+|X) </math> क्लासिफायर द्वारा उदाहरण की [[संभावना]] के रूप में गणना की जाने वाली संभावना हो <math display="inline"> X </math> धनात्मक वर्ग + से संबंधित है। कब <math display="inline"> P(+|X) </math> उदाहरण 1 या 0 के करीब है <math display="inline"> X </math> क्रमशः वर्ग + या - से संबंधित होने के लिए उच्च स्तर की निश्चितता के साथ निर्दिष्ट किया गया है। हालाँकि, जब <math display="inline"> P(+|X) </math> 0.5 के करीब है तो वर्गीकरण अधिक अस्पष्ट है।<ref name="roc">Faisal Kamiran; Asim Karim; Xiangliang Zhang, [http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.722.3030&rep=rep1&type=pdf ''Decision Theory for Discrimination-aware Classification'']. Retrieved 17 December 2019</ref>
एक वर्गीकारक को देखते हुए मान लीजिए कि <math display="inline"> P(+|X) </math> वर्गीकारक द्वारा गणना की जाने वाली प्रायिकता है, इस [[संभावना|प्रायिकता]] के रूप में कि उदाहरण <math display="inline"> X </math> धनात्मक वर्ग + से संबंधित है। जब <math display="inline"> P(+|X) </math> 1 या 0 के पास है, तो उदाहरण <math display="inline"> X </math> को क्रमशः वर्ग + या - से संबंधित उच्च निश्चितता के साथ निर्दिष्ट किया जाता है। हालाँकि, जब <math display="inline"> P(+|X) </math> 0.5 के पास होता है तो वर्गीकरण अधिक अस्पष्ट होता है।<ref name="roc">Faisal Kamiran; Asim Karim; Xiangliang Zhang, [http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.722.3030&rep=rep1&type=pdf ''Decision Theory for Discrimination-aware Classification'']. Retrieved 17 December 2019</ref>
हम कहते हैं <math display="inline"> X </math> यदि एक अस्वीकृत उदाहरण है <math display="inline"> max(P(+|X), 1-P(+|X)) \leq \theta </math> एक निश्चित के साथ <math display="inline"> \theta </math> ऐसा है कि <math display="inline"> 0.5 < \theta < 1 </math>.
 
हम कहते हैं कि <math display="inline"> X </math> एक "अस्वीकृत उदाहरण" है यदि <math display="inline"> max(P(+|X), 1-P(+|X)) \leq \theta </math> एक निश्चित <math display="inline"> \theta </math> के साथ ऐसा है कि <math display="inline"> 0.5 < \theta < 1 </math> है।


आरओसी के एल्गोरिदम में उपरोक्त नियम का पालन करते हुए गैर-अस्वीकृत उदाहरणों और अस्वीकृत उदाहरणों को निम्नानुसार वर्गीकृत करना सम्मिलित है: यदि उदाहरण एक वंचित समूह का उदाहरण है (<math>X(A) = a</math>) फिर इसे धनात्मक के रूप में लेबल करें, अन्यथा, इसे ऋणात्मक के रूप में लेबल करें।
"आरओसी" के कलनविधि में उपरोक्त नियम का पालन करते हुए गैर-अस्वीकृत उदाहरणों और अस्वीकृत उदाहरणों को निम्नानुसार वर्गीकृत करना सम्मिलित है: यदि उदाहरण वंचित समूह (<math>X(A) = a</math>) का उदाहरण है  तो इसे धनात्मक के रूप में लेबल करें, अन्यथा, इसे ऋणात्मक के रूप में लेबल करते है।


हम भेदभाव के विभिन्न उपायों (लिंक) को कार्यों के रूप में अनुकूलित कर सकते हैं <math display="inline"> \theta </math> इष्टतम खोजने के लिए <math display="inline"> \theta </math> प्रत्येक समस्या के लिए और विशेषाधिकार प्राप्त समूह के प्रति भेदभावपूर्ण बनने से बचें।<ref name="roc" />
हम प्रत्येक समस्या के लिए इष्टतम <math display="inline"> \theta </math> खोजने और विशेषाधिकार प्राप्त समूह के विरूद्व भेदभावपूर्ण बनने से बचने के लिए <math display="inline"> \theta </math> के फलानो के रूप में भेदभाव के विभिन्न उपायों (लिंक) को अनुकूलित कर सकते हैं।<ref name="roc" />
== यह भी देखें ==
== यह भी देखें ==


* कलनविधीय पूर्वाग्रह
* कलनविधि पूर्वाग्रह
* यंत्र अधिगम
* यंत्र अधिगम


Line 266: Line 270:
[[Category: Machine Translated Page]]
[[Category: Machine Translated Page]]
[[Category:Created On 07/12/2023]]
[[Category:Created On 07/12/2023]]
[[Category:Vigyan Ready]]

Latest revision as of 22:22, 18 December 2023

यंत्र अधिगम में निष्पक्षता यंत्र अधिगम प्रतिरूप के आधार पर स्वचालित निर्णय प्रक्रियाओं में कलनविधि पूर्वाग्रह को सही करने के विभिन्न प्रयासों को संदर्भित करता है। यंत्र अधिगम प्रक्रिया के बाद कंप्यूटर द्वारा लिए गए निर्णय अनुचित माने जा सकते हैं यदि वे संवेदनशील माने जाने वाले चर पर आधारित है। इस प्रकार के चर के उदाहरणों में लिंग, जातीयता, लैंगिक अभिविन्यास, विकलांगता और बहुत कुछ सम्मिलित हैं। जैसा कि कई नैतिक अवधारणाओं का प्रकरण है, निष्पक्षता और पूर्वाग्रह की परिभाषाएँ हमेशा विवादास्पद होती हैं। सामान्य रूप में, निष्पक्षता और पूर्वाग्रह तब प्रासंगिक माने जाते हैं जब निर्णय प्रक्रिया लोगों के जीवन को प्रभावित करती है। यंत्र अधिगम में, कलनविधि पूर्वाग्रह की समस्या सर्वविदित है और इसका अच्छी तरह से अध्ययन किया गया है। कई कारकों के कारण परिणाम विषम हो सकते हैं और इस प्रकार इन्हें कुछ समूहों या व्यक्तियों के संबंध में अनुचित माना जा सकता है। इसका एक उदाहरण प्रकार होगा जिससे सामाजिक मीडिया साइटें उपभोक्ताओं को वैयक्तिकृत समाचार प्रदान करती हैं।

सन्दर्भ

यंत्र अधिगम में निष्पक्षता के बारे में परिचर्चा अपेक्षाकृत आधुनिक विषय है। 2016 के बाद से इस विषय पर अनुसंधान में तेजी से वृद्धि हुई है।[1] इस वृद्धि को आंशिक रूप से प्रोपब्लिका की एक प्रभावशाली प्रतिवेदन के कारण माना जा सकता है जिसमें दावा किया गया था कि कॉम्पास (सॉफ़्टवेयर) सॉफ़्टवेयर, जिसका व्यापक रूप से अमेरिकी अदालतों में पुनरावृत्ति की भविष्यवाणी करने के लिए उपयोग किया जाता था, जातीयता के आधार पर पक्षपाती था।[2] अनुसंधान और परिचर्चा का एक विषय निष्पक्षता की परिभाषा है, क्योंकि इसकी कोई सार्वभौमिक परिभाषा नहीं है, और विभिन्न परिभाषाएँ एक-दूसरे के साथ विरोधाभास में हो सकती हैं, जिससे यंत्र अधिगम प्रतिरूप का न्याय करना कठिन हो सकता है।[3] अन्य अनुसंधान विषयों में पूर्वाग्रह की उत्पत्ति, पूर्वाग्रह के प्रकार और पूर्वाग्रह को कम करने के प्रकार सम्मिलित हैं।[4]

आधुनिक वर्षों में तकनीकी कंपनियों ने यंत्र अधिगम में पूर्वाग्रह का पता लगाने और उसे कम करने के प्रकार पर उपकरण और नियमावली बनाते हैं। आईबीएम के पास सॉफ्टवेयर पूर्वाग्रह को कम करने और इसकी निष्पक्षता बढ़ाने के लिए कई कलनविधि के साथ पायथन (प्रोग्रामिंग भाषा) और R (प्रोग्रामिंग भाषा) के लिए उपकरण हैं।[5][6] गूगल ने यंत्र अधिगम में पूर्वाग्रह का अध्ययन करने और उससे प्रतिरोध के लिए दिशानिर्देश और उपकरण प्रकाशित किए हैं।[7][8] फेसबुक ने अपनी एआई में पूर्वाग्रह का पता लगाने के लिए एक टूल, निष्पक्षता प्रवाह के उपयोग की सूचना दी है।[9] हालाँकि, आलोचकों ने तर्क दिया है कि कंपनी के प्रयास अपर्याप्त हैं, कर्मचारियों द्वारा टूल के बहुत कम उपयोग की सूचना दी गई है क्योंकि इसका उपयोग उनके सभी कार्यक्रमों के लिए नहीं किया जा सकता है और जब यह संभव हो, तब भी उपकरण का उपयोग वैकल्पिक है।[10]

यह ध्यान रखना महत्वपूर्ण है कि निर्णय लेने में निष्पक्षता और अन्यायपूर्ण भेदभाव का परीक्षण करने के मात्रात्मक प्रकार के बारे में परिचर्चा यंत्र अधिगम में निष्पक्षता पर आधुनिक तर्क वितर्क से कई दशकों पहले हुई थी।[11] वास्तव में, वैज्ञानिक समुदाय द्वारा इस विषय पर एक सजीव परिचर्चा 1960 और 1970 के दशक के मध्य में उन्नतिशील, जो ज्यादातर अमेरिकी नागरिक अधिकार आंदोलन और विशेष रूप से, 1964 के अमेरिकी नागरिक अधिकार अधिनियम के अनुच्छेद परिणामस्वरूप हुई है। हालाँकि, 1970 के दशक के अंत तक, तर्क वितर्क व्यापक रुप से लुप्त हो गए, क्योंकि निष्पक्षता की अलग-अलग और कभी-कभी प्रतिस्पर्धी धारणाओं ने स्पष्टता के लिए बहुत कम जगह छोड़ी कि कब निष्पक्षता की एक धारणा दूसरे के लिए श्रेष्ठ हो सकती है।

विवाद

कानूनी प्रणाली में कलनविधि निर्णय लेने का उपयोग अनुसंधान के अंतर्गत उपयोग का एक उल्लेखनीय क्षेत्र रहा है। 2014 में, तत्कालीन संयुक्त राज्य अमेरिका के अटॉर्नी सार्वजनिक एरिक होल्डर ने चिंता जताई कि "जोखिम निर्धारण" के प्रकार उन कारकों पर अनुचित ध्यान केंद्रित कर सकते हैं जो प्रतिवादी के नियंत्रण में नहीं हैं, जैसे कि उनकी शिक्षा का स्तर या सामाजिक-आर्थिक पृष्ठभूमि हैं।[12] कम्पास (सॉफ्टवेयर) पर प्रोपब्लिका की 2016 की प्रतिवेदन में दावा किया गया है कि काले प्रतिवादियों को सफेद प्रतिवादियों की तुलना में गलत प्रकार से उच्च जोखिम के रूप में लेबल किए जाने की संभावना लगभग दोगुनी थी, जबकि सफेद प्रतिवादियों के साथ विपरीत गलती हुई थी।[2] कम्पास (सॉफ्टवेयर) के निर्माता, नॉर्थपॉइंट इंक ने प्रतिवेदन का खंडन करते हुए दावा किया कि उनका उपकरण निष्पक्ष है और प्रोपब्लिका ने सांख्यिकीय त्रुटियां की हैं,[13] जिसे बाद में प्रोपब्लिका द्वारा फिर से खंडन कर दिया गया हैं।[14]

प्रतिबिंब पहचान कलनविधि में प्रजातीय और लिंग पूर्वाग्रह भी विख्यात किया गया है। कैमरों में चेहरे और गतिविधि का पता लगाने से गैर-श्वेत विषयों के चेहरे के भावों को अनदेखा या गलत लेबल करना पाया गया है।[15] 2015 में, फ़्लिकर और गूगल फ़ोटो दोनों में स्वचालित टैगिंग सुविधा काले लोगों को "जानवर" और "गोरिल्ला" जैसे टैग के साथ लेबल करने के लिए पाई गई थी।[16] एआई कलनविधि द्वारा निर्णय ली गई 2016 की एक अंतर्राष्ट्रीय सौंदर्य प्रतियोगिता को हल्की त्वचा वाले व्यक्तियों के प्रति पक्षपाती पाया गया, संभवतः प्रशिक्षण डेटा में पूर्वाग्रह के कारण पाया गया है। [17] 2018 में तीन व्यावसायिक लिंग वर्गीकरण कलनविधि के एक अध्ययन में पाया गया कि सभी तीन कलनविधि सामान्यतः गोरी त्वचा वाले पुरुषों को वर्गीकृत करते समय सबसे यथार्थ थे और गहरे रंग की महिलाओं को वर्गीकृत करते समय सबसे निकृष्टतम थे।[18] 2020 में, ट्विटर के एक प्रतिबिंब क्रॉपिंग टूल में पतले त्वचा वाले चेहरों को प्राथमिकता देते हुए दिखाया गया था।[19] DALL-E, एक यंत्र अधिगम टेक्स्ट-टू-प्रतिबिंब प्रतिरूप, जिसे 2021 में जारी किया गया था, जातिवादी और लिंग भेद प्रतिबिंब बनाने के लिए प्रवृत्त रहा है जो सामाजिक रूढ़िवादिता को मजबूत करता है, जिसे इसके रचनाकारों ने स्वीकार किया है।[20]

अन्य क्षेत्र जहां यंत्र अधिगम कलनविधि का उपयोग किया जाता है, उन्हें पक्षपातपूर्ण दिखाया गया है, उनमें नौकरी और ऋण आवेदन सम्मिलित हैं। अमेज़ॅन (कंपनी) ने ऐसे नौकरी आवेदनों की समीक्षा करने के लिए सॉफ़्टवेयर का उपयोग किया है जो लैंगिक भेदभाव वाले थे, उदाहरण के लिए उन बायोडाटा को दंडित करके जिनमें महिला शब्द सम्मिलित था।[21] 2019 में, अपने नए एप्पल कार्ड के लिए क्रेडिट कार्ड की सीमा निर्धारित करने के लिए ऐप्पल इंक के कलनविधि ने महिलाओं की तुलना में पुरुषों को बहुत अधिक सीमाएं दीं हैं, यहां तक ​​​​कि उन जोड़ों के लिए भी जो अपने वित्त को साझा करते हैं।[22] 2021 में द मार्कअप की एक प्रतिवेदन के अनुसार अमेरिका में उपयोग में आने वाले बंधक-अनुमोदन कलनविधि में गैर-श्वेत आवेदकों को अस्वीकार करने की अधिक संभावना दिखाई गई है।[23]

सीमाएँ

आधुनिक कार्य यंत्र अधिगम में निष्पक्षता के वर्तमान परिदृश्य में कई सीमाओं की उपस्थिति को रेखांकित करते हैं, विशेष रुप से जब बात आती है कि एआई के लगातार बढ़ते वास्तविक दुनिया अनुप्रयोगों में इस संबंध में वास्तविक रूप से क्या प्राप्त किया जा सकता है। [24][25] उदाहरण के लिए, निष्पक्षता को औपचारिक बनाने के लिए गणितीय और मात्रात्मक दृष्टिकोण, और संबंधित "डी-बायसिंग" दृष्टिकोण, बहुत सरल और आसानी से उपेक्षित की जाने वाली धारणाओं पर भरोसा किया जा सकता है, जैसे कि व्यक्तियों को पूर्व-परिभाषित सामाजिक समूहों में वर्गीकृत करना है। अन्य कमज़ोर पहलू हैं, उदाहरण के लिए, कई उचित विशेषताओं के मध्य परस्पर क्रिया,[18]और गैर-भेदभाव की स्पष्ट और साझा दार्शनिक और/या कानूनी धारणा का अभाव है।

समूह निष्पक्षता मानदंड

वर्गीकरण समस्याओं में, एक कलनविधि ज्ञात विशेषताओं से एक अलग विशेषता , लक्ष्य चर की भविष्यवाणी करने के लिए एक फलन सीखता है। हम को एक अलग यादृच्छिक चर के रूप में प्रतिरूप करते हैं जो में निहित या अंतर्निहित रूप से कूटलिखित की गई कुछ विशेषताओं को कूटलेखन करना है जिन्हें हम संवेदनशील विशेषताओं (लिंग, जातीयता, लैंगिक अभिविन्यास, इत्यादि) के रूप में मानते हैं। हम अंततः वर्गीकरण की भविष्यवाणी को द्वारा निरूपित करते हैं। अब मूल्यांकन करने के लिए तीन मुख्य मानदंडों को परिभाषित करें कि क्या कोई दिया गया वर्गीकरण निष्पक्ष है, अर्थात् इसकी भविष्यवाणियां इनमें से कुछ संवेदनशील चर से प्रभावित नहीं हैं।[26]

स्वतंत्रता

हम कहते हैं कि यादृच्छिक चर स्वतंत्रता को संतुष्ट करते हैं यदि संवेदनशील विशेषताएं भविष्यवाणी से सांख्यिकीय रूप से स्वतंत्र हैं, और हम लिखते हैं

इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं:
इसका अर्थ यह है कि संवेदनशील विशेषता के संबंध में प्रत्येक लक्ष्य वर्ग के लिए वर्गीकरण दर विभिन्न समूहों से संबंधित लोगों के लिए समान है।

फिर भी स्वतंत्रता के लिए एक और समकक्ष अभिव्यक्ति यादृच्छिक चर के मध्य पारस्परिक जानकारी की अवधारणा का उपयोग करके दी जा सकती है, जिसे इस प्रकार परिभाषित किया गया है

इस सूत्र में, यादृच्छिक चर की एन्ट्रॉपी (सूचना सिद्धांत) है। तब स्वतंत्रता को संतुष्ट करता है यदि है।

स्वतंत्रता की परिभाषा में संभावित छूट (अनुमान) में एक धनात्मक स्लैक प्रस्तावित करना सम्मिलित है और सूत्र द्वारा दिया गया है:

अंत में, एक और संभावित छूट की आवश्यकता है।

पृथक्करण

हम कहते हैं कि यादृच्छिक चर पृथक्करण को संतुष्ट करते हैं यदि संवेदनशील विशेषताएं लक्ष्य मान दिए जाने पर भविष्यवाणी से सांख्यिकीय रूप से स्वतंत्र हैं, और हम लिखते है

इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं:
इसका अर्थ यह है कि संवेदनशील विशेषता पर निर्णय की सभी निर्भरता को वास्तविक लक्ष्य चर की वास्तविक निर्भरता द्वारा उचित ठहराया जाता है।

द्विआधारी लक्ष्य दर के विषय में एक और समतुल्य अभिव्यक्ति यह है कि संवेदनशील विशेषताओं के प्रत्येक मूल्य के लिए यथार्त धनात्मक दर और मिथ्या धनात्मक दर समान होती है (और इसलिए आभासी धनात्मक दर और वास्तविक धनात्मक दर समान होती है):

विशेष परिभाषाओं में एक संभावित छूट यह है कि दरों के मध्य अंतर के मान को शून्य के समान के बदले किसी दिए गए स्लैक से कम धनात्मक संख्या दी जाती है।

कुछ क्षेत्रों में भ्रम आव्यूह में पृथक्करण (पृथक्करण गुणांक) अनुमानित संचयी प्रतिशत ऋणात्मक और अनुमानित संचयी प्रतिशत धनात्मक के मध्य की दूरी (संभावना अंक के दिए गए स्तर पर) का एक माप है।

किसी दिए गए अंक मान पर यह पृथक्करण गुणांक जितना अधिक होगा, प्रतिरूप एक विशेष प्रायिकता कट-ऑफ पर धनात्मक और ऋणात्मक के समुच्चय के मध्य अंतर करने में उतना ही अधिक प्रभावी होता है। मेयस के अनुसार:[27] "क्रेडिट उद्योग में प्रायः यह देखा जाता है कि यथार्तापन उपायों का चयन प्रतिरूपण दृष्टिकोण पर निर्भर करता है। उदाहरण के लिए, यदि प्रतिरूपण प्रक्रिया प्राचलिक या अर्ध-प्राचलिक है, तो दो-प्रतिदर्श K-S परीक्षण प्रायः उपयोग करते है। यदि प्रतिरूप अनुमानी या पुनरावृत्तीय खोज विधियों द्वारा प्राप्त किया गया है, तो प्रतिरूप प्रदर्शन का माप सामान्यतः अपसरण होता है। तीसरा विकल्प पृथक्करण का गुणांक है... अन्य दो प्रकार की तुलना में पृथक्करण का गुणांक, प्रतिरूप प्रदर्शन के माप के रूप में सबसे उचित प्रतीत होता है क्योंकि यह एक प्रतिरूप के पृथक्करण रूप को दर्शाता है।"

पर्याप्तता

हम कहते हैं कि यादृच्छिक चर पर्याप्तता को संतुष्ट करता हैं यदि संवेदनशील विशेषताएं भविष्यवाणी को देखते हुए लक्ष्य मूल्य से सांख्यिकीय रूप से स्वतंत्र हैं, और हम लिखते हैं

इस धारणा को हम निम्नलिखित सूत्र से भी व्यक्त कर सकते हैं:
इसका अर्थ यह है कि वास्तव में प्रत्येक समूह में होने की संभावना सिद्धांत अलग-अलग संवेदनशील विशेषताओं वाले दो व्यक्तियों के लिए समान है, यह देखते हुए कि उनके एक ही समूह से संबंधित होने की भविष्यवाणी की गई थी।

परिभाषाओं के मध्य संबंध

अंत में, हम कुछ मुख्य परिणामों का सारांश देते हैं जो ऊपर दी गई तीन परिभाषाओं से संबंधित हैं:

  • यह मानते हुए कि द्विआधारी है, यदि और सांख्यिकीय रूप से स्वतंत्र नहीं हैं, और और भी सांख्यिकीय रूप से स्वतंत्र नहीं हैं, तो अलंकारिक प्रकरण को छोड़कर स्वतंत्रता और पृथक्करण दोनों सम्मिलित नहीं रह सकते हैं।
  • यदि संयुक्त वितरण के रूप में के सभी संभावित मूल्यों के लिए धनात्मक प्रायिकता सिद्धांत है और और सांख्यिकीय रूप से स्वतंत्र नहीं हैं, तो अलंकारिक प्रकरण को छोड़कर पृथक्करण और पर्याप्तता दोनों सम्मिलित नहीं रह सकते हैं।

इसे पूर्ण निष्पक्षता कहा जाता है जब स्वतंत्रता, पृथक्करण और पर्याप्तता सभी एक साथ संतुष्ट होते हैं।[28] हालाँकि, विशिष्ट अलंकारिक प्रकरण के अलावा पूर्ण निष्पक्षता प्राप्त करना संभव नहीं है। [29]

समूह निष्पक्षता परिभाषाओं का गणितीय सूत्रीकरण

प्रारंभिक परिभाषाएँ

निष्पक्षता के अधिकांश सांख्यिकीय उपाय विभिन्न मापन विज्ञान पर निर्भर करते हैं, इसलिए हम उन्हें परिभाषित करके प्रारंभ करते हैं। द्विआधारी वर्गीकारक के साथ काम करते समय, अनुमानित और वास्तविक वर्ग दोनों दो मान ले सकते हैं: धनात्मक और ऋणात्मक। अब हम पूर्वानुमानित और वास्तविक परिणाम के मध्य विभिन्न संभावित संबंधों को समझाना प्रारंभ करें:[30]

भ्रम आव्यूह
  • यथार्त धनात्मक (टीपी): वह प्रकरण जहां पूर्वानुमानित और वास्तविक परिणाम दोनों धनात्मक वर्ग में हैं।
  • यथार्त ऋणात्मक (टीएन): वह प्रकरण जहां अनुमानित परिणाम और वास्तविक परिणाम दोनों को ऋणात्मक वर्ग को निर्दिष्ट किया गया है।
  • मिथ्या धनात्मक (एफपी): जिस प्रकरण के वास्तविक परिणाम में निर्दिष्ट धनात्मक वर्ग में आने की भविष्यवाणी की गई है, वह ऋणात्मक है।
  • मिथ्या ऋणात्मक (एफएन): जिस प्रकरण के ऋणात्मक वर्ग में होने की भविष्यवाणी की गई है, उसका वास्तविक परिणाम धनात्मक है।

इन संबंधों को आसानी से एक भ्रम आव्यूह के साथ दर्शाया जा सकता है, एक सूची जो वर्गीकरण प्रतिरूप की यथार्थता का वर्णन करती है। इस आव्यूह में, कॉलम और पंक्तियाँ क्रमशः अनुमानित और वास्तविक प्रकरण के उदाहरणों का प्रतिनिधित्व करती हैं।

इन संबंधों का उपयोग करके, हम कई मेट्रिक्स को परिभाषित कर सकते हैं जिनका उपयोग बाद में कलनविधि की निष्पक्षता को मापने के लिए किया जा सकता है:

  • धनात्मक पूर्वानुमानित मूल्य (पीपीवी): धनात्मक प्रकरण का वह भिन्न जिसकी सभी धनात्मक भविष्यवाणियों में से सही भविष्यवाणी की गई थी। इसे सामान्यतः परिशुद्धता के रूप में जाना जाता है, और यह एक सही धनात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है। इसे निम्नलिखित सूत्र द्वारा दिया गया है:
  • मिथ्या खोज दर (एफडीआर): धनात्मक भविष्यवाणियों का वह भिन्न जो वास्तव में सभी धनात्मक भविष्यवाणियों में से ऋणात्मक था। यह एक अशुद्ध धनात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:
  • ऋणात्मक अनुमानित मूल्य (एनपीवी): ऋणात्मक प्रकरण का वह भिन्न जिसकी सभी ऋणात्मक भविष्यवाणियों में से सही भविष्यवाणी की गई थी। यह एक सही ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:
  • मिथ्या लोप दर (FOR): ऋणात्मक भविष्यवाणियों का वह भिन्न जो वास्तव में सभी ऋणात्मक भविष्यवाणियों में से धनात्मक है। यह एक मिथ्या ऋणात्मक भविष्यवाणी की संभावना का प्रतिनिधित्व करता है, और इसे निम्नलिखित सूत्र द्वारा दिया गया है:
  • यथार्त धनात्मक दर (टीपीआर): सभी धनात्मक प्रकरण में से धनात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। इसे सामान्यतः संवेदनशीलता या प्रत्याह्वान के रूप में संदर्भित किया जाता है, और यह धनात्मक विषयों को इस तरह सही प्रकार से र्गीकृत किए जाने की संभावना का प्रतिनिधित्व करता है। यह सूत्र द्वारा दिया गया है:
  • मिथ्या ऋणात्मक दर (एफएनआर): धनात्मक प्रकरण का वह भिन्न जिसके सभी धनात्मक प्रकरण में से ऋणात्मक होने की गलत भविष्यवाणी की गई थी। यह धनात्मक विषयों को गलत प्रकार से ऋणात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:
  • यथार्त ऋणात्मक दर (टीएनआर): सभी ऋणात्मक प्रकरण में से ऋणात्मक प्रकरण का वह भिन्न जिसकी सही भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को सही प्रकार से वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:
  • मिथ्या धनात्मक दर (एफपीआर): ऋणात्मक प्रकरण का वह भिन्न जिसके सभी ऋणात्मक प्रकरण में से धनात्मक होने की गलत भविष्यवाणी की गई थी। यह ऋणात्मक विषयों को गलत प्रकार से धनात्मक के रूप में वर्गीकृत किए जाने की संभावना को दर्शाता है, और यह सूत्र द्वारा दिया गया है:
निष्पक्षता मानदंडों के मध्य संबंध जैसा कि बारोकास एट अल में दिखाया गया है।[26]

निम्नलिखित मानदंडों को इस खंड के आरंभ में दी गई तीन सामान्य परिभाषा, अर्थात् स्वतंत्रता, पृथक्करण और पर्याप्तता के उपायों के रूप में समझा जा सकता है।[26] दाईं ओर, हम उनके मध्य संबंध देख सकते हैं।

इन उपायों को विशेष रूप से परिभाषित करने के लिए, हम उन्हें तीन बड़े समूहों में विभाजित करेंगे जैसा कि वर्मा एट अल में किया गया है:[30] पूर्वानुमानित परिणाम पर आधारित परिभाषाएँ, पूर्वानुमानित और वास्तविक परिणामों पर, और पूर्वानुमानित संभावनाओं और वास्तविक परिणाम पर आधारित परिभाषाएँ है।

हम एक द्विआधारी वर्गीकारक और निम्नलिखित नोटेशन के साथ काम करेंगे: वर्गीकारक द्वारा दिए गए अंक को संदर्भित करता है, जो एक निश्चित विषय के धनात्मक या ऋणात्मक वर्ग में होने की संभावना है। कलनविधि द्वारा अनुमानित अंतिम वर्गीकरण का प्रतिनिधित्व करता है, और इसका मूल्य सामान्यतः से प्राप्त होता है, उदाहरण के लिए धनात्मक होगा जब एक निश्चित सीमा से ऊपर है। वास्तविक परिणाम का प्रतिनिधित्व करता है, अर्थात, व्यक्ति का वास्तविक वर्गीकरण और अंततः, विषयों की संवेदनशील विशेषताओं को दर्शाता है।

पूर्वानुमानित परिणाम पर आधारित परिभाषाएँ

इस खंड की परिभाषाएँ विषयों के विभिन्न वितरणों के लिए अनुमानित परिणाम पर ध्यान केंद्रित करता हैं। वे निष्पक्षता की सबसे सरल और सबसे सहज धारणाएँ हैं।

  • जनसांख्यिकीय समता, जिसे सांख्यिकीय समता, स्वीकृति दर समता और बेंचमार्किंग भी कहा जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों के विषयों को धनात्मक पूर्वानुमानित वर्ग को नियुक्त के समान संभावना है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:
  • सशर्त सांख्यिकीय समता, मूल रूप से उपरोक्त परिभाषा में सम्मिलित है, लेकिन केवल उदाहरणों के उपसमुच्चय तक ही सीमित है। गणितीय संकेतन में यह होगा:

पूर्वानुमानित और वास्तविक परिणामों पर आधारित परिभाषाएँ

ये परिभाषाएँ नहीं केवल पूर्वानुमानित परिणाम पर विचार करता हैं लेकिन इसकी तुलना वास्तविक परिणाम से भी होती हैं।

  • पूर्वानुमानित समता, जिसे परिणाम परीक्षण भी कहा जाता है। यदि संरक्षित और असंरक्षित समूहों के विषयों में समान पीपीवी है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:
गणितीय रूप से, यदि किसी वर्गीकारक के पास दोनों समूहों के लिए समान पीपीवी है, तो उसके पास समान एफडीआर भी होगा, जो सूत्र को संतुष्ट करता है:
  • मिथ्या धनात्मक त्रुटि दर संतुलन, जिसे पूर्वानुमानित समानता भी कहा जाता है। यदि संरक्षित और असंरक्षित समूहों के विषयों में समान एफपीआर है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:
गणितीय रूप से, यदि किसी वर्गीकारक में दोनों समूहों के लिए समान एफपीआर है, तो इसका टीएनआर भी समान होगा, जो सूत्र को संतुष्ट करता है:
  • मिथ्या ऋणात्मक त्रुटि दर संतुलन, जिसे समान अवसर भी कहा जाता है। यदि संरक्षित और असंरक्षित समूहों में विषयों का एफएनआर समान है तो एक वर्गीकारक इस परिभाषा को संतुष्ट करता है। ऐसा तब होता है, जब निम्नलिखित सूत्र संतुष्ट होता है:
गणितीय रूप से, यदि किसी वर्गीकारक के पास दोनों समूहों के लिए समान एफएनआर है, तो उसके पास समान टीपीआर भी होगा, जो सूत्र को संतुष्ट करता है:
  • समान अंतर, जिसे सशर्त प्रक्रिया यथार्थता समानता और असमान दुर्व्यवहार भी कहा जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों के विषयों में समान टीपीआर और समान एफपीआर है, जो सूत्र को संतुष्ट करता है:
  • सशर्त उपयोग यथार्थता समानता एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों के विषयों में समान पीपीवी और समान एनपीवी है, जो सूत्र को संतुष्ट करता है:
  • समग्र यथार्थता समानता एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों में विषय की भविष्यवाणी यथार्थता समान है, अर्थात, एक वर्ग से किसी विषय को नियुक्त की संभावना है। यदि यह निम्नलिखित सूत्र को संतुष्ट करता है:
  • अभिक्रिया समानता एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित समूहों के विषयों में एफएन और एफपी का समान अनुपात है, जो सूत्र को संतुष्ट करता है:

पूर्वानुमानित संभावनाओं और वास्तविक परिणाम पर आधारित परिभाषाएँ

ये परिभाषाएँ वास्तविक परिणाम और अनुमानित प्रायिकता अंक पर आधारित हैं।

  • परीक्षण-निष्पक्षता, जिसे अंशांकन या सशर्त आवृत्तियों के मिलान के रूप में भी जाना जाता है। एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि समान पूर्वानुमानित प्रायिकता अंक वाले व्यक्तियों को धनात्मक वर्ग में वर्गीकृत होने के समान संभावना होती है जब वे संरक्षित या असंरक्षित समूह से संबंधित होते हैं:
  • अनुकूल-अंशांकन पूर्व परिभाषा का विस्तार है। इसमें कहा गया है कि जब संरक्षित समूह के आंतरिक या बाहरी व्यक्तियों के पास समान पूर्वानुमानित प्रायिकता अंक होता है, तो उनके पास धनात्मक वर्ग में वर्गीकृत होने की समान संभावना होनी चाहिए, और यह प्रायिकता के समान होनी चाहिए:
  • धनात्मक वर्ग के लिए संतुलन एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित दोनों समूहों से धनात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित प्रायिकता अंक समान है। इसका अर्थ यह है कि धनात्मक वास्तविक परिणाम के साथ संरक्षित और असंरक्षित समूहों के लिए प्रायिकता अंक का अपेक्षित मूल्य समान है, जो सूत्र को संतुष्ट करता है:
  • ऋणात्मक वर्ग के लिए संतुलन एक वर्गीकारक इस परिभाषा को संतुष्ट करता है यदि संरक्षित और असंरक्षित दोनों समूहों के ऋणात्मक वर्ग का गठन करने वाले विषयों का औसत अनुमानित प्रायिकता अंक समान है। इसका अर्थ यह है कि ऋणात्मक वास्तविक परिणाम वाले संरक्षित और असंरक्षित समूहों के लिए प्रायिकता अंक का अपेक्षित मूल्य समान है, जो सूत्र को संतुष्ट करता है:

समान भ्रम निष्पक्षता

भ्रम आव्यूह के संबंध में, स्वतंत्रता, पृथक्करण और पर्याप्तता के लिए नीचे सूचीबद्ध संबंधित मात्राओं की आवश्यकता होती है ताकि संवेदनशील विशेषताओं में सांख्यिकीय रूप से महत्वपूर्ण अंतर नहीं है।

  • स्वतंत्रता: (टीपी + एफपी) / (टीपी + एफपी + एफएन + टीएन) (अर्थात, )।
  • पृथक्करण: टीएन / (टीएन + एफपी) और टीपी / (टीपी + एफएन) (अर्थात, विशिष्टता और याद करें )।
  • पर्याप्तता: टीपी / (टीपी + एफपी) और टीएन / (टीएन + एफएन) (अर्थात, परिशुद्धता और ऋणात्मक पूर्वानुमानित मूल्य )।

समान भ्रम निष्पक्षता की धारणा[31] के लिए किसी दिए गए निर्णय प्रणाली के भ्रम आव्यूह को समान वितरण की आवश्यकता होती है, जब सभी संवेदनशील विशेषताओं पर स्तरीकृत गणना होती है।

समाज कल्याण कार्य

कुछ विद्वानों ने सामाजिक कल्याण कार्य के संदर्भ में कलनविधि निष्पक्षता को परिभाषित करने का प्रस्ताव दिया है। उनका तर्क है कि सामाजिक कल्याण फलन का उपयोग एक कलनविधि अभिकल्पक को कलनविधि से प्रभावित लोगों को उनके लाभों के संदर्भ में निष्पक्षता और पूर्वानुमान यथार्थता पर विचार करने में सक्षम बनाता है। यह डिजाइनर को सैद्धांतिक प्रकार से दक्षता और समता का आदान-प्रदान करने की भी अनुमति देता है।[32] सेंथिल मुलैनाथन ने कहा है कि कलनविधि अभिकल्पक को वंचित समूहों के लिए पूर्ण लाभ की पहचान करने के लिए सामाजिक कल्याण कार्यों का उपयोग करना चाहिए। उदाहरण के लिए, एक अध्ययन में पाया गया कि शुद्ध मानव निर्णय के बदले पूर्व परीक्षण सुधार में निर्णय लेने वाले कलनविधि का उपयोग करने से सुधार दर को स्थिर रखते हुए भी कुल मिलाकर अश्वेतों, हिस्पैनिक और नस्लीय अल्पसंख्यकों के लिए अपराध दर कम हो गई है।[33]

व्यक्तिगत निष्पक्षता मानदंड

निष्पक्षता परिभाषाओं के मध्य एक महत्वपूर्ण अंतर समूह और व्यक्तिगत धारणाओं के मध्य है।[34][35][30][36] स्थूलतः कहें तो, जबकि समूह निष्पक्षता मानदंड समूह स्तर पर मात्राओं की तुलना करते हैं, सामान्यतः संवेदनशील विशेषताओं (जैसे लिंग, जातीयता, आयु, आदि ...) द्वारा पहचाने जाते हैं, व्यक्तिगत मानदंड व्यक्तियों की तुलना करते हैं। शब्दों में, व्यक्तिगत निष्पक्षता इस सिद्धांत का अनुकरण करते है कि समान व्यक्तियों को समान अभिक्रिया प्राप्त होना चाहिए।

निष्पक्षता के लिए एक बहुत ही सहज दृष्टिकोण है, जिसे सामान्यतः अनभिज्ञता के माध्यम से निष्पक्षता (एफटीयू), या दृष्टिहीनता के नाम से जाना जाता है, जो (स्वचालित) निर्णय लेते समय स्पष्ट रूप से संवेदनशील विशेषताओं को स्पष्ट रूप से नियोजित नहीं करने का निर्देश देता है। यह प्रभावी रूप से व्यक्तिगत निष्पक्षता की धारणा है, क्योंकि दो व्यक्ति केवल अपनी संवेदनशील विशेषताओं के मूल्य के लिए भिन्न होते हैं, उन्हें एक ही परिणाम प्राप्त होता है।

हालाँकि, सामान्य रूप में, एफटीयू में कई कमियाँ हैं, मुख्य बात यह है कि यह निर्णय लेने की प्रक्रिया में नियोजित संवेदनशील विशेषताओं और गैर-संवेदनशील विशेषताओं के मध्य संभावित सहसंबंधों को ध्यान में नहीं रखता है। उदाहरण के लिए, लिंग के आधार पर भेदभाव करने के (घातक) अभिप्राय एक कर्ता प्रतिरूप में लिंग के लिए एक प्रतिनिधि चर प्रस्तावित कर सकता है (अर्थात लिंग के साथ अत्यधिक सहसंबंधित चर) और एफटीयू औषधयोजन के अनुरूप होने के साथ-साथ लिंग संबंधी जानकारी का प्रभावकारी रूप से उपयोग कर सकता है।

संवेदनशील चर से संबंधित कौन से चर निर्णय लेने की प्रक्रिया में एक प्रतिरूप द्वारा पूरी तरह से रोजगार योग्य हैं, यह समस्या एक महत्वपूर्ण, और समूह अवधारणाओं के लिए भी प्रासंगिक है: स्वतंत्रता मेट्रिक्स के लिए संवेदनशील जानकारी को पूरी तरह से अलग करने की आवश्यकता होती है, जबकि पृथक्करण-आधारित मेट्रिक्स सहसंबंध की अनुमति देते हैं, लेकिन केवल तब तक जहां तक ​​लेबल किए गए लक्ष्य चर उन्हें "उचित" ठहराते हैं।

व्यक्तिगत निष्पक्षता की सबसे सामान्य अवधारणा को 2012 में सिंथिया डवर्क और सहयोगियों द्वारा अग्रणी कार्य में प्रस्तावित किया गया था[37] और इसे इस सिद्धांत के गणितीय अनुवाद के रूप में सोचा जा सकता है कि निवेश के रूप में सुविधाओं को इस तरह बनाया जाना चाहिए कि यह "समान व्यक्तियों को समान रूप से मानचित्रित करें", जिसे प्रतिरूप मानचित्र पर लिप्सचिट्ज़ निरंतरता के रूप में व्यक्त किया गया है। वे इस दृष्टिकोण को जानकारी के माध्यम से निष्पक्षता (एफटीए) कहते हैं, जो कि एफटीयू के विपरीत है, क्योंकि वे यह आकलन करने के लिए उपयुक्त लक्ष्य-संबंधित दूरी मीट्रिक चयन करने के महत्व को रेखांकित करते हैं कि कौन से व्यक्ति विशिष्ट परिस्थितियों में समान हैं। फिर, यह समस्या ऊपर उठाए गए बिंदु से बहुत संबंधित है कि विशेष संदर्भों में किन चरों को "उचित" रूप में देखा जा सकता है।

कार्य-कारण-आधारित मेट्रिक्स

कारण निष्पक्षता उस आवृत्ति को मापती है जिसके साथ दो लगभग समान उपयोगकर्ता या अनुप्रयोग जो केवल विशेषताओं के एक समुच्चय में भिन्न होते हैं जिसके संबंध में संसाधन आवंटन उचित होना चाहिए, समान अभिक्रिया प्राप्त करते हैं।[38][dubious ]

निष्पक्षता मेट्रिक्स पर अकादमिक अनुसंधान की एक पूरी शाखा यंत्र अधिगम प्रतिरूप में पूर्वाग्रह का आकलन करने के लिए कारण प्रतिरूप का लाभ उठाने के लिए समर्पित है। यह दृष्टिकोण सामान्यतः इस तथ्य से उचित है कि डेटा का एक ही अवलोकन वितरण खेल में चर के मध्य अलग-अलग कारण संबंधों को गुप्त रखता है, संभवतः अलग-अलग व्याख्याओं के साथ कि परिणाम किसी प्रकार के पूर्वाग्रह से प्रभावित होते हैं या नहीं होते हैं।[26]

कुस्नर एट अल.[39] प्रतितथ्यात्मक को नियोजित करने का प्रस्ताव, और निर्णय लेने की प्रक्रिया को प्रतितथ्यात्मक रूप से निष्पक्ष रूप से परिभाषित करते है, यदि किसी भी व्यक्ति के लिए, प्रतितथ्यात्मक परिदृश्य में परिणाम नहीं बदलता है जहां संवेदनशील गुण बदल जाता हैं। गणितीय सूत्रीकरण पढ़ता है:

अर्थात्: संवेदनशील विशेषता और अन्य विशेषताओं के साथ एक यादृच्छिक व्यक्ति लिया गया और उसी व्यक्ति के पास यदि है, तो उन्हें स्वीकार किए जाने की समान संभावना होनी चाहिए। प्रतीक उस परिदृश्य में प्रतितथ्यात्मक यादृच्छिक चर का प्रतिनिधित्व करता है जहां संवेदनशील विशेषता को पर तय किया गया है। पर प्रतिबंधन का अर्थ है कि यह आवश्यकता व्यक्तिगत स्तर पर है, जिसमें हम एक ही अवलोकन की पहचान करने वाले सभी चर पर प्रतिबंधन कर रहे हैं।

यंत्र अधिगम प्रतिरूप को प्रायः डेटा पर प्रशिक्षित किया जाता है जहां परिणाम उस समय लिए गए निर्णय पर निर्भर करता है।[40] उदाहरण के लिए, यदि यंत्र अधिगम प्रतिरूप को यह निर्धारित करना है कि क्या कोई कैदी दोबारा अपराध करेगा या नहीं और यह निर्धारित करेगा कि क्या कैदी को जल्दी विमुक्त किया जाना चाहिए, तो परिणाम इस पर निर्भर हो सकता है कि कैदी को जल्दी विमुक्त किया गया था या नहीं किया गया था। मिशलर एट अल.[41] प्रतितथ्यात्मक समान बाधाओं के लिए एक सूत्र प्रस्तावित करता है:

जहां एक यादृच्छिक चर है, उस परिणाम को दर्शाता है जो निर्णय लिया गया था, और एक संवेदनशील विशेषता हैं।

प्लेको और बरेइनबोइम[42] निष्पक्षता के कारणात्मक विश्लेषण से समझौते के लिए एक एकीकृत संरचना का प्रस्ताव हैं। वे एक मानक निष्पक्षता प्रतिरूप के उपयोग का सुझाव देते हैं, जिसमें 4 प्रकार के चर के साथ एक कारण आरेख सम्मिलित है:

  • संवेदनशील गुण (),
  • लक्ष्य चर (),
  • और के मध्य मध्यस्थ (), परिणाम पर संवेदनशील विशेषताओं के संभावित अप्रत्यक्ष प्रभावों का प्रतिनिधित्व करता हैं,
  • चर संभवतः () के साथ एक सामान्य कारण साझा करते हैं, जो परिणाम पर संवेदनशील विशेषताओं के संभावित मिथ्या (अर्थात, गैर-कारण) प्रभावों का प्रतिनिधित्व करते है।

इस रूपरेखा के अंतर्गत, प्लेको और बरेइनबोइम[42] उन संभावित प्रभावों को वर्गीकृत करने में सक्षम हैं जो संवेदनशील विशेषताओं के परिणाम पर हो सकते हैं। इसके अलावा, वह ग्रैन्युलैरिटी जिस पर इन प्रभावों को मापा जाता है - अर्थात्, प्रभाव को औसत करने के लिए उपयोग किए जाने वाले प्रतिबंधन चर - निष्पक्षता मूल्यांकन के "व्यक्तिगत बनाम समूह" दृष्टिकोण से सीधे जुड़े हुए हैं।

पूर्वाग्रह न्यूनीकरण योजना

यंत्र अधिगम कलनविधि पर निष्पक्षता को तीन अलग-अलग प्रकार से उपयोजित किया जा सकता है: डेटा पूर्वसंस्करण, सॉफ्टवेयर प्रशिक्षण के समय गणितीय अनुकूलन, या कलनविधि के प्रसंस्करण के बाद परिणाम से उपयोजित किया जा सकता है।

पूर्वसंस्करण

सामान्यतः, वर्गीकारक ही एकमात्र समस्या नहीं है; डाटासमुच्चय भी पक्षपाती हैं। समूह के संबंध में डेटासमुच्चय का भेदभाव निम्नानुसार परिभाषित किया जा सकता है:

अर्थात्, धनात्मक वर्ग में सम्मिलित होने की संभावनाओं के मध्य अंतर का एक अनुमान यह देखते हुए कि विषय में से अलग और के समान संरक्षित विशेषता है।

पूर्वसंस्करण में पूर्वाग्रह को सही करने वाले कलनविधि डेटासमुच्चय चर के बारे में जानकारी अलग कर देते हैं जिसके परिणामस्वरूप अनुचित निर्णय हो सकते हैं, जबकि जितना संभव हो उतना कम बदलाव करने का प्रयत्न किया जाता है। यह केवल संवेदनशील चर को अलग करने जितना आसान नहीं है, क्योंकि अन्य विशेषताओं को संरक्षित चर से सहसंबद्ध किया जा सकता है।

ऐसा करने का एक प्रकार प्रारंभिक डेटासमुच्चय में प्रत्येक व्यक्ति को एक मध्यवर्ती प्रतिनिधित्व के लिए मानचित्र करना है जिसमें यथासंभव अधिक जानकारी बनाए रखते हुए यह पहचानना असंभव है कि यह किसी विशेष संरक्षित समूह से संबंधित है या नहीं है। फिर, कलनविधि में अधिकतम यथार्थता प्राप्त करने के लिए डेटा के नए प्रतिनिधित्व को समायोजित किया जाता है।

इस तरह, व्यक्तियों को एक नए बहुपरिवर्तनीय प्रतिनिधित्व में मानचित्र किया जाता है जहां संरक्षित समूह के किसी भी सदस्य को नए प्रतिनिधित्व में एक निश्चित मूल्य पर मानचित्र किए जाने की संभावना उस व्यक्ति की संभावना के समान होती है जो संरक्षित समूह से संबंधित नहीं है। फिर, प्रारंभिक डेटा के बदले, इस प्रतिनिधित्व का उपयोग व्यक्ति के लिए भविष्यवाणी प्राप्त करने के लिए किया जाता है। मध्यवर्ती प्रतिनिधित्व का निर्माण संरक्षित समूह के आंतरिक या बाहरी के व्यक्तियों को समान संभावना देते हुए किया गया है, इसलिए यह विशेषता वर्गीकरणकर्ता के लिए गुप्त है।

ज़ेमेल एट अल में एक उदाहरण समझाया गया है।[43] जहां एक बहुपद यादृच्छिक चर का उपयोग मध्यवर्ती प्रतिनिधित्व के रूप में किया जाता है। इस प्रक्रिया में, व्यवस्था को उन सूचनाओं को छोड़कर सभी सूचनाओं को संरक्षित करने के लिए प्रोत्साहित किया जाता है जो पक्षपातपूर्ण निर्णय ले सकती हैं, और यथासंभव यथार्थ भविष्यवाणी प्राप्त करने के लिए प्रोत्साहित हो सकती हैं।

एक ओर, इस प्रक्रिया का लाभ यह है कि पूर्व-संसाधित डेटा का उपयोग किसी भी यंत्र अधिगम कार्य के लिए किया जा सकता है। इसके अलावा, वर्गीकारक को संशोधित करने की आवश्यकता नहीं है, क्योंकि प्रसंस्करण से पहले सुधार को डेटा समुच्चय पर उपयोजित किया जाता है। दूसरी ओर, अन्य विधियाँ यथार्थता और निष्पक्षता में श्रेष्ठतर परिणाम प्राप्त करती हैं।[44]

पुनःभारण

पुनःभारण करना पूर्वसंस्करण कलनविधि का एक उदाहरण है। विचार यह है कि प्रत्येक डेटासमुच्चय बिंदु को एक भार दिया जाए ताकि निर्दिष्ट समूह के संबंध में भारित भेदभाव 0 हैं।[45]

यदि डेटासमुच्चय निष्पक्ष था तो संवेदनशील चर और लक्ष्य चर सांख्यिकीय रूप से स्वतंत्र हैं और संयुक्त वितरण की संभावना निम्नानुसार संभावनाओं का उत्पाद होगा:

हालाँकि, वास्तविकता में, डेटासमुच्चय निष्पक्ष नहीं है और चर सांख्यिकीय रूप से स्वतंत्रता (संभावना सिद्धांत) नहीं हैं, इसलिए देखी गई संभावना है:
पूर्वाग्रह की भरपाई के लिए, सॉफ़्टवेयर एक भार जोड़ता है, पसंदीदा वस्तुओं के लिए कम और प्रतिकूल वस्तुओं के लिए अधिक है। प्रत्येक के लिए हमें मिलता है:
जब हमारे पास प्रत्येक के लिए एक भार संबद्ध हम समूह के संबंध में भारित भेदभाव की गणना इस प्रकार करते हैं:
यह दिखाया जा सकता है कि पुनःभारण करने के बाद यह भारित भेदभाव 0 है।

प्रसंस्करण में

दूसरा प्रकार प्रशिक्षण के समय पूर्वाग्रह को सही करना है। यह कलनविधि के अनुकूलन उद्देश्य में बाधाएँ जोड़कर किया जा सकता है।[46] ये बाधाएं कलनविधि को संरक्षित समूह और अन्य व्यक्तियों के लिए कुछ उपायों की समान दरें रखकर, निष्पक्षता में सुधार करने के लिए बलपूर्वक हैं। उदाहरण के लिए, हम कलनविधि के उद्देश्य में यह प्रतिबंध जोड़ सकते हैं कि मिथ्या धनात्मक दर संरक्षित समूह के व्यक्तियों और संरक्षित समूह के बाहर के व्यक्तियों के लिए समान है।

इस दृष्टिकोण में उपयोग किए जाने वाले मुख्य उपाय मिथ्या धनात्मक दर, गलत ऋणात्मक दर और समग्र गलत वर्गीकरण दर हैं। कलनविधि के उद्देश्य में इनमें से केवल एक या कई बाधाओं को जोड़ना संभव है। ध्यान दें कि गलत ऋणात्मक दरों की समानता का तात्पर्य वास्तविक धनात्मक दरों की समानता से है, इसलिए इसका तात्पर्य अवसर की समानता से है। प्रतिबंध जोड़ने के बाद समस्या प्रचण्ड हो सकती है, इसलिए उन पर छूट की आवश्यकता हो सकती है।

यह तकनीक उच्च यथार्थता बनाए रखते हुए निष्पक्षता में सुधार लाने में अच्छे परिणाम प्राप्त करती है और प्रोग्रामर को सुधार के लिए निष्पक्षता उपायों को चयन करने की सुविधा देती है। हालाँकि, प्रत्येक यंत्र अधिगम कार्य को उपयोजित करने के लिए एक अलग विधि की आवश्यकता हो सकती है और वर्गीकारक में कोड को संशोधित करने की आवश्यकता होती है, जो हमेशा संभव नहीं होती है।[44]

विरोधात्मक तर्क वितर्क

हम कुछ प्रवणता-आधारित विधि (जैसे: प्रवणता अवरोहण) के माध्यम से एक ही समय में दो सांख्यिकीय को प्रशिक्षित करते हैं। पहला, भविष्यवक्ता कुछ हानि फलन को कम करने के लिए अपने भार को संशोधित करके, निवेश दिए गए लक्ष्य चर की भविष्यवाणी करने का कार्य पूरा करने का प्रयास करता है। दूसरा, प्रतिद्वंद्वी कुछ हानि फलन को कम करने के लिए अपने भार को संशोधित करके दिए गए संवेदनशील चर की भविष्यवाणी करने का कार्य पूरा करने का प्रयास करता है।[47][48]

यहां एक महत्वपूर्ण बिंदु यह है कि, सही प्रकार से प्रचारित करने के लिए, उपरोक्त को वर्गीकारक के असंसाधित निर्गत को संदर्भित करना चाहिए, असतत भविष्यवाणी नहीं; उदाहरण के लिए, एक कृत्रिम तंत्रिका नेटवर्क और एक वर्गीकरण समस्या के साथ, सॉफ्टमैक्स स्तर के निर्गत को संदर्भित कर सकता है।

फिर हम प्रवणता के अनुसार प्रत्येक प्रशिक्षण स्तर में को कम करने के लिए को अद्यनीकृत करते हैं और हम अभिव्यक्ति के अनुसार को संशोधित करते हैं:

जहां एक ट्यून करने योग्य अतिप्राचल है जो प्रत्येक समय स्तर पर भिन्न हो सकता है।

जैसा कि झांग एट अल में दिखाया गया है, विरोधात्मक डिबियासिंग में प्रयुक्त सदिश का आरेखीय प्रतिनिधित्व।[47]

सहज विचार यह है कि हम चाहते हैं कि भविष्यवक्ता को कम करने का प्रयास करे (इसलिए शब्द , जबकि, एक ही समय में, को अधिकतम करें (इसलिए शब्द ), ताकि प्रतिद्वंद्वी से संवेदनशील चर की भविष्यवाणी करने में विफल है)।

शब्द भविष्यवक्ता को उस दिशा में जाने से रोकता है जो प्रतिद्वंद्वी को उसके ह्रास के फलन को कम करने में सहायता करता है।

यह दिखाया जा सकता है कि इस कलनविधि के साथ एक भविष्यवक्ता वर्गीकरण प्रतिरूप को प्रशिक्षित करने से प्रतिद्वंद्वी के बिना इसे प्रशिक्षित करने के संबंध में जनसांख्यिकीय समानता में सुधार होता है।

पश्चप्रसंस्करण

अंतिम विधि निष्पक्षता प्राप्त करने के लिए वर्गीकारक के परिणामों को सही करने का प्रयास करती है। इस पद्धति में, हमारे पास एक वर्गीकारक है जो प्रत्येक व्यक्ति के लिए एक अंक लौटाता है और हमें उनके लिए एक द्विआधारी भविष्यवाणी करने की आवश्यकता होती है। उच्च अंक प्राप्त करने पर धनात्मक परिणाम मिलने की संभावना है, जबकि कम अंक प्राप्त करने पर ऋणात्मक परिणाम मिलने की संभावना है, लेकिन हम इच्छानुसार हाँ में उत्तर कब देना है यह निर्धारित करने के लिए सीमा को समायोजित कर सकते हैं। ध्यान दें कि सीमा मूल्य में भिन्नता वास्तविक धनात्मक और वास्तविक ऋणात्मक दरों के मध्य व्यापार-बंद को प्रभावित करता है।

यदि अंक फलन इस अर्थ में उचित है कि यह संरक्षित विशेषता से स्वतंत्र है, तो सीमा का कोई भी विकल्प उचित होगा, लेकिन इस प्रकार के वर्गीकारक पक्षपातपूर्ण होते हैं, इसलिए निष्पक्षता प्राप्त करने के लिए प्रत्येक संरक्षित समूह के लिए एक अलग सीमा की आवश्यकता हो सकती है। [49]ऐसा करने का एक प्रकार विभिन्न प्रभावसीमा विन्यास (इसे आरओसी वक्र कहा जाता है) पर मिथ्या ऋणात्मक दर के विरुद्ध वास्तविक धनात्मक दर की आलेखन रचना है और एक सीमा खोजें जहां संरक्षित समूह और अन्य व्यक्तियों के लिए दरें समान हैं।[49]

पश्चप्रसंस्करण के लाभ में यह सम्मिलित है कि तकनीक को किसी भी वर्गीकारक के बाद बिना संशोधित किए उपयोजित किया जा सकता है, और निष्पक्षता उपायों में इसका प्रदर्शन अच्छा है। विपक्ष में परीक्षण के समय संरक्षित विशेषता तक पहुंचने की आवश्यकता और यथार्थता और निष्पक्षता के मध्य संतुलन में विकल्प की कमी सम्मिलित है।[44]

विकल्प आधारित वर्गीकरण को अस्वीकार करें

एक वर्गीकारक को देखते हुए मान लीजिए कि वर्गीकारक द्वारा गणना की जाने वाली प्रायिकता है, इस प्रायिकता के रूप में कि उदाहरण धनात्मक वर्ग + से संबंधित है। जब 1 या 0 के पास है, तो उदाहरण को क्रमशः वर्ग + या - से संबंधित उच्च निश्चितता के साथ निर्दिष्ट किया जाता है। हालाँकि, जब 0.5 के पास होता है तो वर्गीकरण अधिक अस्पष्ट होता है।[50]

हम कहते हैं कि एक "अस्वीकृत उदाहरण" है यदि एक निश्चित के साथ ऐसा है कि है।

"आरओसी" के कलनविधि में उपरोक्त नियम का पालन करते हुए गैर-अस्वीकृत उदाहरणों और अस्वीकृत उदाहरणों को निम्नानुसार वर्गीकृत करना सम्मिलित है: यदि उदाहरण वंचित समूह () का उदाहरण है तो इसे धनात्मक के रूप में लेबल करें, अन्यथा, इसे ऋणात्मक के रूप में लेबल करते है।

हम प्रत्येक समस्या के लिए इष्टतम खोजने और विशेषाधिकार प्राप्त समूह के विरूद्व भेदभावपूर्ण बनने से बचने के लिए के फलानो के रूप में भेदभाव के विभिन्न उपायों (लिंक) को अनुकूलित कर सकते हैं।[50]

यह भी देखें

  • कलनविधि पूर्वाग्रह
  • यंत्र अधिगम

संदर्भ

  1. Caton, Simon; Haas, Christian (2020-10-04). "Fairness in Machine Learning: A Survey". arXiv:2010.04053 [cs.LG].
  2. 2.0 2.1 Mattu, Julia Angwin,Jeff Larson,Lauren Kirchner,Surya. "मशीन पूर्वाग्रह". ProPublica (in English). Retrieved 2022-04-16.{{cite web}}: CS1 maint: multiple names: authors list (link)
  3. Friedler, Sorelle A.; Scheidegger, Carlos; Venkatasubramanian, Suresh (April 2021). "The (Im)possibility of fairness: different value systems require different mechanisms for fair decision making". Communications of the ACM (in English). 64 (4): 136–143. doi:10.1145/3433949. ISSN 0001-0782. S2CID 1769114.
  4. Mehrabi, Ninareh; Morstatter, Fred; Saxena, Nripsuta; Lerman, Kristina; Galstyan, Aram (2021-07-13). "मशीन लर्निंग में पूर्वाग्रह और निष्पक्षता पर एक सर्वेक्षण". ACM Computing Surveys. 54 (6): 115:1–115:35. arXiv:1908.09635. doi:10.1145/3457607. ISSN 0360-0300. S2CID 201666566.
  5. "AI Fairness 360". aif360.mybluemix.net. Retrieved 2022-11-18.
  6. "IBM AI Fairness 360 open source toolkit adds new functionalities". Tech Republic. 4 June 2020.
  7. "जिम्मेदार एआई अभ्यास". Google AI (in English). Retrieved 2022-11-18.
  8. Fairness Indicators, tensorflow, 2022-11-10, retrieved 2022-11-18
  9. "हम एआई बनाने में मदद के लिए फेयरनेस फ्लो का उपयोग कैसे कर रहे हैं जो सभी के लिए बेहतर काम करता है". ai.facebook.com (in English). Retrieved 2022-11-18.
  10. "एआई विशेषज्ञों ने चेतावनी दी है कि फेसबुक का पूर्वाग्रह-विरोधी उपकरण 'पूरी तरह से अपर्याप्त' है". VentureBeat (in English). 2021-03-31. Retrieved 2022-11-18.
  11. Hutchinson, Ben; Mitchell, Margaret (2019-01-29). 50 Years of Test (Un)fairness. New York, NY, USA: ACM FAT*'19. doi:10.1145/3287560.3287600.
  12. "Attorney General Eric Holder Speaks at the National Association of Criminal Defense Lawyers 57th Annual Meeting and 13th State Criminal Justice Network Conference". www.justice.gov (in English). 2014-08-01. Retrieved 2022-04-16.
  13. Dieterich, William; Mendoza, Christina; Brennan, Tim (2016). "COMPAS Risk Scales: Demonstrating Accuracy Equity and Predictive Parity" (PDF). Northpointe Inc.
  14. Angwin, Jeff Larson,Julia (29 July 2016). "नॉर्थपॉइंट को तकनीकी प्रतिक्रिया". ProPublica (in English). Retrieved 2022-11-18.{{cite web}}: CS1 maint: multiple names: authors list (link)
  15. Rose, Adam (2010-01-22). "Are face-detection cameras racist?". Time (in English). ISSN 0040-781X. Retrieved 2022-11-18.
  16. "Google ने फोटो ऐप में नस्लवादी ऑटो-टैग के लिए खेद जताया है". The Guardian (in English). 2015-07-01. Retrieved 2022-04-16.
  17. "एक सौंदर्य प्रतियोगिता का मूल्यांकन एआई द्वारा किया गया और रोबोटों को सांवली त्वचा पसंद नहीं आई". The Guardian (in English). 2016-09-08. Retrieved 2022-04-16.
  18. 18.0 18.1 Buolamwini, Joy; Gebru, Timnit (February 2018). Gender Shades: Intersectional Accuracy Disparities in Commercial Gender Classification (PDF). Conference on Fairness, Accountability and Transparency. New York, NY, USA. pp. 77–91.
  19. "छात्र ने ट्विटर एल्गोरिदम को हल्के, पतले, युवा चेहरों के प्रति 'पूर्वाग्रह' साबित किया". The Guardian (in English). 2021-08-10. Retrieved 2022-11-18.
  20. openai/dalle-2-preview, OpenAI, 2022-11-17, retrieved 2022-11-18
  21. "अमेज़ॅन ने गुप्त एआई भर्ती उपकरण को रद्द कर दिया जो महिलाओं के खिलाफ पूर्वाग्रह दिखाता था". Reuters (in English). 2018-10-10. Retrieved 2022-11-18.
  22. "एप्पल कार्ड एल्गोरिदम ने गोल्डमैन सैक्स के खिलाफ लैंगिक भेदभाव के आरोपों को जन्म दिया". Washington Post (in English). ISSN 0190-8286. Retrieved 2022-11-18.
  23. Martinez, Emmanuel; Kirchner, Lauren (25 August 2021). "The Secret Bias Hidden in Mortgage-Approval Algorithms – The Markup". themarkup.org (in English). Retrieved 2022-11-18.
  24. Buyl, Maarten; De Bie, Tijl. "एआई निष्पक्षता की अंतर्निहित सीमाएँ". arXiv. arXiv. doi:10.48550/ARXIV.2212.06495. Retrieved 2023-11-25.
  25. Castelnovo, Alessandro; Inverardi, Nicole; Nanino, Gabriele; Penco, Ilaria Giuseppina; Regoli, Daniele. "Fair Enough? A map of the current limitations of the requirements to have "fair algorithms". arXiv. doi:10.48550/ARXIV.2311.12435. Retrieved 2023-11-25.
  26. 26.0 26.1 26.2 26.3 Solon Barocas; Moritz Hardt; Arvind Narayanan, Fairness and Machine Learning. Retrieved 15 December 2019.
  27. Mayes, Elizabeth (2001). क्रेडिट स्कोरिंग की हैंडबुक (in English). NY, NY, USA: Glenlake Publishing. p. 282. ISBN 0-8144-0619-X.
  28. Berk, Richard; Heidari, Hoda; Jabbari, Shahin; Kearns, Michael; Roth, Aaron (February 2021). "Fairness in Criminal Justice Risk Assessments: The State of the Art". Sociological Methods & Research (in English). 50 (1): 3–44. arXiv:1703.09207. doi:10.1177/0049124118782533. ISSN 0049-1241. S2CID 12924416.
  29. Räz, Tim (2021-03-03). "Group Fairness: Independence Revisited". निष्पक्षता, जवाबदेही और पारदर्शिता पर 2021 एसीएम सम्मेलन की कार्यवाही (in English). ACM. pp. 129–137. arXiv:2101.02968. doi:10.1145/3442188.3445876. ISBN 978-1-4503-8309-7. S2CID 231667399.
  30. 30.0 30.1 30.2 वर्मा, साहिल, और जूलिया रुबिन। निष्पक्षता की परिभाषाएँ समझाई गईं। 2018 में सॉफ्टवेयर निष्पक्षता (फेयरवेयर) पर आईईईई/एसीएम अंतर्राष्ट्रीय कार्यशाला, पीपी 1-7। आईईईई, 2018।
  31. Gursoy, Furkan; Kakadiaris, Ioannis A. (November 2022). "Equal Confusion Fairness: Measuring Group-Based Disparities in Automated Decision Systems". 2022 IEEE International Conference on Data Mining Workshops (ICDMW). IEEE. pp. 137–146. arXiv:2307.00472. doi:10.1109/ICDMW58026.2022.00027. ISBN 979-8-3503-4609-1. S2CID 256669476.
  32. Chen, Violet (Xinying); Hooker, J. N. (2021). "अनुकूलन के माध्यम से कल्याण-आधारित निष्पक्षता". arXiv:2102.00311 [cs.AI].
  33. Mullainathan, Sendhil (June 19, 2018). एल्गोरिथम निष्पक्षता और सामाजिक कल्याण कार्य. Keynote at the 19th ACM Conference on Economics and Computation (EC'18). YouTube. 48 minutes in. In other words, if you have a social welfare function where what you care about is harm, and you care about harm to the African Americans, there you go: 12 percent less African Americans in jail overnight.... Before we get into the minutiae of relative harm, the welfare function is defined in absolute harm, so we should actually calculate the absolute harm first.
  34. Mitchell, Shira; Potash, Eric; Barocas, Solon; d'Amour, Alexander; Lum, Kristian (2021). "Algorithmic Fairness: Choices, Assumptions, and Definitions". Annual Review of Statistics and Its Application. 8 (1): 141–163. Bibcode:2021AnRSA...8..141M. doi:10.1146/annurev-statistics-042720-125902. S2CID 228893833.
  35. Castelnovo, Alessandro; Crupi, Riccardo; Greco, Greta; Regoli, Daniele; Penco, Ilaria Giuseppina; Cosentini, Andrea Claudio (2022). "निष्पक्षता मेट्रिक्स परिदृश्य में बारीकियों का स्पष्टीकरण". Scientific Reports. 12 (1): 4209. arXiv:2106.00467. Bibcode:2022NatSR..12.4209C. doi:10.1038/s41598-022-07939-1. PMC 8913820. PMID 35273279.
  36. Mehrabi, Ninareh, Fred Morstatter, Nripsuta Saxena, Kristina Lerman, and Aram Galstyan. "A survey on bias and fairness in machine learning." ACM Computing Surveys (CSUR) 54, no. 6 (2021): 1-35.
  37. Dwork, Cynthia; Hardt, Moritz; Pitassi, Toniann; Reingold, Omer; Zemel, Richard (2012). "Fairness through awareness". Proceedings of the 3rd Innovations in Theoretical Computer Science Conference on - ITCS '12. pp. 214–226. doi:10.1145/2090236.2090255. ISBN 9781450311151. S2CID 13496699.
  38. Galhotra, Sainyam; Brun, Yuriy; Meliou, Alexandra (2017). "Fairness testing: Testing software for discrimination". Proceedings of the 2017 11th Joint Meeting on Foundations of Software Engineering. pp. 498–510. arXiv:1709.03221. doi:10.1145/3106237.3106277. ISBN 9781450351058. S2CID 6324652.
  39. Kusner, M. J., Loftus, J., Russell, C., & Silva, R. (2017). Counterfactual fairness. Advances in neural information processing systems, 30.
  40. Coston, Amanda; Mishler, Alan; Kennedy, Edward H.; Chouldechova, Alexandra (2020-01-27). "Counterfactual risk assessments, evaluation, and fairness". Proceedings of the 2020 Conference on Fairness, Accountability, and Transparency. FAT* '20. New York, NY, USA: Association for Computing Machinery. pp. 582–593. doi:10.1145/3351095.3372851. ISBN 978-1-4503-6936-7. S2CID 202539649.
  41. Mishler, Alan; Kennedy, Edward H.; Chouldechova, Alexandra (2021-03-01). "Fairness in Risk Assessment Instruments". Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency. FAccT '21. New York, NY, USA: Association for Computing Machinery. pp. 386–400. doi:10.1145/3442188.3445902. ISBN 978-1-4503-8309-7. S2CID 221516412.
  42. 42.0 42.1 Plecko, Drago; Bareinboim, Elias. "कारण निष्पक्षता विश्लेषण". arXiv. doi:10.48550/ARXIV.2207.11385. Retrieved 2023-11-25. {{cite journal}}: Cite journal requires |journal= (help)
  43. Richard Zemel; Yu (Ledell) Wu; Kevin Swersky; Toniann Pitassi; Cyntia Dwork, Learning Fair Representations. Retrieved 1 December 2019
  44. 44.0 44.1 44.2 Ziyuan Zhong, Tutorial on Fairness in Machine Learning. Retrieved 1 December 2019
  45. Faisal Kamiran; Toon Calders, Data preprocessing techniques for classification without discrimination. Retrieved 17 December 2019
  46. Muhammad Bilal Zafar; Isabel Valera; Manuel Gómez Rodríguez; Krishna P. Gummadi, Fairness Beyond Disparate Treatment & Disparate Impact: Learning Classification without Disparate Mistreatment. Retrieved 1 December 2019
  47. 47.0 47.1 Brian Hu Zhang; Blake Lemoine; Margaret Mitchell, Mitigating Unwanted Biases with Adversarial Learning. Retrieved 17 December 2019
  48. Joyce Xu, Algorithmic Solutions to Algorithmic Bias: A Technical Guide. Retrieved 17 December 2019
  49. 49.0 49.1 Moritz Hardt; Eric Price; Nathan Srebro, Equality of Opportunity in Supervised Learning. Retrieved 1 December 2019
  50. 50.0 50.1 Faisal Kamiran; Asim Karim; Xiangliang Zhang, Decision Theory for Discrimination-aware Classification. Retrieved 17 December 2019