डेटा अनामीकरण: Difference between revisions

From Vigyanwiki
No edit summary
 
(14 intermediate revisions by 5 users not shown)
Line 1: Line 1:
{{Redirect|Anonymization|anonymity on the Internet|Anonymity#Anonymity on the Internet}}
'''डेटा अनामीकरण''' ('''डेटा एनोनिमाइज़ेशन''') एक प्रकार का स्वच्छताकरण(वर्गीकृत जानकारी) है जिसका अभिप्राय गोपनीयता सुरक्षा है। यह [[डेटा सेट|डेटा समुच्चय]] से व्यक्तिगत रूप से पहचान योग्य जानकारी को हटाने की प्रक्रिया हैं, ताकि डेटा जिन लोगों का वर्णन करता हैं वे अज्ञात रहें।
{{Distinguish|Data cleansing}}
डेटा अनामीकरण (डेटा एनोनिमाइज़ेशन) एक प्रकार का स्वच्छताकरण (वर्गीकृत जानकारी) है जिसका अभिप्राय गोपनीयता सुरक्षा है। यह [[डेटा सेट|डेटा समुच्चय]] से व्यक्तिगत रूप से पहचान योग्य जानकारी को हटाने की प्रक्रिया हैं, ताकि डेटा जिन लोगों का वर्णन करता हैं, वे अनाम रहें।


== अवलोकन ==
== अवलोकन ==
डेटा अनामीकरण को एक ऐसी प्रक्रिया के रूप में परिभाषित किया गया है जिसके द्वारा व्यक्तिगत डेटा को इस तरह से बदल दिया जाता है कि डेटा विषय को प्रत्यक्ष या अप्रत्यक्ष रूप से केवल डेटा नियंत्रक द्वारा या किसी अन्य नियंत्रक के सहयोग से पहचाना नहीं जा सकता है।<ref>{{cite book|title=आईएसओ 25237: 2017 स्वास्थ्य सूचना विज्ञान - छद्म नाम|year=2017|publisher=ISO|page=7|url=https://www.iso.org/standard/63553.html}}</ref> डेटा अज्ञातकरण बहुत हद तक सूचना के सस्ते स्थानांतरण को सक्षम कर सकता है, जैसे कि एक संस्था (एजेंसी) के भीतर दो विभागों के बीच या दो संस्थाओं (एजेंसियों) के बीच अनपेक्षित प्रकटीकरण के जोखिम को कम करते हुए और कुछ वातावरणों में इस तरह से कि गुमनामी के बाद मूल्यांकन और विश्लेषण को सक्षम बनाता है।
डेटा अनामीकरण को एक ऐसी प्रक्रिया के रूप में परिभाषित किया गया है जिसके द्वारा व्यक्तिगत डेटा को इस तरह से बदल दिया जाता है कि डेटा विषय को प्रत्यक्ष या अप्रत्यक्ष रूप से केवल डेटा नियंत्रक द्वारा या किसी अन्य नियंत्रक के सहयोग से पहचाना नहीं जा सकता है।<ref>{{cite book|title=आईएसओ 25237: 2017 स्वास्थ्य सूचना विज्ञान - छद्म नाम|year=2017|publisher=ISO|page=7|url=https://www.iso.org/standard/63553.html}}</ref> डेटा अज्ञातकरण बहुत हद तक सूचना के सस्ते स्थानांतरण को सक्षम कर सकता है, जैसे कि एक संस्था(एजेंसी) के भीतर दो विभागों के बीच या दो संस्थाओं(एजेंसियों) के बीच अनपेक्षित प्रकटीकरण के जोखिम को कम करते हुए और वातावरणों में इस तरह से कि गुमनामी के बाद मूल्यांकन और विश्लेषण को सक्षम बनाता है।


[[चिकित्सा रिकॉर्ड|चिकित्सा रिकॉर्ड(]] डेटा ) के संदर्भ में, अज्ञात डेटा उस डेटा को संदर्भित करता है जिससे जानकारी प्राप्त करने वाले द्वारा रोगी की पहचान नहीं की जा सकती है। किसी भी अन्य जानकारी के साथ नाम, पता और पूरा पोस्टकोड हटा दिया जाना चाहिए, जो प्राप्तकर्ता के पास मौजूद या प्रकट किए गए अन्य डेटा के साथ मिलकर रोगी की पहचान कर सके।<ref>{{cite web|title=डेटा गुमनामी|url=http://medical-dictionary.thefreedictionary.com/Anonymized+Data|work=The Free Medical Dictionary|access-date=17 January 2014}}</ref>हमेशा एक जोखिम रहेगा कि अनामीकृत डेटा समय के साथ अज्ञात न रहे। अज्ञात डेटा [[डेटा सेट|समुच्चय]] को अन्य डेटा, चतुर तकनीकों और अपरिष्कृत शक्ति के साथ मिलाकर कुछ ऐसे तरीके हैं जिनसे पहले अज्ञात डेटा समुच्चय दोबारा-अनामीकृत हो गए थे, डेटा विषय अब अज्ञात नहीं हैं।
[[चिकित्सा रिकॉर्ड|चिकित्सा]] डेटा के संदर्भ में, अज्ञात डेटा उस डेटा को संदर्भित करता है जिससे जानकारी प्राप्त करने वाले द्वारा रोगी की पहचान नहीं की जा सकती है। किसी भी अन्य जानकारी के साथ नाम, पता और पूरा पोस्टकोड हटा दिया जाना चाहिए जो प्राप्तकर्ता के पास उपलब्ध या प्रकट किए गए अन्य डेटा के साथ मिलकर रोगी की पहचान कर सके।<ref>{{cite web|title=डेटा गुमनामी|url=http://medical-dictionary.thefreedictionary.com/Anonymized+Data|work=The Free Medical Dictionary|access-date=17 January 2014}}</ref>इस बात का सदैव एक ख़तरा रहेगा कि अनामीकृत डेटा समय के साथ अज्ञात न रहे। अज्ञात डेटा [[डेटा सेट|समुच्चय]] को अन्य डेटा, ज्ञानपूर्ण तकनीकों और अपरिष्कृत शक्ति के साथ मिलाकर कुछ ऐसे तरीके हैं जिनसे पहले अज्ञात डेटा समुच्चय डी-अनामीकृत हो गए थे, डेटा विषय अब अज्ञात नहीं हैं।
 
दोबारा-अनामीकरण ([[डी-गुमनामी|डी एनोनिमाइज़ेशन]]) उत्क्रम (रिवर्स) प्रक्रिया है जिसमें अज्ञात डेटा स्रोत को फिर से पहचानने के लिए, अज्ञात डेटा को अन्य डेटा स्रोतों के साथ प्रति संदर्भ किया जाता है।<ref>{{cite web|title=डी-गुमनामी|url=http://whatis.techtarget.com/definition/de-anonymization-deanonymization|publisher=Whatis.com|access-date=17 January 2014}}</ref> संबंधपरक डेटा के लिए सामान्यीकरण और गड़बड़ी दो लोकप्रिय अनामीकरण दृष्टिकोण हैं।<ref>{{cite journal|last=Bin Zhou|author2=Jian Pei |author3=WoShun Luk |title=सामाजिक नेटवर्क डेटा के प्रकाशन को गोपनीयता बनाए रखने के लिए नाम न छापने की तकनीकों पर एक संक्षिप्त सर्वेक्षण|journal=Newsletter ACM SIGKDD Explorations Newsletter|date=December 2008|volume=10|issue=2|pages=12–22|doi=10.1145/1540276.1540279 |s2cid=609178 |url=https://www.cs.sfu.ca/~jpei/publications/SocialNetworkAnonymization_survey.pdf}}</ref> बाद में इसे फिर से पहचानने की क्षमता के साथ डेटा को अस्पष्ट करने की प्रक्रिया को [[छद्म नाम]]करण भी कहा जाता है और यह एक तरफ़ा कंपनियां डेटा को इस तरह से संग्रहीत कर सकती हैं जो HIPAA (हेल्थ इन्शुरन्स पोर्टेबिलिटी एण्ड अकाउंटेबिलिटी एक्ट) के अनुरूप हो।
 
हालाँकि, अनुच्छेद 29 डेटा प्रोटेक्शन वर्किंग पार्टी के अनुसार, डायरेक्टिव 95/46/EC, रिकिटल 26 में गुमनामी को संदर्भित करता है, यह दर्शाता है कि किसी भी डेटा को अज्ञात करने के लिए, डेटा को पर्याप्त तत्वों से अलग किया जाना चाहिए, ताकि डेटा विषय की पहचान न की जा सके। अधिक सटीक रूप से, उस डेटा को इस तरह से संसाधित किया जाना चाहिए कि नियंत्रक या किसी तीसरे पक्ष द्वारा "सभी संभावित रूप से उचित रूप से उपयोग किए जाने वाले सभी साधनों" का उपयोग करके किसी प्राकृतिक व्यक्ति की पहचान करने के लिए इसका उपयोग नहीं किया जा सकता है। एक महत्वपूर्ण कारक यह है कि प्रसंस्करण अपरिवर्तनीय होना चाहिए। निर्देश स्पष्ट नहीं करता है कि इस तरह की डी-पहचान प्रक्रिया को कैसे किया जाना चाहिए या कैसे किया जा सकता है। ध्यान परिणाम पर है: डेटा ऐसा होना चाहिए जो डेटा विषय को "सभी" "संभावित" और "उचित" साधनों के माध्यम से पहचानने की अनुमति न दे। आचार संहिता को एक उपकरण के रूप में संदर्भित किया जाता है जो संभावित गुमनामी तंत्र को निर्धारित करने के साथ-साथ एक ऐसे रूप में अवधारण करता है जिसमें डेटा विषय की पहचान "अब संभव नहीं है"। <ref>{{cite web|title=WP216|url=https://ec.europa.eu/justice/article-29/documentation/opinion-recommendation/files/2014/wp216_en.pdf|access-date=11 February 2022}}</ref> पांच प्रकार के डेटा एनोनिमाइज़ेशन ऑपरेशन हैं: सामान्यीकरण, दमन, शारीरिक रचना, क्रमपरिवर्तन और क्षोभ।<ref name=":0">{{Cite journal|last1=Eyupoglu|first1=Can|last2=Aydin|first2=Muhammed|last3=Zaim|first3=Abdul|last4=Sertbas|first4=Ahmet|date=2018-05-17|title=कैओस और पर्टर्बेशन तकनीकों पर आधारित एक कुशल बिग डेटा एनोनिमाइज़ेशन एल्गोरिथम|journal=Entropy|volume=20|issue=5|pages=373|doi=10.3390/e20050373|pmid=33265463|pmc=7512893|bibcode=2018Entrp..20..373E|issn=1099-4300|doi-access=free}} [[File:CC-BY icon.svg|50px]]  Text was copied from this source, which is available under a [https://creativecommons.org/licenses/by/4.0/  Creative Commons Attribution 4.0 International License].</ref>


डी-अनामीकरण([[डी-गुमनामी|डी एनोनिमाइज़ेशन]]) उत्क्रम(रिवर्स) प्रक्रिया है जिसमें अज्ञात डेटा स्रोत को फिर से पहचानने के लिए अज्ञात डेटा को अन्य डेटा स्रोतों के साथ प्रति संदर्भ किया जाता है।<ref>{{cite web|title=डी-गुमनामी|url=http://whatis.techtarget.com/definition/de-anonymization-deanonymization|publisher=Whatis.com|access-date=17 January 2014}}</ref> संबंधपरक डेटा के लिए सामान्यीकरण और क्षोभ दो लोकप्रिय अनामीकरण दृष्टिकोण हैं।<ref>{{cite journal|last=Bin Zhou|author2=Jian Pei |author3=WoShun Luk |title=सामाजिक नेटवर्क डेटा के प्रकाशन को गोपनीयता बनाए रखने के लिए नाम न छापने की तकनीकों पर एक संक्षिप्त सर्वेक्षण|journal=Newsletter ACM SIGKDD Explorations Newsletter|date=December 2008|volume=10|issue=2|pages=12–22|doi=10.1145/1540276.1540279 |s2cid=609178 |url=https://www.cs.sfu.ca/~jpei/publications/SocialNetworkAnonymization_survey.pdf}}</ref> बाद में इसे फिर से पहचानने की क्षमता के साथ डेटा को अस्पष्ट करने की प्रक्रिया को [[छद्म नाम]]करण भी कहा जाता है और यह एक तरफ़ा कंपनियां डेटा को इस तरह से संग्रहीत कर सकती हैं जो HIPAA(हेल्थ इन्शुरन्स पोर्टेबिलिटी एण्ड अकाउंटेबिलिटी एक्ट) के अनुरूप हो।


हालाँकि, अनुच्छेद 29 डेटा संरक्षण कार्य-दल के अनुसार डायरेक्टिव 95/46/EC, रिकिटल 26 में अनामीकरण को संदर्भित करता है, यह दर्शाता है कि किसी भी डेटा को अज्ञात करने के लिए डेटा को पर्याप्त तत्वों से अलग किया जाना चाहिए ताकि डेटा विषय की पहचान न की जा सके। सही तरीके से उस डेटा को इस तरह से संसाधित किया जाना चाहिए कि नियंत्रक या किसी तीसरे पक्ष द्वारा "सभी संभावित रूप से उपयोग किए जाने वाले सभी साधनों" का उपयोग करके किसी प्राकृतिक व्यक्ति की पहचान करने के लिए इसका उपयोग नहीं किया जा सकता है, एक महत्वपूर्ण कारक यह है कि प्रसंस्करण अपरिवर्तनीय होना चाहिए। निर्देश स्पष्ट नहीं करता है कि इस तरह की डी-अनामीकरण प्रक्रिया को कैसे किया जाना चाहिए या कैसे किया जा सकता है। ध्यान परिणाम पर है: डेटा ऐसा होना चाहिए जो डेटा विषय को "सभी" "संभावित" और "उचित" साधनों के माध्यम से पहचानने की अनुमति न दे। आचार संहिता को एक उपकरण के रूप में संदर्भित किया जाता है जो संभावित अनामीकृत तंत्र को निर्धारित करने के साथ-साथ एक ऐसे रूप में अवधारण करता है जिसमें डेटा विषय की पहचान "अब संभव नहीं है"। <ref>{{cite web|title=WP216|url=https://ec.europa.eu/justice/article-29/documentation/opinion-recommendation/files/2014/wp216_en.pdf|access-date=11 February 2022}}</ref> पांच प्रकार के डेटा अनामीकरण(एनोनिमाइज़ेशन) संचालन हैं: सामान्यीकरण, दमन, शारीरिक रचना, क्रमपरिवर्तन और क्षोभ।<ref name=":0">{{Cite journal|last1=Eyupoglu|first1=Can|last2=Aydin|first2=Muhammed|last3=Zaim|first3=Abdul|last4=Sertbas|first4=Ahmet|date=2018-05-17|title=कैओस और पर्टर्बेशन तकनीकों पर आधारित एक कुशल बिग डेटा एनोनिमाइज़ेशन एल्गोरिथम|journal=Entropy|volume=20|issue=5|pages=373|doi=10.3390/e20050373|pmid=33265463|pmc=7512893|bibcode=2018Entrp..20..373E|issn=1099-4300|doi-access=free}} [[File:CC-BY icon.svg|50px]]  Text was copied from this source, which is available under a [https://creativecommons.org/licenses/by/4.0/  Creative Commons Attribution 4.0 International License].</ref>
== जीडीपीआर आवश्यकताएं ==
== जीडीपीआर आवश्यकताएं ==


[[यूरोपीय संघ]] का नया [[सामान्य डेटा संरक्षण विनियम]]न (जीडीपीआर) मांग करता है कि यूरोपीय संघ में लोगों पर संग्रहीत डेटा या तो गुमनामी या छद्म नामकरण प्रक्रिया से गुजरता है। GDPR रिकिटल (26) अज्ञात डेटा का गठन करने के लिए एक बहुत ही उच्च बार स्थापित करता है, जिससे डेटा को GDPR की आवश्यकताओं से छूट मिलती है, अर्थात् "... ऐसी जानकारी जो किसी पहचाने गए या पहचाने जाने योग्य प्राकृतिक व्यक्ति या व्यक्तिगत डेटा से संबंधित नहीं होती है, ऐसे में अज्ञात एक तरीका है कि डेटा विषय पहचानने योग्य नहीं है या अब नहीं है। यूरोपियन डेटा प्रोटेक्शन सुपरवाइज़र (EDPS) और स्पैनिश एजेंसी Española de Protección de Datos (AEPD) ने गुमनामी और GDPR आवश्यकताओं से छूट के लिए आवश्यकताओं से संबंधित संयुक्त मार्गदर्शन जारी किया है। ईडीपीएस और एईपीडी के अनुसार डेटा नियंत्रक सहित कोई भी उचित रूप से अज्ञात डेटासेट में डेटा विषयों की फिर से पहचान करने में सक्षम नहीं होना चाहिए। <ref>{{Cite web|url=https://edps.europa.eu/sites/edp/files/publication/19-10-30_aepd-edps_paper_hash_final_en.pdf|title=एक व्यक्तिगत डेटा छद्म नाम तकनीक के रूप में हैश फ़ंक्शन का परिचय}}</ref> डेटा वैज्ञानिकों द्वारा अनुसंधान<ref>{{Cite news|url=https://www.nytimes.com/2019/07/23/health/data-privacy-protection.html?smid=nytcore-ios-share|title=आपका डेटा 'बेनामी' था? ये वैज्ञानिक अब भी आपकी पहचान कर सकते हैं|newspaper=The New York Times|date=23 July 2019|last1=Kolata|first1=Gina}}</ref> लंदन में इंपीरियल कॉलेज और बेल्जियम के यूसीएलउवेन [[UCLouvain]], के साथ-साथ तेल अवीव जिला न्यायालय के न्यायाधीश मीकल एगमोन-गोनेन द्वारा एक निर्णय,<ref>{{Cite web|url=https://www.nevo.co.il/psika_html/minhali/MM-17-06-28857-22.htm|title=Attm (TA) 28857-06-17 नर्सिंग कंपनी एसोसिएशन बनाम रक्षा मंत्रालय}}</ref> आज की बड़ी डेटा दुनिया में गुमनामी की कमियों को उजागर करता है। गुमनामी डेटा संरक्षण के लिए एक पुराने दृष्टिकोण को दर्शाता है<ref>{{Cite web|url=https://www.timesofisrael.com/data-is-up-for-grabs-under-outdated-israeli-privacy-law-think-tank-says/|title=थिंक टैंक का कहना है कि पुराने इजरायली गोपनीयता कानून के तहत डेटा हड़पने के लिए तैयार है|website=[[The Times of Israel]]}}</ref> यह तब विकसित किया गया था जब डेटा का प्रसंस्करण "बिग डेटा" प्रसंस्करण की लोकप्रियता से पहले पृथक (सिलोएड) अनुप्रयोगों तक सीमित था, जिसमें डेटा का व्यापक साझाकरण और संयोजन शामिल था।
[[यूरोपीय संघ]] का नया [[सामान्य डेटा संरक्षण विनियम]]न जीडीपीआर (GDPR) मांग करता है कि यूरोपीय संघ में लोगों पर संग्रहीत डेटा या तो अनामीकृत या छद्म नामकरण प्रक्रिया से गुजरता है। जीडीपीआर(GDPR) रिकिटल (26) अज्ञात डेटा का गठन करने के लिए एक बहुत ही उच्च बार स्थापित करता है जिससे डेटा को जीडीपीआर की आवश्यकताओं से छूट मिलती है अर्थात् "ऐसी जानकारी जो किसी पहचाने गए या पहचाने जाने योग्य प्राकृतिक व्यक्ति या व्यक्तिगत डेटा से संबंधित नहीं होती है ऐसे में अनामीकरण एक तरीका है कि डेटा विषय पहचानने योग्य नहीं है। यूरोपियन डेटा प्रोटेक्शन सुपरवाइज़र (EDPS) और स्पैनिश एजेंसी (AEPD) स्पेनिश डेटा संरक्षण ने अनामीकरण और जीडीपीआर आवश्यकताओं से छूट के लिए आवश्यकताओं से संबंधित संयुक्त मार्गदर्शन जारी किया है। ईडीपीएस और एईपीडी के अनुसार डेटा नियंत्रक सहित कोई भी उचित रूप से अज्ञात डेटा समुच्चय में डेटा विषयों की फिर से पहचान करने में सक्षम नहीं होना चाहिए। <ref>{{Cite web|url=https://edps.europa.eu/sites/edp/files/publication/19-10-30_aepd-edps_paper_hash_final_en.pdf|title=एक व्यक्तिगत डेटा छद्म नाम तकनीक के रूप में हैश फ़ंक्शन का परिचय}}</ref> डेटा वैज्ञानिकों द्वारा अनुसंधान<ref>{{Cite news|url=https://www.nytimes.com/2019/07/23/health/data-privacy-protection.html?smid=nytcore-ios-share|title=आपका डेटा 'बेनामी' था? ये वैज्ञानिक अब भी आपकी पहचान कर सकते हैं|newspaper=The New York Times|date=23 July 2019|last1=Kolata|first1=Gina}}</ref> लंदन में इंपीरियल कॉलेज और बेल्जियम के यूसीएलउवेन के साथ-साथ तेल अवीव जिला न्यायालय के न्यायाधीश मीकल एगमोन-गोनेन द्वारा एक निर्णय<ref>{{Cite web|url=https://www.nevo.co.il/psika_html/minhali/MM-17-06-28857-22.htm|title=Attm (TA) 28857-06-17 नर्सिंग कंपनी एसोसिएशन बनाम रक्षा मंत्रालय}}</ref> आज की बड़ी डेटा दुनिया में अनामीकरण की कमियों को उजागर करता है। अनामीकृत डेटा संरक्षण के लिए एक पुराने दृष्टिकोण को दर्शाता है<ref>{{Cite web|url=https://www.timesofisrael.com/data-is-up-for-grabs-under-outdated-israeli-privacy-law-think-tank-says/|title=थिंक टैंक का कहना है कि पुराने इजरायली गोपनीयता कानून के तहत डेटा हड़पने के लिए तैयार है|website=[[The Times of Israel]]}}</ref> यह तब विकसित किया गया था जब डेटा का प्रसंस्करण "बिग डेटा" प्रसंस्करण की लोकप्रियता से पहले पृथक(सिलोएड) अनुप्रयोगों तक सीमित था जिसमें डेटा का व्यापक साझाकरण और संयोजन सम्मिलित था।


== यह भी देखें ==
== यह भी देखें ==
* गुमनामी
* अनामीकरण
* डी-पहचान
* डी-पहचान
* डी-अनामकरण
* डी-अनामकरण
* [[विभेदक गोपनीयता]]
* [[विभेदक गोपनीयता]]
* [[पट्टिका (संशोधन)]]
* [[पट्टिका (संशोधन)|पट्टिका(संशोधन)]]
* [[भू-अवरुद्ध]]
* [[भू-अवरुद्ध]]
* के-गुमनामी
* के-अनामीकरण
* [[एल-विविधता]]
* [[एल-विविधता]]
* [[खुफिया एजेंसियों द्वारा मास्किंग और अनमास्किंग]]
* [[खुफिया एजेंसियों द्वारा मास्किंग और अनमास्किंग|खुफिया एजेंसियों द्वारा आच्छदन और अनमास्किंग]]
* [[सांख्यिकीय प्रकटीकरण नियंत्रण]]
* [[सांख्यिकीय प्रकटीकरण नियंत्रण]]
* छद्म नामकरण
* छद्म नामकरण
Line 32: Line 28:
==संदर्भ==
==संदर्भ==
{{reflist}}
{{reflist}}
==अग्रिम पठन==
==अग्रिम पठन==
* {{cite book|last=Raghunathan|first=Balaji|title=The Complete Book of Data Anonymization: From Planning to Implementation|date=June 2013|publisher=CRC Press|isbn=9781482218565}}
* {{cite book|last=Raghunathan|first=Balaji|title=The Complete Book of Data Anonymization: From Planning to Implementation|date=June 2013|publisher=CRC Press|isbn=9781482218565}}
Line 40: Line 34:
* {{cite book|last=Aris Gkoulalas-Divanis, Grigorios Loukides|title=Anonymization of Electronic Medical Records to Support Clinical Analysis (SpringerBriefs in Electrical and Computer Engineering)|year=2012|publisher=Springer|isbn=9781461456674}}
* {{cite book|last=Aris Gkoulalas-Divanis, Grigorios Loukides|title=Anonymization of Electronic Medical Records to Support Clinical Analysis (SpringerBriefs in Electrical and Computer Engineering)|year=2012|publisher=Springer|isbn=9781461456674}}
* {{cite web|last=Pete Warden|title=Why you can't really anonymize your data|url=http://strata.oreilly.com/2011/05/anonymize-data-limits.html|publisher=O'Reilly Media, Inc.|access-date=17 January 2014|archive-url=https://web.archive.org/web/20140109052803/http://strata.oreilly.com/2011/05/anonymize-data-limits.html|archive-date=9 January 2014|url-status=dead}}
* {{cite web|last=Pete Warden|title=Why you can't really anonymize your data|url=http://strata.oreilly.com/2011/05/anonymize-data-limits.html|publisher=O'Reilly Media, Inc.|access-date=17 January 2014|archive-url=https://web.archive.org/web/20140109052803/http://strata.oreilly.com/2011/05/anonymize-data-limits.html|archive-date=9 January 2014|url-status=dead}}
==इस पेज में लापता आंतरिक लिंक की सूची==
*व्यक्तिगत पहचान की जानकारी
*एकान्तता सुरक्षा
*स्वच्छता (वर्गीकृत जानकारी)
*स्वास्थ्य बीमा सुवाह्यता और जवाबदेही अधिनियम
*बड़ा डेटा
*k-गुमनामी
*de-पहचान
==बाहरी संबंध==
==बाहरी संबंध==
* on the anonymization of Internet traffic: [http://www.caida.org/data/anonymization/index.xml Data Sharing and Anonymization Reading List]
* on the anonymization of Internet traffic: [http://www.caida.org/data/anonymization/index.xml Data Sharing and Anonymization Reading List]
[[Category:सूचना गोपनीयता]]
[[Category: डेटा सुरक्षा]]
[[Category: गुमनामी]]


 
[[Category:Articles with hatnote templates targeting a nonexistent page]]
[[Category: Machine Translated Page]]
[[Category:CS1 français-language sources (fr)]]
[[Category:CS1 maint]]
[[Category:CS1 Ελληνικά-language sources (el)]]
[[Category:Citation Style 1 templates|W]]
[[Category:Collapse templates]]
[[Category:Created On 05/12/2022]]
[[Category:Created On 05/12/2022]]
[[Category:Machine Translated Page]]
[[Category:Missing redirects]]
[[Category:Navigational boxes| ]]
[[Category:Navigational boxes without horizontal lists]]
[[Category:Pages with script errors]]
[[Category:Sidebars with styles needing conversion]]
[[Category:Template documentation pages|Documentation/doc]]
[[Category:Templates based on the Citation/CS1 Lua module]]
[[Category:Templates generating COinS|Cite web]]
[[Category:Templates generating microformats]]
[[Category:Templates that are not mobile friendly]]
[[Category:Templates used by AutoWikiBrowser|Cite web]]
[[Category:Templates using TemplateData]]
[[Category:Wikipedia fully protected templates|Cite web]]
[[Category:Wikipedia metatemplates]]
[[Category:गुमनामी]]
[[Category:डेटा सुरक्षा]]
[[Category:सूचना गोपनीयता]]

Latest revision as of 17:18, 23 August 2023

डेटा अनामीकरण (डेटा एनोनिमाइज़ेशन) एक प्रकार का स्वच्छताकरण(वर्गीकृत जानकारी) है जिसका अभिप्राय गोपनीयता सुरक्षा है। यह डेटा समुच्चय से व्यक्तिगत रूप से पहचान योग्य जानकारी को हटाने की प्रक्रिया हैं, ताकि डेटा जिन लोगों का वर्णन करता हैं वे अज्ञात रहें।

अवलोकन

डेटा अनामीकरण को एक ऐसी प्रक्रिया के रूप में परिभाषित किया गया है जिसके द्वारा व्यक्तिगत डेटा को इस तरह से बदल दिया जाता है कि डेटा विषय को प्रत्यक्ष या अप्रत्यक्ष रूप से केवल डेटा नियंत्रक द्वारा या किसी अन्य नियंत्रक के सहयोग से पहचाना नहीं जा सकता है।[1] डेटा अज्ञातकरण बहुत हद तक सूचना के सस्ते स्थानांतरण को सक्षम कर सकता है, जैसे कि एक संस्था(एजेंसी) के भीतर दो विभागों के बीच या दो संस्थाओं(एजेंसियों) के बीच अनपेक्षित प्रकटीकरण के जोखिम को कम करते हुए और वातावरणों में इस तरह से कि गुमनामी के बाद मूल्यांकन और विश्लेषण को सक्षम बनाता है।

चिकित्सा डेटा के संदर्भ में, अज्ञात डेटा उस डेटा को संदर्भित करता है जिससे जानकारी प्राप्त करने वाले द्वारा रोगी की पहचान नहीं की जा सकती है। किसी भी अन्य जानकारी के साथ नाम, पता और पूरा पोस्टकोड हटा दिया जाना चाहिए जो प्राप्तकर्ता के पास उपलब्ध या प्रकट किए गए अन्य डेटा के साथ मिलकर रोगी की पहचान कर सके।[2]इस बात का सदैव एक ख़तरा रहेगा कि अनामीकृत डेटा समय के साथ अज्ञात न रहे। अज्ञात डेटा समुच्चय को अन्य डेटा, ज्ञानपूर्ण तकनीकों और अपरिष्कृत शक्ति के साथ मिलाकर कुछ ऐसे तरीके हैं जिनसे पहले अज्ञात डेटा समुच्चय डी-अनामीकृत हो गए थे, डेटा विषय अब अज्ञात नहीं हैं।

डी-अनामीकरण(डी एनोनिमाइज़ेशन) उत्क्रम(रिवर्स) प्रक्रिया है जिसमें अज्ञात डेटा स्रोत को फिर से पहचानने के लिए अज्ञात डेटा को अन्य डेटा स्रोतों के साथ प्रति संदर्भ किया जाता है।[3] संबंधपरक डेटा के लिए सामान्यीकरण और क्षोभ दो लोकप्रिय अनामीकरण दृष्टिकोण हैं।[4] बाद में इसे फिर से पहचानने की क्षमता के साथ डेटा को अस्पष्ट करने की प्रक्रिया को छद्म नामकरण भी कहा जाता है और यह एक तरफ़ा कंपनियां डेटा को इस तरह से संग्रहीत कर सकती हैं जो HIPAA(हेल्थ इन्शुरन्स पोर्टेबिलिटी एण्ड अकाउंटेबिलिटी एक्ट) के अनुरूप हो।

हालाँकि, अनुच्छेद 29 डेटा संरक्षण कार्य-दल के अनुसार डायरेक्टिव 95/46/EC, रिकिटल 26 में अनामीकरण को संदर्भित करता है, यह दर्शाता है कि किसी भी डेटा को अज्ञात करने के लिए डेटा को पर्याप्त तत्वों से अलग किया जाना चाहिए ताकि डेटा विषय की पहचान न की जा सके। सही तरीके से उस डेटा को इस तरह से संसाधित किया जाना चाहिए कि नियंत्रक या किसी तीसरे पक्ष द्वारा "सभी संभावित रूप से उपयोग किए जाने वाले सभी साधनों" का उपयोग करके किसी प्राकृतिक व्यक्ति की पहचान करने के लिए इसका उपयोग नहीं किया जा सकता है, एक महत्वपूर्ण कारक यह है कि प्रसंस्करण अपरिवर्तनीय होना चाहिए। निर्देश स्पष्ट नहीं करता है कि इस तरह की डी-अनामीकरण प्रक्रिया को कैसे किया जाना चाहिए या कैसे किया जा सकता है। ध्यान परिणाम पर है: डेटा ऐसा होना चाहिए जो डेटा विषय को "सभी" "संभावित" और "उचित" साधनों के माध्यम से पहचानने की अनुमति न दे। आचार संहिता को एक उपकरण के रूप में संदर्भित किया जाता है जो संभावित अनामीकृत तंत्र को निर्धारित करने के साथ-साथ एक ऐसे रूप में अवधारण करता है जिसमें डेटा विषय की पहचान "अब संभव नहीं है"। [5] पांच प्रकार के डेटा अनामीकरण(एनोनिमाइज़ेशन) संचालन हैं: सामान्यीकरण, दमन, शारीरिक रचना, क्रमपरिवर्तन और क्षोभ।[6]

जीडीपीआर आवश्यकताएं

यूरोपीय संघ का नया सामान्य डेटा संरक्षण विनियमन जीडीपीआर (GDPR) मांग करता है कि यूरोपीय संघ में लोगों पर संग्रहीत डेटा या तो अनामीकृत या छद्म नामकरण प्रक्रिया से गुजरता है। जीडीपीआर(GDPR) रिकिटल (26) अज्ञात डेटा का गठन करने के लिए एक बहुत ही उच्च बार स्थापित करता है जिससे डेटा को जीडीपीआर की आवश्यकताओं से छूट मिलती है अर्थात् "ऐसी जानकारी जो किसी पहचाने गए या पहचाने जाने योग्य प्राकृतिक व्यक्ति या व्यक्तिगत डेटा से संबंधित नहीं होती है ऐसे में अनामीकरण एक तरीका है कि डेटा विषय पहचानने योग्य नहीं है। यूरोपियन डेटा प्रोटेक्शन सुपरवाइज़र (EDPS) और स्पैनिश एजेंसी (AEPD) स्पेनिश डेटा संरक्षण ने अनामीकरण और जीडीपीआर आवश्यकताओं से छूट के लिए आवश्यकताओं से संबंधित संयुक्त मार्गदर्शन जारी किया है। ईडीपीएस और एईपीडी के अनुसार डेटा नियंत्रक सहित कोई भी उचित रूप से अज्ञात डेटा समुच्चय में डेटा विषयों की फिर से पहचान करने में सक्षम नहीं होना चाहिए। [7] डेटा वैज्ञानिकों द्वारा अनुसंधान[8] लंदन में इंपीरियल कॉलेज और बेल्जियम के यूसीएलउवेन के साथ-साथ तेल अवीव जिला न्यायालय के न्यायाधीश मीकल एगमोन-गोनेन द्वारा एक निर्णय[9] आज की बड़ी डेटा दुनिया में अनामीकरण की कमियों को उजागर करता है। अनामीकृत डेटा संरक्षण के लिए एक पुराने दृष्टिकोण को दर्शाता है[10] यह तब विकसित किया गया था जब डेटा का प्रसंस्करण "बिग डेटा" प्रसंस्करण की लोकप्रियता से पहले पृथक(सिलोएड) अनुप्रयोगों तक सीमित था जिसमें डेटा का व्यापक साझाकरण और संयोजन सम्मिलित था।

यह भी देखें

संदर्भ

  1. आईएसओ 25237: 2017 स्वास्थ्य सूचना विज्ञान - छद्म नाम. ISO. 2017. p. 7.
  2. "डेटा गुमनामी". The Free Medical Dictionary. Retrieved 17 January 2014.
  3. "डी-गुमनामी". Whatis.com. Retrieved 17 January 2014.
  4. Bin Zhou; Jian Pei; WoShun Luk (December 2008). "सामाजिक नेटवर्क डेटा के प्रकाशन को गोपनीयता बनाए रखने के लिए नाम न छापने की तकनीकों पर एक संक्षिप्त सर्वेक्षण" (PDF). Newsletter ACM SIGKDD Explorations Newsletter. 10 (2): 12–22. doi:10.1145/1540276.1540279. S2CID 609178.
  5. "WP216" (PDF). Retrieved 11 February 2022.
  6. Eyupoglu, Can; Aydin, Muhammed; Zaim, Abdul; Sertbas, Ahmet (2018-05-17). "कैओस और पर्टर्बेशन तकनीकों पर आधारित एक कुशल बिग डेटा एनोनिमाइज़ेशन एल्गोरिथम". Entropy. 20 (5): 373. Bibcode:2018Entrp..20..373E. doi:10.3390/e20050373. ISSN 1099-4300. PMC 7512893. PMID 33265463. CC-BY icon.svg Text was copied from this source, which is available under a Creative Commons Attribution 4.0 International License.
  7. "एक व्यक्तिगत डेटा छद्म नाम तकनीक के रूप में हैश फ़ंक्शन का परिचय" (PDF).
  8. Kolata, Gina (23 July 2019). "आपका डेटा 'बेनामी' था? ये वैज्ञानिक अब भी आपकी पहचान कर सकते हैं". The New York Times.
  9. "Attm (TA) 28857-06-17 नर्सिंग कंपनी एसोसिएशन बनाम रक्षा मंत्रालय".
  10. "थिंक टैंक का कहना है कि पुराने इजरायली गोपनीयता कानून के तहत डेटा हड़पने के लिए तैयार है". The Times of Israel.

अग्रिम पठन

  • Raghunathan, Balaji (June 2013). The Complete Book of Data Anonymization: From Planning to Implementation. CRC Press. ISBN 9781482218565.
  • Khaled El Emam, Luk Arbuckle (August 2014). Anonymizing Health Data: Case Studies and Methods to Get You Started. O'Reilly Media. ISBN 978-1-4493-6307-9.
  • Rolf H. Weber, Ulrike I. Heinrich (2012). Anonymization: SpringerBriefs in Cybersecurity. Springer. ISBN 9781447140665.
  • Aris Gkoulalas-Divanis, Grigorios Loukides (2012). Anonymization of Electronic Medical Records to Support Clinical Analysis (SpringerBriefs in Electrical and Computer Engineering). Springer. ISBN 9781461456674.
  • Pete Warden. "Why you can't really anonymize your data". O'Reilly Media, Inc. Archived from the original on 9 January 2014. Retrieved 17 January 2014.

बाहरी संबंध