सिंथेटिक डेटा: निर्मित मॉडलों का उपयोग करके सटीक एआई सिस्टम बनाना

इमेज क्रेडिट:
छवि क्रेडिट
iStock

सिंथेटिक डेटा: निर्मित मॉडलों का उपयोग करके सटीक एआई सिस्टम बनाना

सिंथेटिक डेटा: निर्मित मॉडलों का उपयोग करके सटीक एआई सिस्टम बनाना

उपशीर्षक पाठ
सटीक कृत्रिम बुद्धिमत्ता (एआई) मॉडल बनाने के लिए, एक एल्गोरिथ्म द्वारा बनाए गए नकली डेटा की उपयोगिता में वृद्धि देखी जा रही है।
    • लेखक:
    • लेखक का नाम
      क्वांटमरन दूरदर्शिता
    • 4 मई 2022

    अंतर्दृष्टि सारांश

    सिंथेटिक डेटा, एक शक्तिशाली उपकरण जिसमें स्वास्थ्य देखभाल से लेकर खुदरा क्षेत्र तक के अनुप्रयोग हैं, एआई सिस्टम को विकसित और कार्यान्वित करने के तरीके को नया आकार दे रहा है। संवेदनशील जानकारी को खतरे में डाले बिना विविध और जटिल डेटासेट के निर्माण को सक्षम करके, सिंथेटिक डेटा उद्योगों में दक्षता बढ़ा रहा है, गोपनीयता बनाए रख रहा है और लागत कम कर रहा है। हालाँकि, यह चुनौतियाँ भी प्रस्तुत करता है, जैसे भ्रामक मीडिया बनाने में संभावित दुरुपयोग, ऊर्जा खपत से संबंधित पर्यावरणीय चिंताएँ, और श्रम बाजार की गतिशीलता में बदलाव जिन्हें सावधानीपूर्वक प्रबंधित करने की आवश्यकता है।

    सिंथेटिक डेटा संदर्भ

    दशकों से, सिंथेटिक डेटा विभिन्न रूपों में मौजूद है। यह कंप्यूटर गेम जैसे फ्लाइट सिमुलेटर और भौतिकी सिमुलेशन में पाया जा सकता है जो परमाणुओं से लेकर आकाशगंगाओं तक सब कुछ दर्शाते हैं। अब, वास्तविक दुनिया की एआई चुनौतियों को हल करने के लिए स्वास्थ्य सेवा जैसे उद्योगों के भीतर सिंथेटिक डेटा लागू किया जा रहा है।

    एआई की प्रगति कई कार्यान्वयन बाधाओं में जारी है। बड़े डेटा सेट, उदाहरण के लिए, भरोसेमंद निष्कर्ष देने, पूर्वाग्रह से मुक्त होने और तेजी से सख्त डेटा गोपनीयता नियमों का पालन करने के लिए आवश्यक हैं। इन चुनौतियों के बीच, कम्प्यूटरीकृत सिमुलेशन या प्रोग्राम द्वारा निर्मित एनोटेट डेटा वास्तविक डेटा के विकल्प के रूप में उभरा है। कृत्रिम डेटा के रूप में जाना जाने वाला यह एआई-निर्मित डेटा, गोपनीयता की चिंताओं को हल करने और पूर्वाग्रह को मिटाने के लिए महत्वपूर्ण है क्योंकि यह डेटा विविधता सुनिश्चित कर सकता है जो वास्तविक दुनिया को दर्शाता है।

    उदाहरण के तौर पर, हेल्थकेयर व्यवसायी मरीज की गोपनीयता बनाए रखते हुए एआई सिस्टम को प्रशिक्षित करने के लिए मेडिकल इमेज सेक्टर के भीतर सिंथेटिक डेटा का उपयोग करते हैं। उदाहरण के लिए, वर्चुअल केयर फर्म, क्यूराई ने निदान एल्गोरिदम को प्रशिक्षित करने के लिए 400,000 सिंथेटिक चिकित्सा मामलों का उपयोग किया। इसके अलावा, केपर जैसे खुदरा विक्रेता कम से कम पांच उत्पाद शॉट्स से एक हजार तस्वीरों का सिंथेटिक डेटासेट बनाने के लिए 3डी सिमुलेशन का उपयोग करते हैं। जून 2021 में जारी सिंथेटिक डेटा पर केंद्रित गार्टनर अध्ययन के अनुसार, एआई विकास में उपयोग किए जाने वाले अधिकांश डेटा को 2030 तक कानून, सांख्यिकीय मानकों, सिमुलेशन या अन्य माध्यमों से कृत्रिम रूप से निर्मित किया जाएगा।

    विघटनकारी प्रभाव

    सिंथेटिक डेटा गोपनीयता के संरक्षण और डेटा उल्लंघनों की रोकथाम में सहायता करता है। उदाहरण के लिए, एक अस्पताल या निगम एआई-आधारित कैंसर निदान प्रणाली को प्रशिक्षित करने के लिए एक डेवलपर को उच्च-गुणवत्ता वाला सिंथेटिक चिकित्सा डेटा प्रदान कर सकता है - डेटा जो वास्तविक दुनिया के डेटा जितना जटिल है, यह प्रणाली व्याख्या करने के लिए है। इस तरह, डेवलपर्स के पास सिस्टम को डिजाइन और संकलित करते समय उपयोग करने के लिए गुणवत्ता वाले डेटासेट होते हैं, और अस्पताल नेटवर्क संवेदनशील, रोगी चिकित्सा डेटा को खतरे में डालने का जोखिम नहीं उठाता है। 

    सिंथेटिक डेटा आगे परीक्षण डेटा के खरीदारों को पारंपरिक सेवाओं की तुलना में कम कीमत पर जानकारी तक पहुंचने की अनुमति दे सकता है। पॉल वालबोर्स्की के अनुसार, जिन्होंने पहले समर्पित सिंथेटिक डेटा व्यवसायों में से एक, एआई रेवेरी की सह-स्थापना की, एक एकल छवि जिसकी लेबलिंग सेवा से $ 6 की लागत होती है, कृत्रिम रूप से छह सेंट के लिए उत्पन्न की जा सकती है। इसके विपरीत, सिंथेटिक डेटा संवर्धित डेटा का मार्ग प्रशस्त करेगा, जिसमें मौजूदा वास्तविक दुनिया के डेटासेट में नया डेटा जोड़ना शामिल है। नई बनाने के लिए डेवलपर्स पुरानी छवि को घुमा या उज्ज्वल कर सकते हैं। 

    अंत में, गोपनीयता की चिंताओं और सरकारी प्रतिबंधों को देखते हुए, डेटाबेस में मौजूद व्यक्तिगत जानकारी तेजी से विधायी और जटिल होती जा रही है, जिससे वास्तविक दुनिया की जानकारी का उपयोग नए कार्यक्रमों और प्लेटफार्मों को बनाने के लिए करना कठिन हो गया है। सिंथेटिक डेटा अत्यधिक संवेदनशील डेटा को बदलने के लिए डेवलपर्स को वैकल्पिक समाधान प्रदान कर सकता है।

    सिंथेटिक डेटा के निहितार्थ 

    सिंथेटिक डेटा के व्यापक निहितार्थों में शामिल हो सकते हैं:

    • पैमाने और विविधता दोनों में नए एआई सिस्टम का त्वरित विकास, जो कई उद्योगों और अनुशासन के क्षेत्रों में प्रक्रियाओं में सुधार करता है, जिससे स्वास्थ्य देखभाल, परिवहन और वित्त जैसे क्षेत्रों में दक्षता में वृद्धि होती है।
    • संगठनों को अधिक खुले तौर पर जानकारी साझा करने और टीमों को सहयोग करने और अधिक कुशलता से संचालित करने में सक्षम बनाना, जिससे अधिक सामंजस्यपूर्ण कार्य वातावरण और जटिल परियोजनाओं को आसानी से निपटने की क्षमता प्राप्त होगी।
    • डेवलपर्स और डेटा पेशेवर अपने लैपटॉप पर बड़े सिंथेटिक डेटा सेट को ईमेल करने या ले जाने में सक्षम होते हैं, जिससे उन्हें यह पता रहता है कि महत्वपूर्ण डेटा खतरे में नहीं पड़ रहा है, जिससे काम करने की स्थिति अधिक लचीली और सुरक्षित हो जाती है।
    • डेटाबेस साइबर सुरक्षा उल्लंघनों की आवृत्ति कम हो गई है, क्योंकि प्रामाणिक डेटा को अब अक्सर एक्सेस या साझा करने की आवश्यकता नहीं होगी, जिससे व्यवसायों और व्यक्तियों के लिए अधिक सुरक्षित डिजिटल वातावरण तैयार होगा।
    • सरकारों को एआई सिस्टम के उद्योग विकास में बाधा के बारे में चिंता किए बिना सख्त डेटा प्रबंधन कानून लागू करने की अधिक स्वतंत्रता मिल रही है, जिससे डेटा उपयोग परिदृश्य अधिक विनियमित और पारदर्शी हो जाएगा।
    • डीपफेक या अन्य हेरफेर करने वाले मीडिया बनाने में सिंथेटिक डेटा का अनैतिक रूप से उपयोग किए जाने की संभावना है, जिससे डिजिटल सामग्री में गलत सूचना और विश्वास का ह्रास हो सकता है।
    • श्रम बाजार की गतिशीलता में बदलाव, सिंथेटिक डेटा पर बढ़ती निर्भरता के साथ संभावित रूप से डेटा संग्रह भूमिकाओं की आवश्यकता कम हो जाती है, जिससे कुछ क्षेत्रों में नौकरी विस्थापन हो सकता है।
    • सिंथेटिक डेटा उत्पन्न करने और प्रबंधित करने के लिए आवश्यक कम्प्यूटेशनल संसाधनों में वृद्धि का संभावित पर्यावरणीय प्रभाव, उच्च ऊर्जा खपत और संबंधित पर्यावरणीय चिंताओं को जन्म देता है।

    विचार करने के लिए प्रश्न

    • सिंथेटिक डेटा से अन्य कौन से उद्योग लाभान्वित हो सकते हैं?
    • सिंथेटिक डेटा कैसे बनाया, इस्तेमाल किया और तैनात किया जाता है, इस बारे में सरकार को कौन से नियम लागू करने चाहिए? 

    अंतर्दृष्टि संदर्भ

    इस अंतर्दृष्टि के लिए निम्नलिखित लोकप्रिय और संस्थागत लिंक संदर्भित किए गए थे: