सिंथेटिक डेटा: निर्मित मॉडलों का उपयोग करके सटीक एआई सिस्टम बनाना

इमेज क्रेडिट:
छवि क्रेडिट
iStock

सिंथेटिक डेटा: निर्मित मॉडलों का उपयोग करके सटीक एआई सिस्टम बनाना

सिंथेटिक डेटा: निर्मित मॉडलों का उपयोग करके सटीक एआई सिस्टम बनाना

उपशीर्षक पाठ
सटीक कृत्रिम बुद्धिमत्ता (एआई) मॉडल बनाने के लिए, एक एल्गोरिथ्म द्वारा बनाए गए नकली डेटा की उपयोगिता में वृद्धि देखी जा रही है।
    • लेखक:
    • लेखक का नाम
      क्वांटमरन दूरदर्शिता
    • 4 मई 2022

    पाठ पोस्ट करें

    दशकों से, सिंथेटिक डेटा विभिन्न रूपों में मौजूद है। यह कंप्यूटर गेम जैसे फ्लाइट सिमुलेटर और भौतिकी सिमुलेशन में पाया जा सकता है जो परमाणुओं से लेकर आकाशगंगाओं तक सब कुछ दर्शाते हैं। अब, वास्तविक दुनिया की एआई चुनौतियों को हल करने के लिए स्वास्थ्य सेवा जैसे उद्योगों के भीतर सिंथेटिक डेटा लागू किया जा रहा है।

    सिंथेटिक डेटा संदर्भ

    एआई की प्रगति कई कार्यान्वयन बाधाओं में जारी है। बड़े डेटा सेट, उदाहरण के लिए, भरोसेमंद निष्कर्ष देने, पूर्वाग्रह से मुक्त होने और तेजी से सख्त डेटा गोपनीयता नियमों का पालन करने के लिए आवश्यक हैं। इन चुनौतियों के बीच, कम्प्यूटरीकृत सिमुलेशन या प्रोग्राम द्वारा निर्मित एनोटेट डेटा वास्तविक डेटा के विकल्प के रूप में उभरा है। कृत्रिम डेटा के रूप में जाना जाने वाला यह एआई-निर्मित डेटा, गोपनीयता की चिंताओं को हल करने और पूर्वाग्रह को मिटाने के लिए महत्वपूर्ण है क्योंकि यह डेटा विविधता सुनिश्चित कर सकता है जो वास्तविक दुनिया को दर्शाता है।

    हेल्थकेयर प्रैक्टिशनर रोगी की गोपनीयता बनाए रखते हुए एआई सिस्टम को प्रशिक्षित करने के लिए मेडिकल इमेज सेक्टर के भीतर सिंथेटिक डेटा का उपयोग करते हैं। उदाहरण के लिए, वर्चुअल केयर फर्म, कुराई ने निदान एल्गोरिथम को प्रशिक्षित करने के लिए 400,000 सिंथेटिक चिकित्सा मामलों का उपयोग किया। इसके अलावा, Caper जैसे खुदरा विक्रेता कम से कम पांच उत्पाद शॉट्स से एक हजार तस्वीरों का सिंथेटिक डेटासेट बनाने के लिए 3D सिमुलेशन का उपयोग करते हैं। 

    जून 2021 में जारी एक गार्टनर अध्ययन के अनुसार सिंथेटिक डेटा पर ध्यान केंद्रित किया गया, एआई विकास में उपयोग किए जाने वाले अधिकांश डेटा को कृत्रिम रूप से 2030 तक कानून, सांख्यिकीय मानकों, सिमुलेशन या अन्य माध्यमों द्वारा निर्मित किया जाएगा।

    विघटनकारी प्रभाव

    सिंथेटिक डेटा गोपनीयता के संरक्षण और डेटा उल्लंघनों की रोकथाम में सहायता करता है। उदाहरण के लिए, एक अस्पताल या निगम एआई-आधारित कैंसर निदान प्रणाली को प्रशिक्षित करने के लिए एक डेवलपर को उच्च-गुणवत्ता वाला सिंथेटिक चिकित्सा डेटा प्रदान कर सकता है - डेटा जो वास्तविक दुनिया के डेटा जितना जटिल है, यह प्रणाली व्याख्या करने के लिए है। इस तरह, डेवलपर्स के पास सिस्टम को डिजाइन और संकलित करते समय उपयोग करने के लिए गुणवत्ता वाले डेटासेट होते हैं, और अस्पताल नेटवर्क संवेदनशील, रोगी चिकित्सा डेटा को खतरे में डालने का जोखिम नहीं उठाता है। 

    सिंथेटिक डेटा आगे परीक्षण डेटा के खरीदारों को पारंपरिक सेवाओं की तुलना में कम कीमत पर जानकारी तक पहुंचने की अनुमति दे सकता है। पॉल वालबोर्स्की के अनुसार, जिन्होंने पहले समर्पित सिंथेटिक डेटा व्यवसायों में से एक, एआई रेवेरी की सह-स्थापना की, एक एकल छवि जिसकी लेबलिंग सेवा से $ 6 की लागत होती है, कृत्रिम रूप से छह सेंट के लिए उत्पन्न की जा सकती है। इसके विपरीत, सिंथेटिक डेटा संवर्धित डेटा का मार्ग प्रशस्त करेगा, जिसमें मौजूदा वास्तविक दुनिया के डेटासेट में नया डेटा जोड़ना शामिल है। नई बनाने के लिए डेवलपर्स पुरानी छवि को घुमा या उज्ज्वल कर सकते हैं। 

    अंत में, गोपनीयता की चिंताओं और सरकारी प्रतिबंधों को देखते हुए, डेटाबेस में मौजूद व्यक्तिगत जानकारी तेजी से विधायी और जटिल होती जा रही है, जिससे वास्तविक दुनिया की जानकारी का उपयोग नए कार्यक्रमों और प्लेटफार्मों को बनाने के लिए करना कठिन हो गया है। सिंथेटिक डेटा अत्यधिक संवेदनशील डेटा को बदलने के लिए डेवलपर्स को वैकल्पिक समाधान प्रदान कर सकता है।

    सिंथेटिक डेटा के निहितार्थ 

    सिंथेटिक डेटा के व्यापक निहितार्थों में शामिल हैं:

    • पैमाने और विविधता दोनों में नए एआई सिस्टम का त्वरित विकास, जो कई उद्योगों और अनुशासन के क्षेत्रों में प्रक्रियाओं में सुधार करता है।
    • संगठनों को अधिक खुले तौर पर जानकारी साझा करने और टीमों को सहयोग करने और अधिक कुशलता से संचालित करने में सक्षम बनाना।
    • डेवलपर्स और डेटा पेशेवर अपने लैपटॉप पर बड़े सिंथेटिक डेटा सेट ईमेल या ले जाने में सक्षम हैं, यह जानने में सुरक्षित हैं कि महत्वपूर्ण डेटा खतरे में नहीं है।
    • डेटाबेस साइबर सुरक्षा उल्लंघनों की कम आवृत्ति, क्योंकि प्रामाणिक डेटा को अब अक्सर एक्सेस या साझा करने की आवश्यकता नहीं होगी।
    • एआई सिस्टम के उद्योग विकास में बाधा डालने के बारे में चिंता किए बिना कठोर डेटा प्रबंधन कानून लागू करने के लिए सरकारें अधिक स्वतंत्रता प्राप्त कर रही हैं।

    टिप्पणी करने के लिए प्रश्न

    • सिंथेटिक डेटा से अन्य कौन से उद्योग लाभान्वित हो सकते हैं?
    • सिंथेटिक डेटा कैसे बनाया, इस्तेमाल किया और तैनात किया जाता है, इस बारे में सरकार को कौन से नियम लागू करने चाहिए? 

    अंतर्दृष्टि संदर्भ

    इस अंतर्दृष्टि के लिए निम्नलिखित लोकप्रिय और संस्थागत लिंक संदर्भित किए गए थे: