Data sintetis: Membuat sistem AI yang akurat menggunakan model yang diproduksi

KREDIT GAMBAR:
Gambar kredit
iStock

Data sintetis: Membuat sistem AI yang akurat menggunakan model yang diproduksi

Data sintetis: Membuat sistem AI yang akurat menggunakan model yang diproduksi

Teks subjudul
Untuk membuat model kecerdasan buatan (AI) yang akurat, data simulasi yang dibuat oleh algoritme mengalami peningkatan utilitas.
    • Penulis:
    • nama penulis
      Pandangan ke Depan Quantumrun
    • 4 Mei 2022

    Ringkasan wawasan

    Data sintetis, alat canggih yang dapat diterapkan mulai dari layanan kesehatan hingga ritel, mengubah cara sistem AI dikembangkan dan diimplementasikan. Dengan memungkinkan pembuatan kumpulan data yang beragam dan kompleks tanpa membahayakan informasi sensitif, data sintetis meningkatkan efisiensi di seluruh industri, menjaga privasi, dan mengurangi biaya. Namun, hal ini juga menghadirkan tantangan, seperti potensi penyalahgunaan dalam menciptakan media yang menipu, permasalahan lingkungan terkait konsumsi energi, dan pergeseran dinamika pasar tenaga kerja yang perlu dikelola secara hati-hati.

    Konteks data sintetis

    Selama beberapa dekade, data sintetis telah ada dalam berbagai bentuk. Ini dapat ditemukan dalam permainan komputer seperti simulator penerbangan dan dalam simulasi fisika yang menggambarkan segala sesuatu mulai dari atom hingga galaksi. Sekarang, data sintetis sedang diterapkan dalam industri seperti perawatan kesehatan untuk memecahkan tantangan AI dunia nyata.

    Kemajuan AI terus mengalami beberapa kendala implementasi. Kumpulan data besar, misalnya, diharuskan untuk memberikan temuan yang dapat dipercaya, bebas dari bias, dan mematuhi peraturan privasi data yang semakin ketat. Di tengah tantangan ini, data beranotasi yang dibuat oleh simulasi atau program terkomputerisasi telah muncul sebagai alternatif dari data asli. Data buatan AI ini, yang dikenal sebagai data sintetis, sangat penting untuk menyelesaikan masalah privasi dan menghilangkan prasangka karena dapat memastikan keragaman data yang mencerminkan dunia nyata.

    Praktisi layanan kesehatan menggunakan data sintetis, misalnya, dalam sektor gambar medis untuk melatih sistem AI sambil menjaga kerahasiaan pasien. Perusahaan perawatan virtual, Curai, misalnya, menggunakan 400,000 kasus medis sintetis untuk melatih algoritma diagnosis. Selain itu, pengecer seperti Caper menggunakan simulasi 3D untuk membuat kumpulan data sintetis yang terdiri dari seribu foto hanya dari lima jepretan produk. Menurut studi Gartner yang dirilis pada bulan Juni 2021 yang berfokus pada data sintetis, sebagian besar data yang digunakan dalam pengembangan AI akan dibuat secara artifisial berdasarkan undang-undang, standar statistik, simulasi, atau cara lain pada tahun 2030.

    Dampak yang mengganggu

    Data sintetis membantu menjaga privasi dan mencegah pelanggaran data. Misalnya, rumah sakit atau perusahaan mungkin menawarkan pengembang data medis sintetis berkualitas tinggi untuk melatih sistem diagnosis kanker berbasis AIā€”data yang serumit data dunia nyata yang dimaksudkan untuk ditafsirkan oleh sistem ini. Dengan cara ini, pengembang memiliki kumpulan data berkualitas untuk digunakan saat merancang dan menyusun sistem, dan jaringan rumah sakit tidak berisiko membahayakan data medis pasien yang sensitif. 

    Data sintetis selanjutnya dapat memungkinkan pembeli data pengujian untuk mengakses informasi dengan harga lebih rendah daripada layanan tradisional. Menurut Paul Walborsky, yang ikut mendirikan AI Reverie, salah satu bisnis data sintetis khusus pertama, satu gambar seharga $6 dari layanan pelabelan dapat dibuat secara artifisial dengan biaya enam sen. Sebaliknya, data sintetis akan membuka jalan bagi data tambahan, yang memerlukan penambahan data baru ke kumpulan data dunia nyata yang ada. Pengembang dapat memutar atau mencerahkan gambar lama untuk membuat yang baru. 

    Terakhir, mengingat masalah privasi dan pembatasan pemerintah, informasi pribadi yang ada dalam database menjadi semakin diatur dan kompleks, sehingga mempersulit informasi dunia nyata untuk digunakan untuk membuat program dan platform baru. Data sintetis dapat memberi pengembang solusi solusi untuk mengganti data yang sangat sensitif.

    Implikasi dari data sintetis 

    Implikasi yang lebih luas dari data sintetis dapat mencakup:

    • Percepatan pengembangan sistem AI baru, baik dalam skala dan keragaman, yang meningkatkan proses di berbagai industri dan bidang disiplin ilmu, sehingga mengarah pada peningkatan efisiensi di sektor-sektor seperti perawatan kesehatan, transportasi, dan keuangan.
    • Memungkinkan organisasi untuk berbagi informasi secara lebih terbuka dan tim untuk berkolaborasi dan beroperasi secara lebih efisien, sehingga menghasilkan lingkungan kerja yang lebih kohesif dan kemampuan untuk menangani proyek-proyek kompleks dengan mudah.
    • Pengembang dan profesional data dapat mengirim email atau membawa kumpulan data sintetis berukuran besar di laptop mereka, dengan aman karena mengetahui bahwa data penting tidak terancam, sehingga menghasilkan kondisi kerja yang lebih fleksibel dan aman.
    • Berkurangnya frekuensi pelanggaran keamanan siber basis data, karena data autentik tidak perlu lagi diakses atau dibagikan sesering mungkin, sehingga menghasilkan lingkungan digital yang lebih aman bagi bisnis dan individu.
    • Pemerintah mendapatkan lebih banyak kebebasan untuk menerapkan undang-undang pengelolaan data yang lebih ketat tanpa khawatir akan menghambat pengembangan industri sistem AI, sehingga menghasilkan lanskap penggunaan data yang lebih teregulasi dan transparan.
    • Potensi penggunaan data sintetis secara tidak etis dalam pembuatan deepfake atau media manipulatif lainnya, sehingga menyebabkan misinformasi dan terkikisnya kepercayaan terhadap konten digital.
    • Pergeseran dinamika pasar tenaga kerja, dengan meningkatnya ketergantungan pada data sintetis, berpotensi mengurangi kebutuhan akan peran pengumpulan data, sehingga menyebabkan perpindahan pekerjaan di sektor-sektor tertentu.
    • Potensi dampak lingkungan dari peningkatan sumber daya komputasi yang diperlukan untuk menghasilkan dan mengelola data sintetis, menyebabkan konsumsi energi yang lebih tinggi dan masalah lingkungan terkait.

    Pertanyaan untuk dipertimbangkan

    • Apa industri lain yang bisa mendapatkan keuntungan dari data sintetis?
    • Peraturan apa yang harus diterapkan pemerintah tentang bagaimana data sintetis dibuat, digunakan, dan disebarkan? 

    Referensi wawasan

    Tautan populer dan institusional berikut dirujuk untuk wawasan ini: