Syntetická data: Vytváření přesných systémů umělé inteligence pomocí vyrobených modelů

KREDIT OBRAZU:
Kredit
iStock

Syntetická data: Vytváření přesných systémů umělé inteligence pomocí vyrobených modelů

Syntetická data: Vytváření přesných systémů umělé inteligence pomocí vyrobených modelů

Text podnadpisu
Pro vytvoření přesných modelů umělé inteligence (AI) jsou simulovaná data vytvořená pomocí algoritmu stále užitečnější.
    • Autor:
    • jméno autora
      Quantumrun Foresight
    • 4

    Shrnutí statistik

    Syntetická data, výkonný nástroj, který má aplikace od zdravotnictví po maloobchod, mění způsob, jakým jsou systémy umělé inteligence vyvíjeny a implementovány. Umožněním vytváření různorodých a komplexních datových sad bez ohrožení citlivých informací zvyšují syntetická data efektivitu napříč odvětvími, chrání soukromí a snižují náklady. Představuje však také výzvy, jako je potenciální zneužití při vytváření klamavých médií, obavy o životní prostředí související se spotřebou energie a posuny v dynamice trhu práce, které je třeba pečlivě řídit.

    Syntetický datový kontext

    Po desetiletí existovala syntetická data v různých formách. Lze jej nalézt v počítačových hrách, jako jsou letecké simulátory, a ve fyzikálních simulacích, které zobrazují vše od atomů po galaxie. Nyní se syntetická data používají v odvětvích, jako je zdravotnictví, k řešení skutečných výzev AI.

    Pokrok umělé inteligence nadále naráží na několik implementačních překážek. Například velké soubory dat musí poskytovat důvěryhodná zjištění, být nezaujaté a dodržovat stále přísnější předpisy o ochraně osobních údajů. Uprostřed těchto výzev se jako alternativa ke skutečným datům objevila anotovaná data vytvořená pomocí počítačových simulací nebo programů. Tato data vytvořená umělou inteligencí, známá jako syntetická data, jsou zásadní pro vyřešení obav o soukromí a vymýcení předsudků, protože mohou zajistit rozmanitost dat, která odráží skutečný svět.

    Zdravotníci používají syntetická data jako příklad v sektoru lékařských snímků k výcviku systémů AI při zachování důvěrnosti pacientů. Virtuální pečovatelská firma Curai například použila 400,000 3 syntetických lékařských případů k trénování diagnostického algoritmu. Kromě toho maloobchodníci, jako je Caper, používají 2021D simulace k vytvoření syntetického datového souboru tisíce fotografií z pouhých pěti snímků produktů. Podle studie společnosti Gartner vydané v červnu 2030 zaměřené na syntetická data bude většina dat využívaných při vývoji umělé inteligence do roku XNUMX uměle vyrobena legislativou, statistickými standardy, simulacemi nebo jinými prostředky.

    Rušivý dopad

    Syntetická data pomáhají při ochraně soukromí a prevenci narušení dat. Nemocnice nebo korporace mohou například nabídnout vývojářům vysoce kvalitní syntetická lékařská data pro trénování systému diagnostiky rakoviny založeného na umělé inteligenci – data, která jsou stejně složitá jako reálná data, která má tento systém interpretovat. Vývojáři tak mají k dispozici kvalitní datové sady, které mohou použít při navrhování a sestavování systému, a nemocniční síť neriskuje ohrožení citlivých lékařských dat pacientů. 

    Syntetická data mohou dále umožnit kupujícím testovacích dat přístup k informacím za nižší cenu než tradiční služby. Podle Paula Walborskyho, který spoluzaložil AI Reverie, jednu z prvních specializovaných společností zabývajících se syntetickými daty, lze uměle vygenerovat jeden obrázek, který stojí 6 dolarů ze služby označování, za šest centů. Naopak syntetická data připraví cestu pro rozšířená data, což znamená přidání nových dat do existujícího souboru reálných dat. Vývojáři mohli otočit nebo rozjasnit starý obrázek a vytvořit nový. 

    A konečně, vzhledem k obavám o soukromí a vládním omezením se osobní údaje existující v databázi stávají stále více legislativou a jsou složitější, což ztěžuje použití skutečných informací k vytváření nových programů a platforem. Syntetická data by mohla vývojářům poskytnout řešení, jak nahradit vysoce citlivá data.

    Důsledky syntetických dat 

    Širší důsledky syntetických dat mohou zahrnovat:

    • Urychlený vývoj nových systémů umělé inteligence, a to jak v rozsahu, tak v rozmanitosti, které zlepšují procesy v mnoha průmyslových odvětvích a oborech, což vede ke zvýšení efektivity v odvětvích, jako je zdravotnictví, doprava a finance.
    • Umožňuje organizacím otevřeněji sdílet informace a týmům efektivněji spolupracovat a fungovat, což vede k soudržnějšímu pracovnímu prostředí a schopnosti snadno řešit složité projekty.
    • Vývojáři a datoví profesionálové mohou posílat e-maily nebo přenášet velké soubory syntetických dat na svých přenosných počítačích a bezpečně vědět, že kritická data nejsou ohrožena, což vede k flexibilnějším a bezpečnějším pracovním podmínkám.
    • Snížená frekvence narušení kybernetické bezpečnosti databází, protože k autentickým datům již nebude nutné přistupovat nebo je sdílet tak často, což povede k bezpečnějšímu digitálnímu prostředí pro podniky i jednotlivce.
    • Vlády získávají více svobody při implementaci přísnější legislativy pro správu dat, aniž by se museli obávat, že bude bránit průmyslovému rozvoji systémů umělé inteligence, což vede k regulovanějšímu a transparentnějšímu prostředí pro využívání dat.
    • Možnost neetického použití syntetických dat při vytváření deepfakes nebo jiných manipulativních médií, což vede k dezinformacím a narušení důvěry v digitální obsah.
    • Posun v dynamice trhu práce se zvýšeným spoléháním se na syntetická data potenciálně snižuje potřebu rolí v oblasti sběru dat, což vede k přesunu pracovních míst v určitých odvětvích.
    • Potenciální dopad na životní prostředí zvýšených výpočetních zdrojů potřebných k vytváření a správě syntetických dat, což vede k vyšší spotřebě energie a souvisejícím obavám o životní prostředí.

    Otázky k zamyšlení

    • Jaká další průmyslová odvětví by mohla těžit ze syntetických dat?
    • Jaká nařízení by měla vláda zavést ohledně toho, jak jsou syntetická data vytvářena, používána a nasazována? 

    Statistikové reference

    Následující populární a institucionální odkazy byly uvedeny pro tento náhled: