Dane syntetyczne: tworzenie dokładnych systemów sztucznej inteligencji z wykorzystaniem wyprodukowanych modeli

KREDYT WZROKU:
Image credit
iStock

Dane syntetyczne: tworzenie dokładnych systemów sztucznej inteligencji z wykorzystaniem wyprodukowanych modeli

Dane syntetyczne: tworzenie dokładnych systemów sztucznej inteligencji z wykorzystaniem wyprodukowanych modeli

Tekst podtytułu
Aby tworzyć dokładne modele sztucznej inteligencji (AI), symulowane dane tworzone przez algorytm mają coraz większą użyteczność.
    • Autor:
    • nazwisko autora
      Foresight Quantumrun
    • 4 maja 2022 r.

    Podsumowanie spostrzeżeń

    Dane syntetyczne, potężne narzędzie mające zastosowanie w różnych obszarach, od opieki zdrowotnej po handel detaliczny, zmieniają sposób opracowywania i wdrażania systemów sztucznej inteligencji. Umożliwiając tworzenie różnorodnych i złożonych zbiorów danych bez narażania wrażliwych informacji, dane syntetyczne zwiększają wydajność w różnych branżach, chronią prywatność i redukują koszty. Jednak wiąże się to również z wyzwaniami, takimi jak potencjalne nadużycia w tworzeniu oszukańczych mediów, obawy środowiskowe związane ze zużyciem energii oraz zmiany w dynamice rynku pracy, którymi należy ostrożnie zarządzać.

    Kontekst danych syntetycznych

    Od dziesięcioleci dane syntetyczne istnieją w różnych formach. Można go znaleźć w grach komputerowych, takich jak symulatory lotu oraz w symulacjach fizyki, które przedstawiają wszystko, od atomów po galaktyki. Obecnie dane syntetyczne są wykorzystywane w branżach, takich jak opieka zdrowotna, w celu rozwiązywania rzeczywistych wyzwań związanych ze sztuczną inteligencją.

    Rozwój sztucznej inteligencji nadal napotyka na kilka przeszkód we wdrażaniu. Na przykład duże zbiory danych są wymagane, aby dostarczać wiarygodne wyniki, być wolne od stronniczości i przestrzegać coraz bardziej rygorystycznych przepisów dotyczących prywatności danych. Wśród tych wyzwań, dane z adnotacjami stworzone przez komputerowe symulacje lub programy pojawiły się jako alternatywa dla prawdziwych danych. Dane stworzone przez sztuczną inteligencję, znane jako dane syntetyczne, mają kluczowe znaczenie dla rozwiązywania problemów związanych z prywatnością i eliminowania uprzedzeń, ponieważ mogą zapewnić różnorodność danych odzwierciedlającą rzeczywisty świat.

    Na przykład pracownicy służby zdrowia wykorzystują dane syntetyczne w sektorze obrazów medycznych do szkolenia systemów sztucznej inteligencji przy jednoczesnym zachowaniu poufności pacjentów. Na przykład firma zajmująca się wirtualną opieką Curai wykorzystała 400,000 3 syntetycznych przypadków medycznych do wyszkolenia algorytmu diagnozy. Co więcej, sprzedawcy detaliczni tacy jak Caper wykorzystują symulacje 2021D do tworzenia syntetycznego zbioru danych składającego się z tysiąca zdjęć z zaledwie pięciu zdjęć produktów. Według badania firmy Gartner opublikowanego w czerwcu 2030 r., skupiającego się na danych syntetycznych, do XNUMX r. większość danych wykorzystywanych do rozwoju sztucznej inteligencji będzie sztucznie wytwarzana w drodze przepisów, standardów statystycznych, symulacji lub w inny sposób.

    Zakłócający wpływ

    Dane syntetyczne pomagają w zachowaniu prywatności i zapobieganiu naruszeniom danych. Na przykład szpital lub korporacja może zaoferować programiście wysokiej jakości syntetyczne dane medyczne do szkolenia opartego na sztucznej inteligencji systemu diagnostyki raka — danych, które są tak złożone, jak dane ze świata rzeczywistego, które ten system ma interpretować. W ten sposób programiści mają wysokiej jakości zestawy danych do wykorzystania podczas projektowania i kompilowania systemu, a sieć szpitalna nie jest narażona na zagrożenie dla wrażliwych danych medycznych pacjentów. 

    Dane syntetyczne mogą ponadto umożliwić nabywcom danych testowych dostęp do informacji po niższej cenie niż w przypadku tradycyjnych usług. Według Paula Walborsky'ego, współzałożyciela AI Reverie, jednej z pierwszych firm zajmujących się danymi syntetycznymi, pojedynczy obraz, który kosztuje 6 dolarów z usługi etykietowania, można sztucznie wygenerować za sześć centów. I odwrotnie, dane syntetyczne utorują drogę dla danych rozszerzonych, co pociąga za sobą dodanie nowych danych do istniejącego zestawu danych w świecie rzeczywistym. Deweloperzy mogli obracać lub rozjaśniać stary obraz, aby stworzyć nowy. 

    Wreszcie, biorąc pod uwagę obawy dotyczące prywatności i ograniczenia rządowe, dane osobowe istniejące w bazie danych stają się coraz bardziej uregulowane i złożone, co utrudnia wykorzystanie informacji ze świata rzeczywistego do tworzenia nowych programów i platform. Dane syntetyczne mogą zapewnić programistom rozwiązanie obejściowe, które zastąpi bardzo wrażliwe dane.

    Implikacje danych syntetycznych 

    Szersze implikacje danych syntetycznych mogą obejmować:

    • Przyspieszony rozwój nowych systemów sztucznej inteligencji, zarówno pod względem skali, jak i różnorodności, które usprawniają procesy w wielu branżach i dziedzinach dyscyplin, prowadząc do zwiększenia wydajności w sektorach takich jak opieka zdrowotna, transport i finanse.
    • Umożliwianie organizacjom bardziej otwartego dzielenia się informacjami, a zespołom współpracę i efektywniejsze działanie, co prowadzi do bardziej spójnego środowiska pracy i możliwości łatwego rozwiązywania złożonych projektów.
    • Programiści i specjaliści ds. danych mogą wysyłać e-maile lub przenosić duże zestawy danych syntetycznych na swoich laptopach, mając pewność, że krytyczne dane nie są zagrożone, co prowadzi do bardziej elastycznych i bezpiecznych warunków pracy.
    • Zmniejszona częstotliwość naruszeń cyberbezpieczeństwa baz danych, ponieważ nie będzie już konieczności uzyskiwania dostępu do autentycznych danych ani ich udostępniania tak często, co doprowadzi do bezpieczniejszego środowiska cyfrowego zarówno dla przedsiębiorstw, jak i osób prywatnych.
    • Rządy zyskują większą swobodę we wdrażaniu bardziej rygorystycznych przepisów dotyczących zarządzania danymi, nie martwiąc się o utrudnianie rozwoju branży systemów sztucznej inteligencji, co prowadzi do bardziej regulowanego i przejrzystego krajobrazu wykorzystania danych.
    • Możliwość nieetycznego wykorzystania danych syntetycznych do tworzenia fałszywych treści lub innych mediów manipulacyjnych, co prowadzi do dezinformacji i erozji zaufania do treści cyfrowych.
    • Zmiana dynamiki rynku pracy wraz ze zwiększonym poleganiem na danych syntetycznych, co może potencjalnie zmniejszyć potrzebę pełnienia ról w zakresie gromadzenia danych, prowadząc do przenoszenia stanowisk pracy w niektórych sektorach.
    • Potencjalny wpływ na środowisko zwiększonych zasobów obliczeniowych wymaganych do generowania danych syntetycznych i zarządzania nimi, prowadzący do większego zużycia energii i powiązanych problemów środowiskowych.

    Pytania do rozważenia

    • Jakie inne branże mogłyby skorzystać na danych syntetycznych?
    • Jakie przepisy powinien wprowadzić rząd w zakresie tworzenia, wykorzystywania i wdrażania danych syntetycznych? 

    Referencje informacyjne

    W celu uzyskania tego wglądu odniesiono się do następujących popularnych i instytucjonalnych powiązań: