Datos sintéticos: creación de sistemas de IA precisos utilizando modelos fabricados

CRÉDITO DA IMAXE:
Crédito da imaxe
iStock

Datos sintéticos: creación de sistemas de IA precisos utilizando modelos fabricados

CONSTRUIDO PARA O FUTURISTA DE MAÑÁ

A plataforma de tendencias de Quantumrun darache información, ferramentas e comunidade para explorar e aproveitar as tendencias futuras.

OFERTA ESPECIAL

$5 POR MES

Datos sintéticos: creación de sistemas de IA precisos utilizando modelos fabricados

Texto do subtítulo
Para crear modelos de intelixencia artificial (IA) precisos, os datos simulados creados por un algoritmo están a ver unha maior utilidade.
    • autor:
    • nome do autor
      Previsión de Quantumrun
    • Pode 4, 2022

    Resumo de insight

    Os datos sintéticos, unha poderosa ferramenta que ten aplicacións que van desde a saúde ata a venda polo miúdo, están a remodelar a forma en que se desenvolven e implementan os sistemas de IA. Ao permitir a creación de conxuntos de datos diversos e complexos sen poñer en perigo a información confidencial, os datos sintéticos están a mellorar a eficiencia en todas as industrias, preservando a privacidade e reducindo os custos. Non obstante, tamén presenta desafíos, como o posible uso indebido na creación de medios enganosos, as preocupacións ambientais relacionadas co consumo de enerxía e os cambios na dinámica do mercado laboral que deben ser xestionados con coidado.

    Contexto de datos sintéticos

    Durante décadas, os datos sintéticos existiron en diferentes formas. Pódese atopar en xogos de ordenador como simuladores de voo e en simulacións de física que representan desde átomos ata galaxias. Agora, os datos sintéticos aplícanse en industrias como a saúde para resolver os desafíos da IA ​​do mundo real.

    O avance da IA ​​segue a atoparse con varios obstáculos de implementación. Os grandes conxuntos de datos, por exemplo, son necesarios para ofrecer achados fiables, estar libres de prexuízos e cumprir con normativas de privacidade de datos cada vez máis estritas. No medio destes desafíos, os datos anotados creados mediante simulacións ou programas informáticos xurdiron como unha alternativa aos datos xenuínos. Estes datos creados pola IA, coñecidos como datos sintéticos, son fundamentais para resolver os problemas de privacidade e erradicar os prexuízos, xa que poden garantir unha diversidade de datos que reflicta o mundo real.

    Os profesionais sanitarios usan datos sintéticos, como exemplo, dentro do sector de imaxes médicas para adestrar sistemas de IA mantendo a confidencialidade do paciente. A empresa de coidados virtuais, Curai, por exemplo, utilizou 400,000 casos médicos sintéticos para adestrar un algoritmo de diagnóstico. Ademais, venda polo miúdo como Caper usa simulacións 3D para crear un conxunto de datos sintéticos de mil fotografías a partir de tan só cinco tomas de produtos. Segundo un estudo de Gartner publicado en xuño de 2021 centrado en datos sintéticos, a maioría dos datos utilizados no desenvolvemento da IA ​​fabricaranse artificialmente por lexislación, estándares estatísticos, simulacións ou outros medios para 2030.

    Impacto perturbador

    Os datos sintéticos axudan á preservación da privacidade e á prevención de violacións de datos. Por exemplo, un hospital ou corporación pode ofrecer a un programador datos médicos sintéticos de alta calidade para adestrar un sistema de diagnóstico do cancro baseado na IA, datos que son tan complexos como os datos do mundo real que este sistema pretende interpretar. Deste xeito, os desenvolvedores dispoñen de conxuntos de datos de calidade para usar ao deseñar e compilar o sistema, e a rede hospitalaria non corre o risco de poñer en perigo os datos médicos sensibles dos pacientes. 

    Os datos sintéticos poden permitir ademais que os compradores de datos de proba accedan á información a un prezo máis baixo que os servizos tradicionais. Segundo Paul Walborsky, que cofundou AI Reverie, unha das primeiras empresas dedicadas a datos sintéticos, unha única imaxe que custa 6 dólares dun servizo de etiquetado pódese xerar artificialmente por seis céntimos. Pola contra, os datos sintéticos abrirán o camiño para os datos aumentados, o que implica engadir novos datos a un conxunto de datos do mundo real existente. Os desenvolvedores poderían xirar ou iluminar unha imaxe antiga para crear unha nova. 

    Por último, dadas as preocupacións de privacidade e as restricións gobernamentais, a información persoal existente nunha base de datos está a ser cada vez máis lexislada e complexa, polo que é máis difícil que a información do mundo real se utilice para crear novos programas e plataformas. Os datos sintéticos poderían proporcionar aos desenvolvedores unha solución alternativa para substituír os datos moi sensibles.

    Implicacións dos datos sintéticos 

    As implicacións máis amplas dos datos sintéticos poden incluír:

    • O desenvolvemento acelerado de novos sistemas de IA, tanto en escala como en diversidade, que melloran os procesos en numerosas industrias e campos de disciplina, o que leva a unha maior eficiencia en sectores como a saúde, o transporte e as finanzas.
    • Permitir que as organizacións compartan información de forma máis aberta e que os equipos colaboren e funcionen de forma máis eficiente, o que leva a un ambiente de traballo máis cohesionado e a capacidade de afrontar proxectos complexos con facilidade.
    • Os desenvolvedores e profesionais de datos poden enviar correos electrónicos ou transportar grandes conxuntos de datos sintéticos nos seus portátiles, seguros de saber que os datos críticos non se están a poñer en perigo, o que leva a condicións de traballo máis flexibles e seguras.
    • A reducida frecuencia das violacións da ciberseguridade das bases de datos, xa que xa non será necesario acceder nin compartir con tanta frecuencia aos datos auténticos, o que levará a un entorno dixital máis seguro tanto para empresas como para particulares.
    • Os gobernos gañan máis liberdade para implementar unha lexislación de xestión de datos máis estrita sen preocuparse de impedir o desenvolvemento industrial de sistemas de IA, o que leva a un panorama de uso de datos máis regulado e transparente.
    • O potencial de que os datos sintéticos se utilicen de forma non ética na creación de deepfakes ou outros medios manipulativos, o que leva á desinformación e á erosión da confianza no contido dixital.
    • Un cambio na dinámica do mercado de traballo, cunha maior dependencia dos datos sintéticos que pode reducir a necesidade de funcións de recollida de datos, o que leva ao desprazamento de emprego en certos sectores.
    • O impacto ambiental potencial do aumento dos recursos computacionais necesarios para xerar e xestionar datos sintéticos, o que leva a un maior consumo de enerxía e as preocupacións ambientais asociadas.

    Preguntas a ter en conta

    • Que outras industrias poderían beneficiarse dos datos sintéticos?
    • Que normativas debería implementar o goberno sobre como se crean, usan e despregan os datos sintéticos? 

    Referencias de insight

    As seguintes ligazóns populares e institucionais foron referenciadas para esta visión: