Synthetische Daten: Erstellen präziser KI-Systeme mithilfe von hergestellten Modellen

IMAGE CREDIT:
Bildnachweis
iStock

Synthetische Daten: Erstellen präziser KI-Systeme mithilfe von hergestellten Modellen

Synthetische Daten: Erstellen präziser KI-Systeme mithilfe von hergestellten Modellen

Untertiteltext
Um genaue Modelle der künstlichen Intelligenz (KI) zu erstellen, werden simulierte Daten, die von einem Algorithmus erstellt werden, immer nützlicher.
    • Autor:
    • Autorenname
      Quantumrun-Vorausschau
    • 4. Mai 2022

    Zusammenfassung der Einblicke

    Synthetische Daten, ein leistungsstarkes Tool, dessen Einsatzmöglichkeiten vom Gesundheitswesen bis zum Einzelhandel reichen, verändern die Art und Weise, wie KI-Systeme entwickelt und implementiert werden. Indem sie die Erstellung vielfältiger und komplexer Datensätze ermöglichen, ohne sensible Informationen zu gefährden, steigern synthetische Daten branchenübergreifend die Effizienz, wahren den Datenschutz und senken die Kosten. Es bringt jedoch auch Herausforderungen mit sich, wie z. B. möglichen Missbrauch bei der Erstellung irreführender Medien, Umweltbedenken im Zusammenhang mit dem Energieverbrauch und Veränderungen in der Arbeitsmarktdynamik, die sorgfältig gemanagt werden müssen.

    Synthetischer Datenkontext

    Seit Jahrzehnten existieren synthetische Daten in unterschiedlichen Formen. Es kann in Computerspielen wie Flugsimulatoren und in Physiksimulationen gefunden werden, die alles von Atomen bis zu Galaxien darstellen. Jetzt werden synthetische Daten in Branchen wie dem Gesundheitswesen angewendet, um reale KI-Herausforderungen zu lösen.

    Die Weiterentwicklung der KI stößt weiterhin auf mehrere Umsetzungshindernisse. Große Datensätze müssen beispielsweise vertrauenswürdige Ergebnisse liefern, frei von Voreingenommenheit sein und immer strengere Datenschutzbestimmungen einhalten. Inmitten dieser Herausforderungen haben sich kommentierte Daten, die durch computergestützte Simulationen oder Programme erstellt wurden, als Alternative zu echten Daten herauskristallisiert. Diese von der KI erstellten Daten, bekannt als synthetische Daten, sind entscheidend für die Lösung von Datenschutzbedenken und die Beseitigung von Vorurteilen, da sie eine Datenvielfalt gewährleisten können, die die tatsächliche Welt widerspiegelt.

    Medizinische Fachkräfte nutzen synthetische Daten beispielsweise im Bereich medizinischer Bilder, um KI-Systeme zu trainieren und gleichzeitig die Vertraulichkeit der Patienten zu wahren. Das virtuelle Pflegeunternehmen Curai beispielsweise nutzte 400,000 synthetische medizinische Fälle, um einen Diagnosealgorithmus zu trainieren. Darüber hinaus nutzen Einzelhändler wie Caper 3D-Simulationen, um aus nur fünf Produktaufnahmen einen synthetischen Datensatz aus tausend Fotos zu erstellen. Laut einer im Juni 2021 veröffentlichten Gartner-Studie, die sich auf synthetische Daten konzentriert, werden die meisten in der KI-Entwicklung verwendeten Daten bis 2030 durch Gesetzgebung, statistische Standards, Simulationen oder andere Mittel künstlich hergestellt werden.

    Störende Wirkung

    Synthetische Daten helfen bei der Wahrung der Privatsphäre und der Verhinderung von Datenschutzverletzungen. Beispielsweise kann ein Krankenhaus oder Unternehmen einem Entwickler hochwertige synthetische medizinische Daten anbieten, um ein KI-basiertes Krebsdiagnosesystem zu trainieren – Daten, die so komplex sind wie die realen Daten, die dieses System interpretieren soll. Auf diese Weise verfügen die Entwickler über hochwertige Datensätze, die sie beim Entwerfen und Zusammenstellen des Systems verwenden können, und das Krankenhausnetzwerk läuft nicht Gefahr, sensible medizinische Patientendaten zu gefährden. 

    Synthetische Daten können Käufern von Testdaten außerdem den Zugang zu Informationen zu einem niedrigeren Preis als bei herkömmlichen Diensten ermöglichen. Laut Paul Walborsky, Mitbegründer von AI Reverie, einem der ersten spezialisierten Unternehmen für synthetische Daten, kann ein einzelnes Bild, das 6 US-Dollar von einem Kennzeichnungsdienst kostet, für sechs Cent künstlich erzeugt werden. Umgekehrt werden synthetische Daten den Weg für erweiterte Daten ebnen, bei denen neue Daten zu einem bestehenden Datensatz aus der realen Welt hinzugefügt werden. Entwickler könnten ein altes Bild drehen oder aufhellen, um ein neues zu erstellen. 

    Schließlich werden personenbezogene Daten, die in einer Datenbank vorhanden sind, angesichts von Datenschutzbedenken und staatlichen Beschränkungen immer gesetzlicher und komplexer, was es schwieriger macht, reale Informationen zur Erstellung neuer Programme und Plattformen zu verwenden. Synthetische Daten könnten Entwicklern eine Workaround-Lösung bieten, um hochsensible Daten zu ersetzen.

    Implikationen synthetischer Daten 

    Zu den weiteren Auswirkungen synthetischer Daten können gehören:

    • Die beschleunigte Entwicklung neuer KI-Systeme, sowohl im Umfang als auch in der Vielfalt, die Prozesse in zahlreichen Branchen und Disziplinen verbessern und zu einer höheren Effizienz in Sektoren wie dem Gesundheitswesen, dem Transportwesen und dem Finanzwesen führen.
    • Dadurch können Organisationen Informationen offener austauschen und Teams effizienter zusammenarbeiten und arbeiten, was zu einer kohärenteren Arbeitsumgebung und der Möglichkeit führt, komplexe Projekte einfacher zu bewältigen.
    • Entwickler und Datenexperten können große synthetische Datensätze per E-Mail versenden oder auf ihren Laptops mit sich führen, in der Gewissheit, dass kritische Daten nicht gefährdet sind, was zu flexibleren und sichereren Arbeitsbedingungen führt.
    • Die geringere Häufigkeit von Verstößen gegen die Cybersicherheit von Datenbanken, da auf authentische Daten nicht mehr so ​​oft zugegriffen oder diese weitergegeben werden müssen, was zu einer sichereren digitalen Umgebung für Unternehmen und Privatpersonen führt.
    • Regierungen erhalten mehr Freiheit bei der Umsetzung strengerer Datenverwaltungsgesetze, ohne sich Sorgen machen zu müssen, dass die Entwicklung von KI-Systemen in der Industrie behindert wird, was zu einer stärker regulierten und transparenteren Datennutzungslandschaft führt.
    • Es besteht die Möglichkeit, dass synthetische Daten unethisch zur Erstellung von Deepfakes oder anderen manipulativen Medien verwendet werden, was zu Fehlinformationen und einem Vertrauensverlust in digitale Inhalte führt.
    • Eine Verschiebung der Arbeitsmarktdynamik, bei der die zunehmende Abhängigkeit von synthetischen Daten möglicherweise den Bedarf an Datenerfassungsfunktionen verringert, was in bestimmten Sektoren zur Verdrängung von Arbeitsplätzen führt.
    • Die potenziellen Umweltauswirkungen erhöhter Rechenressourcen, die für die Generierung und Verwaltung synthetischer Daten erforderlich sind, führen zu einem höheren Energieverbrauch und damit verbundenen Umweltproblemen.

    Fragen zu berücksichtigen

    • Welche anderen Branchen könnten von synthetischen Daten profitieren?
    • Welche Vorschriften sollte die Regierung in Bezug darauf, wie synthetische Daten erstellt, verwendet und bereitgestellt werden, umsetzen? 

    Insight-Referenzen

    Für diesen Einblick wurde auf die folgenden beliebten und institutionellen Links verwiesen: