Синтетичні дані: створення точних систем штучного інтелекту за допомогою готових моделей

КРЕДИТ ЗОБРАЖЕННЯ:
Кредит зображення
iStock

Синтетичні дані: створення точних систем штучного інтелекту за допомогою готових моделей

Синтетичні дані: створення точних систем штучного інтелекту за допомогою готових моделей

Текст підзаголовка
Для створення точних моделей штучного інтелекту (AI) змодельовані дані, створені за допомогою алгоритму, стають все більш корисними.
    • Автор:
    • ім'я автора
      Quantumrun Foresight
    • Травень 4, 2022

    Короткий огляд

    Синтетичні дані, потужний інструмент, який має широке застосування від охорони здоров’я до роздрібної торгівлі, змінюють спосіб розробки та впровадження систем ШІ. Уможливлюючи створення різноманітних і складних наборів даних без шкоди для конфіденційної інформації, синтетичні дані підвищують ефективність у різних галузях, зберігаючи конфіденційність і знижуючи витрати. Однак це також створює проблеми, такі як потенційне зловживання під час створення оманливих засобів масової інформації, екологічні проблеми, пов’язані зі споживанням енергії, і зміни в динаміці ринку праці, якими потрібно ретельно керувати.

    Контекст синтетичних даних

    Протягом десятиліть синтетичні дані існували в різних формах. Його можна знайти в комп’ютерних іграх, таких як симулятори польотів, і в симуляторах фізики, які зображують усе, від атомів до галактик. Зараз синтетичні дані застосовуються в таких галузях, як охорона здоров’я, для вирішення реальних проблем ШІ.

    Розвиток штучного інтелекту продовжує стикатися з кількома перешкодами впровадження. Великі набори даних, наприклад, необхідні для отримання достовірних висновків, неупередженості та дотримання дедалі суворіших правил конфіденційності даних. Серед цих проблем анотовані дані, створені за допомогою комп’ютерного моделювання або програм, з’явилися як альтернатива справжнім даним. Ці дані, створені штучним інтелектом, відомі як синтетичні дані, мають вирішальне значення для вирішення проблем конфіденційності та викорінення упереджень, оскільки вони можуть забезпечити різноманітність даних, яка відображає реальний світ.

    Практикуючі медичні працівники використовують, наприклад, синтетичні дані в секторі медичних зображень для навчання систем ШІ, зберігаючи при цьому конфіденційність пацієнтів. Фірма віртуального догляду Curai, наприклад, використала 400,000 3 синтетичних медичних випадків для навчання алгоритму діагностики. Крім того, роздрібні продавці, такі як Caper, використовують тривимірне моделювання для створення синтетичного набору даних із тисячі фотографій лише з п’яти знімків продукту. Відповідно до дослідження Gartner, оприлюдненого в червні 2021 року, зосередженого на синтетичних даних, до 2030 року більшість даних, які використовуються для розробки штучного інтелекту, будуть штучно створені за допомогою законодавства, статистичних стандартів, симуляції або іншими засобами.

    Руйнівний вплив

    Синтетичні дані допомагають зберегти конфіденційність і запобігти витоку даних. Наприклад, лікарня чи корпорація може запропонувати розробнику високоякісні синтетичні медичні дані для навчання системи діагностики раку на основі штучного інтелекту — дані, які є такими ж складними, як і дані реального світу, які ця система має інтерпретувати. Таким чином, розробники мають якісні набори даних для використання під час проектування та компіляції системи, а мережа лікарень не ризикує поставити під загрозу конфіденційні медичні дані пацієнтів. 

    Синтетичні дані також можуть дозволити покупцям тестових даних отримати доступ до інформації за нижчою ціною, ніж традиційні послуги. За словами Пола Уолборскі, який є співзасновником AI Reverie, одного з перших спеціалізованих компаній із синтетичних даних, одне зображення, яке коштує 6 доларів у службі маркування, може бути штучно згенероване за шість центів. Навпаки, синтетичні дані прокладуть шлях для розширених даних, що передбачає додавання нових даних до існуючого реального набору даних. Розробники могли обертати або освітлювати старе зображення, щоб створити нове. 

    Нарешті, враховуючи проблеми конфіденційності та державні обмеження, особиста інформація, яка міститься в базі даних, стає все більш законодавчою та складною, що ускладнює використання реальної інформації для створення нових програм і платформ. Синтетичні дані можуть надати розробникам обхідне рішення для заміни дуже конфіденційних даних.

    Наслідки синтетичних даних 

    Більш широкі наслідки синтетичних даних можуть включати:

    • Прискорений розвиток нових систем штучного інтелекту, як за масштабом, так і за різноманітністю, які покращують процеси в багатьох галузях і галузях дисципліни, що призводить до підвищення ефективності в таких секторах, як охорона здоров’я, транспорт і фінанси.
    • Дозволяє організаціям відкритіше ділитися інформацією, а командам – співпрацювати та працювати ефективніше, створюючи більш згуртоване робоче середовище та здатність легко вирішувати складні проекти.
    • Розробники та спеціалісти з обробки даних можуть надсилати електронною поштою або переносити великі синтетичні набори даних на своїх ноутбуках, упевнені, що критичні дані не знаходяться під загрозою, що забезпечує більш гнучкі та безпечні умови роботи.
    • Зменшення частоти порушень кібербезпеки бази даних, оскільки більше не потрібно буде так часто отримувати доступ до автентичних даних або ділитися ними, що створить більш безпечне цифрове середовище як для компаній, так і для окремих осіб.
    • Уряди отримують більше свободи впроваджувати суворіші закони про управління даними, не турбуючись про те, що вони перешкоджатимуть розвитку галузевих систем ШІ, що веде до більш регульованого та прозорого використання даних.
    • Можливість неетичного використання синтетичних даних для створення глибоких фейків або інших маніпулятивних засобів масової інформації, що призводить до дезінформації та підриву довіри до цифрового контенту.
    • Зміни в динаміці ринку праці з посиленням використання синтетичних даних потенційно зменшують потребу в зборі даних, що призводить до переміщення робочих місць у певних секторах.
    • Потенційний вплив на навколишнє середовище збільшення обсягу обчислювальних ресурсів, необхідних для генерування синтетичних даних і керування ними, що призводить до збільшення споживання енергії та пов’язаних з цим екологічних проблем.

    Питання для розгляду

    • Які інші галузі можуть отримати користь від синтетичних даних?
    • Які правила має запровадити уряд щодо того, як створюються, використовуються та розгортаються синтетичні дані? 

    Посилання на Insight

    Для цієї інформації використовувалися такі популярні та інституційні посилання: