Синтетические данные о здоровье: баланс между информацией и конфиденциальностью

ИЗОБРАЖЕНИЕ КРЕДИТ:
Кредит изображения
Istock

Синтетические данные о здоровье: баланс между информацией и конфиденциальностью

Синтетические данные о здоровье: баланс между информацией и конфиденциальностью

Текст подзаголовка
Исследователи используют синтетические данные о здоровье для расширения масштабов медицинских исследований, устраняя при этом риск нарушения конфиденциальности данных.
    • Автор:
    • Имя автора
      Квантумран Форсайт
    • 16 июня 2023

    Основные моменты

    Синтетические данные о здоровье решают проблемы с доступом к качественной информации, защищая при этом конфиденциальность пациентов. Это может произвести революцию в здравоохранении, стимулируя исследования, облегчая разработку технологий и помогая моделировать систему здравоохранения, снижая при этом риски неправильного использования данных. Однако потенциальные проблемы, такие как уязвимости в системе безопасности, предвзятость ИИ и недостаточное представительство групп, требуют решения с помощью новых правил.

    Контекст синтетических данных о здоровье

    Доступ к высококачественным данным о здоровье и здравоохранении может быть затруднен из-за стоимости, правил конфиденциальности и различных правовых ограничений и ограничений интеллектуальной собственности. Чтобы соблюдать конфиденциальность пациентов, исследователи и разработчики часто полагаются на анонимные данные для проверки гипотез, проверки модели данных, разработки алгоритмов и инновационного прототипирования. Однако угроза повторной идентификации анонимных данных, особенно при редких состояниях, значительна и практически неустранима. Кроме того, из-за различных проблем с функциональной совместимостью интеграция данных из разных источников для разработки моделей анализа, алгоритмов и программных приложений часто усложняется. Синтетические данные могут ускорить процесс инициирования, уточнения или тестирования новаторских методов исследования. 

    Законы о конфиденциальности как в Соединенных Штатах, так и в Европе защищают данные о здоровье людей от доступа третьих лиц. Следовательно, такие детали, как психическое здоровье пациента, прописанные лекарства и уровень холестерина, остаются конфиденциальными. Однако алгоритмы могут создать набор искусственных пациентов, точно отражающих различные слои населения, тем самым способствуя новой волне исследований и разработок. 

    В начале пандемии COVID-19 израильский медицинский центр «Шиба» использовал местный стартап MDClone, который генерирует синтетические данные из медицинских карт. Эта инициатива помогла получить данные о пациентах с COVID-19, что позволило исследователям в Израиле изучить развитие вируса, что привело к созданию алгоритма, который помог медицинским работникам более эффективно расставлять приоритеты для пациентов в отделении интенсивной терапии. 

    Разрушительное воздействие

    Синтетические данные о здоровье могут значительно ускорить и улучшить медицинские исследования. Создавая реалистичные крупномасштабные наборы данных без ущерба для конфиденциальности пациентов, исследователи могут более эффективно изучать различные состояния здоровья, тенденции и результаты. Эта функция может привести к более быстрой разработке методов лечения и вмешательств, более точным прогностическим моделям и лучшему пониманию сложных заболеваний. Кроме того, использование синтетических данных может помочь в устранении различий в состоянии здоровья, позволяя проводить исследования малоизученных групп населения, для которых сбор достаточных реальных данных может быть затруднен или проблематичен с этической точки зрения.

    Кроме того, синтетические данные о состоянии здоровья могут изменить процесс разработки и проверки медицинских технологий. Новаторы в области цифрового здравоохранения, искусственного интеллекта (ИИ) и машинного обучения (МО) получат значительную выгоду от доступа к богатым и разнообразным наборам данных для обучения и тестирования алгоритмов. С помощью синтетических данных о здоровье они могут повысить точность, справедливость и полезность своих инструментов без юридических, этических и практических препятствий, связанных с обработкой реальных данных о пациентах. Эта функция может ускорить разработку диагностических инструментов искусственного интеллекта и персонализированных цифровых медицинских вмешательств и даже способствовать появлению новых парадигм здравоохранения, основанных на данных.

    Наконец, синтетические данные о здоровье могут иметь важные последствия для политики и управления здравоохранением. Высококачественные синтетические данные могут способствовать более надежному моделированию систем здравоохранения, информируя о планировании и оценке медицинских услуг. Это также может позволить исследовать гипотетические сценарии, такие как вероятное влияние различных вмешательств в области общественного здравоохранения, без необходимости проведения дорогостоящих, трудоемких и потенциально рискованных испытаний в реальных условиях. 

    Последствия синтетических данных о здоровье

    Более широкие последствия синтетических данных о здоровье могут включать: 

    • Меньший риск утечки или неправомерного использования конфиденциальной информации о пациенте. Однако при неправильном управлении это может привести к новым уязвимостям в системе безопасности.
    • Лучшее моделирование состояния здоровья и результатов лечения среди различных групп населения, что ведет к улучшению доступа к медицинскому обслуживанию для недостаточно представленных групп. Однако, если в этой синтетической информации присутствует предвзятость ИИ, это также может ухудшить медицинскую дискриминацию.
    • Снижение стоимости медицинских исследований за счет устранения необходимости в дорогостоящих и трудоемких процессах набора пациентов и сбора данных. 
    • Правительства создают новые законы и правила для защиты конфиденциальности пациентов, регулирования использования данных и обеспечения равного доступа к преимуществам этой технологии. 
    • Более сложные приложения AI/ML, предоставляющие большой объем данных без проблем с конфиденциальностью и автоматизирующие обработку и управление электронными медицинскими картами.
    • Обмен синтетическими данными о здоровье во всем мире улучшает международное сотрудничество в преодолении кризисов в области здравоохранения, таких как пандемии, без нарушения конфиденциальности пациентов. Это развитие может привести к созданию более надежных глобальных систем здравоохранения и механизмов быстрого реагирования.
    • Сокращение физических ресурсов, необходимых для традиционного сбора, хранения и обмена данными, может привести к снижению выбросов углерода.

    Вопросы для рассмотрения

    • Если вы работаете в сфере здравоохранения, как ваша организация использует синтетические данные в исследованиях?
    • Каковы потенциальные ограничения синтетических данных о здоровье?