Défis liés au stockage du génome : où iront des millions de données génomiques ?

CRÉDIT D'IMAGE:
Crédit image
iStock

Défis liés au stockage du génome : où iront des millions de données génomiques ?

Défis liés au stockage du génome : où iront des millions de données génomiques ?

Texte du sous-titre
La quantité stupéfiante de capacité de stockage requise pour le stockage et l'analyse du génome soulève des questions et des préoccupations.
    • Auteur :
    • Nom de l'auteur
      Prévision quantique
    • 24 avril 2023

    L'industrie de la génomique a connu un succès important, qui s'est traduit par la production de grandes quantités de données de séquençage d'ADN. Ces données peuvent être difficiles à analyser et à utiliser pleinement pour les scientifiques en raison du manque d'outils suffisants. Le cloud computing pourrait résoudre ce problème en permettant aux scientifiques d'accéder à des données et de les traiter à distance via Internet.

    Contexte des défis du stockage du génome

    L'utilisation de la génomique dans le développement de médicaments et les soins de santé personnalisés a considérablement augmenté en raison de la diminution du coût du séquençage de l'ADN. Le premier génome séquencé a pris 13 ans et a coûté environ 2.6 milliards de dollars, mais en 2021, il est possible de séquencer le génome d'une personne en moins d'une journée pour moins de 960 dollars. On prévoit que plus de 100 millions de génomes auront été séquencés d'ici 2025 dans le cadre de divers projets de génomique. Les sociétés pharmaceutiques et les initiatives nationales de génomique des populations collectent de grandes quantités de données qui devraient continuer à croître. Avec une analyse et une interprétation appropriées, ces données ont le potentiel de faire progresser de manière significative le domaine de la médecine de précision.

    Une séquence du génome humain génère environ 200 gigaoctets de données brutes. Si l'industrie des sciences de la vie réussit à séquencer 100 millions de génomes d'ici 2025, le monde aura collecté plus de 20 milliards de gigaoctets de données brutes. Il est possible de gérer partiellement une telle quantité de données grâce aux technologies de compression de données. Des entreprises telles que Petagene, basée au Royaume-Uni, se spécialisent dans la réduction de la taille et des coûts de stockage des données génomiques. Les solutions cloud peuvent résoudre les problèmes de stockage et améliorer les capacités de communication et de reproduction. 

    Cependant, les grandes sociétés pharmaceutiques évitent de prendre des risques avec la sécurité des données et préfèrent une infrastructure interne pour le stockage et l'analyse. L'intégration de techniques telles que la fédération de données réduit ce risque en permettant aux ordinateurs de différents réseaux de travailler ensemble pour analyser les données en toute sécurité. Des entreprises comme Nebula Genomics introduisent en outre le séquençage du génome entier à placer sur une plate-forme basée sur la blockchain permettant aux utilisateurs de contrôler avec qui leurs données sont partagées et à l'organisation d'accéder à des données anonymisées pour comprendre les tendances en matière de santé.

    Impact perturbateur 

    Les défis liés au stockage des données génomiques encourageront probablement de nombreuses autres entreprises à passer à des solutions de cloud computing pour éviter de payer à l'avance des coûts élevés sur l'infrastructure informatique. Alors que de plus en plus de fournisseurs de stockage se font concurrence pour que leurs solutions se démarquent dans l'industrie, les coûts associés à ces services vont probablement diminuer et de nouvelles technologies spécifiques au génome verront le jour dans les années 2030. Bien que les grandes entreprises soient initialement hésitantes, elles verront probablement les avantages des techniques de cloud computing plus récentes et sécurisées et commenceront à les utiliser. 

    D'autres solutions potentielles peuvent inclure des lacs de données, un référentiel central qui permet de stocker toutes les informations structurées et non structurées à n'importe quelle échelle. L'entreposage de données, qui implique la centralisation d'informations provenant de plusieurs sources dans un seul système intégré, peut également être une méthode viable pour stocker et gérer de grandes quantités de données génomiques. Les systèmes de gestion de données spécialisés offrent des fonctionnalités avancées, telles que la sécurité, la gouvernance et l'intégration. Dans certains cas, il peut être nécessaire de stocker les données génomiques localement sur des serveurs internes. Cette option peut convenir à des projets à petite échelle ou à des organisations ayant des exigences spécifiques en matière de sécurité des données.

    On peut s'attendre à ce que les solutions basées sur la blockchain soient également largement utilisées. L'un des principaux avantages de l'utilisation de cette technologie est qu'elle permet aux individus de conserver la propriété de leurs données génomiques. Cette fonctionnalité est importante car ces informations sont très sensibles et les individus doivent avoir le contrôle sur la manière dont elles sont utilisées et partagées.

    Implications des défis de stockage du génome

    Les implications plus larges des défis de stockage du génome peuvent inclure :

    • De nouvelles opportunités pour les cybercriminels si les systèmes de stockage du génome ne sont pas suffisamment sécurisés.
    • Pression sur les gouvernements pour introduire des politiques plus strictes concernant l'utilisation et la protection des données génomiques, en particulier l'obtention du consentement.
    • Succès accéléré dans le développement de médicaments et de thérapies une fois les défis techniques liés à l'analyse de bases de données génomiques massives résolus.
    • Un nombre croissant de fournisseurs de services cloud qui créent des produits et services spécialisés pour les données génomiques et la recherche scientifique.
    • Les scientifiques et les chercheurs apprennent à utiliser des systèmes de stockage et de gestion de données basés sur la blockchain.

    Questions à considérer

    • Comment pensez-vous que les données génomiques sur les individus peuvent être utilisées à mauvais escient ?
    • Comment pensez-vous que le stockage et la gestion des données génomiques vont changer, et quel impact cela aura-t-il sur les soins de santé et la recherche ?

    Références Insight

    Les liens populaires et institutionnels suivants ont été référencés pour cet aperçu :