Desafios do armazenamento do genoma: para onde irão milhões de dados genômicos?

CRÉDITO DE IMAGEM:
Crédito da imagem
iStock

Desafios do armazenamento do genoma: para onde irão milhões de dados genômicos?

Desafios do armazenamento do genoma: para onde irão milhões de dados genômicos?

Texto do subtítulo
A quantidade impressionante de capacidade de armazenamento necessária para o armazenamento e análise do genoma levanta questões e preocupações.
    • Autor:
    • Nome do autor
      Previsão Quantumrun
    • 24 de abril de 2023

    A indústria genômica experimentou um sucesso significativo, o que resultou na produção de grandes quantidades de dados de sequenciamento de DNA. Esses dados podem ser desafiadores para os cientistas analisarem e fazerem uso total devido à falta de ferramentas suficientes. A computação em nuvem poderia resolver esse problema, permitindo que os cientistas acessem e processem dados remotamente pela Internet.

    Contexto dos desafios de armazenamento do genoma

    O uso da genômica no desenvolvimento de medicamentos e cuidados de saúde personalizados aumentou significativamente devido à diminuição do custo do sequenciamento de DNA. O primeiro genoma sequenciado levou 13 anos e custou cerca de US$ 2.6 bilhões, mas em 2021 é possível sequenciar o genoma de uma pessoa em menos de um dia por menos de US$ 960. Prevê-se que mais de 100 milhões de genomas tenham sido sequenciados até 2025 como parte de vários projetos genômicos. Tanto as empresas farmacêuticas quanto as iniciativas nacionais de genômica populacional estão coletando grandes quantidades de dados que devem continuar crescendo. Com análise e interpretação adequadas, esses dados têm o potencial de avançar significativamente no campo da medicina de precisão.

    Uma sequência do genoma humano gera cerca de 200 gigabytes de dados brutos. Se a indústria de ciências da vida conseguir sequenciar 100 milhões de genomas até 2025, o mundo terá coletado mais de 20 bilhões de gigabytes de dados brutos. É possível gerenciar parcialmente uma quantidade tão grande de dados por meio de tecnologias de compactação de dados. Empresas como a Petagene, com sede no Reino Unido, são especializadas em reduzir o tamanho e os custos de armazenamento de dados genômicos. As soluções em nuvem podem resolver problemas de armazenamento e aprimorar as habilidades de comunicação e reprodução. 

    No entanto, grandes empresas farmacêuticas evitam correr riscos com segurança de dados e preferem infraestrutura interna para armazenamento e análise. Incorporar técnicas como federação de dados diminui esse risco, permitindo que computadores em redes diferentes trabalhem juntos para analisar dados com segurança. Empresas como a Nebula Genomics estão introduzindo o sequenciamento de todo o genoma para ser colocado em uma plataforma baseada em blockchain, permitindo que os usuários controlem com quem seus dados são compartilhados e a organização acesse dados não identificados para entender as tendências na saúde.

    Impacto disruptivo 

    Os desafios de armazenamento de dados genômicos provavelmente incentivarão muito mais empresas a fazer a transição para soluções de computação em nuvem para evitar o pagamento antecipado de altos custos de infraestrutura de TI. À medida que mais fornecedores de armazenamento competem para destacar suas soluções no setor, os custos associados a esses serviços provavelmente diminuirão e novas tecnologias específicas do genoma surgirão na década de 2030. Embora as grandes empresas inicialmente hesitem, elas provavelmente verão os benefícios de técnicas de computação em nuvem mais recentes e seguras e começarão a empregá-las. 

    Outras soluções potenciais podem incluir data lakes, um repositório central que permite armazenar todas as informações estruturadas e não estruturadas em qualquer escala. O armazenamento de dados, que envolve a centralização de informações de várias fontes em um único sistema integrado, também pode ser um método viável para armazenar e gerenciar grandes quantidades de dados genômicos. Os sistemas de gerenciamento de dados especializados oferecem recursos avançados, como segurança, governança e integração. Em alguns casos, pode ser necessário armazenar dados genômicos localmente em servidores internos. Esta opção pode ser adequada para projetos de pequena escala ou organizações com requisitos específicos de segurança de dados.

    Espera-se que as soluções baseadas em blockchain também se tornem amplamente empregadas. Um grande benefício do uso dessa tecnologia é que ela permite que os indivíduos mantenham a propriedade de seus dados genômicos. Esse recurso é importante porque essas informações são altamente confidenciais e os indivíduos devem ter controle sobre como elas são usadas e compartilhadas.

    Implicações dos desafios de armazenamento do genoma

    Implicações mais amplas dos desafios de armazenamento do genoma podem incluir:

    • Novas oportunidades para cibercriminosos se os sistemas de armazenamento de genoma não forem suficientemente seguros.
    • Pressão sobre os governos para introduzir políticas mais fortes em relação ao uso e proteção de dados genômicos, particularmente obtenção de consentimento.
    • Sucesso acelerado no desenvolvimento de medicamentos e terapias, uma vez que os desafios técnicos em torno da análise de bancos de dados genômicos maciços são resolvidos.
    • Um número crescente de provedores de serviços em nuvem que criam produtos e serviços especializados para dados genômicos e pesquisas científicas.
    • Cientistas e pesquisadores sendo ensinados a operar sistemas de gerenciamento e armazenamento de dados baseados em blockchain.

    Questões a considerar

    • Como você acha que os dados genômicos de indivíduos podem ser mal utilizados?
    • Como você acha que o armazenamento e o gerenciamento de dados genômicos mudarão e que impacto isso terá na saúde e na pesquisa?

    Referências de insights

    Os seguintes links populares e institucionais foram referenciados para esta percepção: