“Dados de vida real são fundamentais para o avanço da medicina personalizada”, afirma Edson Amaro, do Einstein

“Dados de vida real são fundamentais para o avanço da medicina personalizada”, afirma Edson Amaro, do Einstein

Avanços tecnológicos têm ampliado o potencial de uso de dados e evidências de vida real na gestão em saúde

Conteúdo oferecido por

By Published On: 27/03/2024
Edson Amaro, do Einstein, fala sobre dados de vida real em entrevista exclusiva ao Futuro da Saúde

Foto: Adobe Stock Image

Coletados fora do contexto de pesquisas por meio de prontuários eletrônicos, operadoras de planos de saúde, levantamento de dados populacionais, entre outros, os dados de vida real estão conquistando cada vez mais espaço nas discussões sobre cuidados com a saúde. Para explorar todo o potencial que essas evidências têm para o setor, no entanto, é preciso repensar processos, investir em tecnologia e principalmente considerar a interação com times de especialistas em big data para construir uma estrutura que garanta qualidade, anonimização e segurança dos dados coletados. É o que aponta Edson Amaro Júnior, médico neurorradiologista e responsável pela área de big data do Hospital Israelita Albert Einstein, que estuda como obter, tratar e analisar dados a partir de fontes diversas e de maneira responsável.

O conceito de “dados de mundo real” é visto como um recurso valioso na compreensão de experiências reais de pacientes, padrões de doenças e resultados de tratamentos, além de ser um acelerador de pesquisas e desenvolvimento de intervenções baseadas em evidências. E é uma ferramenta que deve ser utilizada com cada vez mais frequência daqui para frente.  De acordo com dados da Food and Drugs Administration (FDA), em 2020, 90% das novas drogas aprovadas pela agência apresentavam dados de vida real no processo de submissão . Desde 2018, o órgão norte-americano tem lançado guias sobre boas práticas e cases do uso desses dados na aprovação de medicamentos.

Em entrevista exclusiva ao Futuro da Saúde, Amaro compartilhou sua visão sobre o atual momento da utilização de dados de vida real na saúde, os desafios operacionais e a importância de se ter um sistema bem integrado e desenhado de forma otimizada para evitar o desperdício de recursos – financeiros, estruturais e de pessoal. Ele também trouxe experiências práticas de como isso tem sido aplicado no Einstein. Leia os principais trechos da entrevista:

Quais são as características que diferenciam os dados de mundo real dos dados convencionais de saúde? Quais potenciais essas particularidades oferecem?

Edson Amaro Júnior – Os dados de mundo real são conjuntos de informações obtidas durante o cuidado do paciente, ou seja, não são dados colhidos para fins de pesquisa. O dado de pesquisa é padronizado com base em critérios de seleção de voluntários da pesquisa e, muitas vezes, exclui pacientes com mais de uma condição, por exemplo, para garantir que a análise seja específica desta condição, sem contaminação de dados por outra doença. O dado de mundo real permite fazer perguntas que jamais poderão ser feitas com a pesquisa convencional, por vários fatores. O entendimento de interação entre medicações é um deles. Mesmo sabendo que existem etapas de segurança na validação de uma nova droga, é impossível testar a interação com todas as outras dezenas de milhares já existentes. Ou então, situações que não podem ser reproduzidas por questões éticas, como efeitos adversos, desnutrição grave, vivências de fragilidade social, exposição à violência. Então, para muitos estudos, só existe uma opção, que é o uso de dados de mundo real. É uma metodologia capaz de gerar um conhecimento médico muito poderoso. Não substitui e não é a mesma coisa da pesquisa convencional, mas abre um novo mundo de possibilidades.

Quais são os benefícios de se investir em dados de mundo real?

Edson Amaro – Quando se tem os dados organizados em uma única estrutura, é possível visualizar aquele indivíduo num contexto mais amplo. É possível olhar para os exames laboratoriais mais comuns e, às vezes, informações mais sofisticadas, como genoma e metabolismo.  E com informações de outras fontes, é possível compreender se esse indivíduo tem maior ou menor propensão de seguir uma orientação médica como, por exemplo, fazer exercício, fazer uma mudança de hábitos alimentares, ou se ele provavelmente não vai aderir a isso. Se unirmos as duas informações, é possível entender melhor a interação entre biologia e comportamento. E, por fim, esse recurso pode também ajudar a criar medidas para desenvolver um planejamento personalizado de cuidado. Esta possibilidade poderá ter um impacto econômico também, porque se você puder escolher a melhor medicação (ou terapia) e trabalhar o tipo de comportamento mais efetivo para aquela pessoa, isso certamente irá evitar gastos desnecessários.

Como as fontes de dados de vida real têm evoluído ao longo dos anos e como é feita essa coleta?

Edson Amaro – Hoje, nós temos estruturas de dados muito diferentes de antigamente. Passamos do prontuário no papel para o eletrônico. Agora, temos estruturas que guardam dados estruturados (planilhas, prontuários do sistema de saúde etc.), bem como áudio e vídeo de uma cirurgia, imagens de exames, que não são estruturados. É de onde vem a ideia do big data, que é um grande caldeirão (que deve ser organizado) de onde obtemos informações para estudos de evidência de mundo real. E lá não estão apenas informações de exames, condutas clínicas, resultados de terapia, mas também dados como nível educacional, informações socioeconômicas e outros determinantes sociais. Ou seja, tudo o que influencia a saúde daquele paciente. Mas, para que você obtenha informações coerentes desses dados advindos de diferentes fontes, não adianta você colocar todas em um lugar e achar que a inteligência artificial (IA) vai resolver. É preciso organizar os dados e isso requer um conhecimento específico. O que fazemos é organizar todos os dados no que chamamos de data lake [ou lago de dados, sinônimo para um ambiente em que a navegação através dos dados é organizada e fluída]. Nessa etapa, um dado não é mais apenas um dado isolado, mas está catalogado, integrado a um sistema programado para permitir conexões e, assim, entender melhor o que aquele dado significa.

“Quando os dados apenas são colocados em um mesmo lugar, sem nenhuma organização, temos o que chamamos de “pântano de dados”, porque você não consegue navegar naquilo e, dessa forma, não extrai o potencial contido nesses dados.”

Quais são os desafios mais comuns para implementar um data lake e garantir a integração dos dados, para que eles possam de fato gerar evidências úteis?

Edson Amaro – Hoje, o desafio é organizar essa estrutura de maneira que a análise seja custo-eficiente, porque se você criar muitas camadas de dados no seu data lake, fica muito caro usar aquele dado. Você vai precisar de vários processos computacionais, vai gastar muitas horas só para juntar uma informação desejada, e não podemos esquecer que recurso computacional, no final do dia, é energia elétrica. Se não for organizado de maneira responsável, estas estruturas podem ter impacto ambiental significativo e comprometer os princípios de sustentabilidade ASG (Ambiental, Social e Governança). Por isso, é preciso construir algo que seja eficiente. Estamos em uma fase de precisar de profissionais nos hospitais que tenham conhecimento de big data, para que seja mais adequado o uso de produtos e sistemas de dados, além de tornar mais fácil a implementação de soluções de Inteligência Artificial.

No Brasil, ainda não temos uma legislação que trate sobre inteligência artificial, base de muitas das ferramentas usadas na coleta, armazenamento e integração dos dados de vida real. Diante dessa ausência, quais aspectos éticos devem ser levados em consideração?

Edson Amaro – Temos que respeitar os marcos legais. Mesmo ainda não existindo uma legislação brasileira que regule todos os detalhes técnicos dos processos que envolvem big data e dados de vida real, é importante ter em mente noções de como preservar a identidade do indivíduo e garantir a segurança desses dados. Outro desafio é a harmonização de dados. Como é que eu garanto que as informações sejam as mesmas? Vamos supor que eu tenho uma informação sobre hábitos físicos de uma pessoa, mas isso foi registrado de uma maneira em um hospital e de outra maneira em outro, durante outra consulta. É preciso fazer o que chamamos de modelo comum de dados, um conceito um pouco diferente de interoperabilidade, mas é muito alinhado com esta ideia. E, por fim, temos o desafio de garantir a usabilidade dessas informações, o que inclui ter o conhecimento de potenciais vieses dos dados. Se uma clínica é especializada em saúde da mulher, é natural que aquele banco de dados só vai ter informações sobre mulheres, não vai ser uma representação da população geral. Ou com convênios focados em uma classe profissional específica, você vai ter um recorte que não representa o todo.

Como é feito o tratamento para anonimizar os dados de vida real?

Edson Amaro – Segundo a LGPD, o dado anonimizado não pode ser identificado ou voltar a ser associado a pessoa biológica. Então, os esforços devem ser nessa direção. As instituições precisam refletir sobre o seguinte: quais características dos dados eu preciso considerar sensíveis? Claro, além das informações óbvias, como números de documentos, nome, fotos. O governo americano definiu 18 categorias de itens sensíveis, que são premissas da HIPAA (Health Insurance Portability and Accountability Act), conjunto de normas responsável pela privacidade dos dados de saúde nos Estados Unidos, e isso nos ajuda a ter uma base. Definido isso, temos várias técnicas de mascaramento, transformação e ocultação de dados sensíveis. No caso de exames de imagem, por exemplo, como tomografias que envolvem a região do pescoço, orelha, nariz, é possível remover as características da face do indivíduo, mantendo apenas os órgãos, para evitar a reconstrução tridimensional. Outras estratégias incluem transformar escalas de unidades, sintetizar dados ao gerar um dado com parâmetros semelhantes, mas com outros números. Felizmente, hoje há vários níveis de sofisticação para essa tarefa.

O Einstein é uma das instituições engajadas no uso de dados de mundo real. Em quais áreas é possível observar esse uso? Como tem sido a experiência de integrá-los no âmbito assistencial?

Edson Amaro – De maneira geral, a utilização de dados integrada à nossa operação é bem antiga. E no âmbito de pesquisa científica, o Einstein tem desenvolvido diversos projetos feitos com base em dados que são colhidos não para fins de pesquisa. De maneira geral e, muitas vezes, indiretamente, toda a operação do hospital depende da análise de dados. A gestão precisa saber quantas pessoas foram internadas na UTI no último mês para saber se há necessidade de alocar um espaço novo, ou se há determinados tipos de leitos sem serem utilizados há algum tempo, se é o caso de uma redução. São análises de predição desenvolvidas com base em dados de mundo real e que ajudam a planejar a ocupação eficiente de espaços hospitalares. E o que tem acontecido agora é que o uso de dados de vida real também começa a ser utilizado no cuidado do paciente, o que foi potencializado pelo avanço tecnológico recente. Desde a formação médica, somos ensinados a planejar o cuidado do paciente, então é observar como foi o último atendimento dele, como ele respondeu a um determinado medicamento. A diferença é que hoje fazemos isso de maneira digital. Temos um exemplo no Einstein que é uma solução de predição de necessidade de leitos. Ao ser admitido no pronto-socorro, antes do pedido de internação ser solicitado pelo médico, com base nos dados de mundo real, um algoritmo consegue predizer se esse indivíduo vai precisar ou não de um leito de internação. Isto é importante para que a equipe de hospitalidade possa se planejar.

“A decisão é do médico, e claro que pode ser contrária ao algoritmo, mas temos acertado com uma boa porcentagem de precisão.”

Quais critérios são adotados para garantir a qualidade e usabilidade de um dado?

Edson Amaro – Existem alguns critérios quando falamos em checagem de qualidade dos dados coletados. A representatividade, ou seja, entender se esse dado representa a população para a qual se está desenvolvendo determinada solução, é um destes critérios. Às vezes, você acha que seu dado representa a população de São Paulo, mas quem tem acesso àquele serviço é apenas uma fração da população, então não é um dado que vai trazer uma conclusão representativa. Testar a consistência e verificar qual porcentagem de preenchimento daquele prontuário que gerou o dado é outro critério, e é possível fazer isso mesmo com o dado anonimizado. Por exemplo, imagine que você tenha dados na sua base de uma mulher com 62 anos, três filhos, sendo que o mais novo com um ano de idade. Isso é extremamente raro, então este já é um conjunto de dados que vai precisar ser avaliado por uma pessoa. Talvez pode ter ocorrido um erro de digitação e faltou colocar o número “3” na hora que este dado foi inputado – e a idade deste filho mais novo era, na verdade, 31 anos. Temos esses mecanismos automatizados para identificar eventuais inconsistências. Vamos supor que uma paciente está fazendo o pré-natal, é esperado que ela faça exames de ultrassom e receba um determinado conjunto de vacinas. Se estes campos não estiverem preenchidos, é difícil dizer se a mulher fez um pré-natal adequado – ou se simplesmente alguém esqueceu de digitar. Olhar longitudinalmente os dados permite indagar se aquela consulta realmente não aconteceu – e isto ajuda o profissional ao checar a informação. Temos diversos níveis de avaliar e melhorar a qualidade de dados, por meio de várias metodologias. E como nestes exemplos que citei, é possível fazer isso de maneira automatizada e, se for detectado um conjunto de dados que tem avaliação baixa, um profissional pode ser destacado para checar manualmente aquele conjunto.

A medicina tem caminhado para um futuro de precisão. Como a expansão do uso de dados de vida real pode contribuir para esse movimento?

Edson Amaro – Os dados de vida real são basicamente uma condição para o avanço da medicina personalizada, porque é uma medicina que parte do princípio de que é preciso olhar para um indivíduo com ferramentas que permitam que você o diferencie da massa e busque o melhor tratamento. Contudo, raramente você vai achar estudos que reflitam exatamente aquele paciente, justamente porque estudos clínicos são realizados com critérios que, às vezes, não levam em consideração ou excluem fatores como demais medicações utilizadas por aquele paciente, o baixo peso dele, tudo isso. Nesse cenário, o uso de dados de vida real pode ser um aliado, porque com uma ferramenta de suporte baseada em IA, você consegue buscar as melhores opções para aquele paciente. Pela velocidade com que a medicina tem avançado e novos tratamentos têm surgido, por melhor que seja a prática clínica, é impossível o médico saber de cabeça tudo o que está disponível. O planejamento do cuidado é de responsabilidade do especialista, mas há ferramentas que oferecem suporte para essas decisões. O paciente do consultório é muito mais complexo do que o paciente de pesquisa.

“A IA tem o potencial de ajudar o profissional de saúde a entender melhor essa complexidade e, junto com os dados integrados, possibilitar uma avaliação mais precisa daquele caso.”

Um dos grandes desafios éticos do uso de ferramentas como a inteligência artificial é a existência de vieses. O que tem sido adotado como prática para combater esse fator?

Edson Amaro – Há um conceito chamado “safety and privacy by design“, que significa que desde o planejamento da estrutura básica de um algoritmo, ainda na etapa de construção, você já considera que possam existir vieses e, dessa forma, podemos trabalhar para evitar seu impacto. Então, o primeiro ponto é reconhecer que esse problema sempre vai existir. O segundo é caracterizar, então existem práticas de identificar, documentar um algoritmo (Model Cars, Model Registry), que funcionam como se fossem um ‘Raio-x’ de uma solução de IA. Eles mostram quais dados foram usados no treinamento, como foram usados, como foi feita a checagem, quais os riscos identificados, quais são as implicações éticas, entre outras características. O próprio Einstein tem uma governança analítica que conta com processos de supervisão para garantir que exista adoção responsável de IA – e monitorar seu uso. E tem coisas mais interessantes, como ter no próprio código na estrutura de programação uma automatização com check-in para saber se a representação de etnias está balanceada, por exemplo. Hoje o processo de geração de soluções de IA envolve etapas de desconstrução de vieses e proteção dos dados, para que não exista viés ou que seja o mínimo possível, e usamos a própria IA para identificar isso. Graças ao processo de Open Source e Open Data, muitas indústrias dividem os problemas que eles encontraram no passado durante o desenvolvimento, teste e uso de IA para que não sejam repetidos. Soluções de IA são muito dinâmicas, então se eu vou usar essa tecnologia para determinado conjunto de dados, eu tenho que saber que, ao longo do tempo, a mesma IA pode dar resultados diferentes. Por isso, é preciso monitorar esse desempenho e entender como é feito o uso daquele algoritmo. Se ele foi desenvolvido para funcionar numa clínica de atenção secundária e você o põe para operar numa clínica de atenção terciária, é como pegar um carro convencional para o dia a dia e colocá-lo em um rali, não vai funcionar.

Isabelle Manzini

Graduada em jornalismo pela Faculdade Paulus de Tecnologia e Comunicação. Atuou como jornalista na Band, RedeTV!, Portal Drauzio Varella e faz parte do time do Futuro da Saúde desde julho de 2023.

About the Author: Isabelle Manzini

Graduada em jornalismo pela Faculdade Paulus de Tecnologia e Comunicação. Atuou como jornalista na Band, RedeTV!, Portal Drauzio Varella e faz parte do time do Futuro da Saúde desde julho de 2023.

Leave A Comment

Recebar nossa Newsletter

NATALIA CUMINALE

Sou apaixonada por saúde e por todo o universo que cerca esse tema -- as histórias de pacientes, as descobertas científicas, os desafios para que o acesso à saúde seja possível e sustentável. Ao longo da minha carreira, me especializei em transformar a informação científica em algo acessível para todos. Busco tendências todos os dias -- em cursos internacionais, conversas com especialistas e na vida cotidiana. No Futuro da Saúde, trazemos essas análises e informações aqui no site, na newsletter, com uma curadoria semanal, no podcast, nas nossas redes sociais e com conteúdos no YouTube.

Artigos Relacionados

Isabelle Manzini

Graduada em jornalismo pela Faculdade Paulus de Tecnologia e Comunicação. Atuou como jornalista na Band, RedeTV!, Portal Drauzio Varella e faz parte do time do Futuro da Saúde desde julho de 2023.