Avaliando um tratamento médico Understand article
Traduzido por Aida Guerra. Sarah Garner e Rachel Thomas consideram por é que experiências bem desenhadas e analisadas são tão importantes quando se testa a eficácia de um tratamento médico.
Suponha que um novo tratamento médico que reduz a pressão arterial tem vindo a ser desenvolvido. O tratamento tem vindo a ser extensivamente testado em laboratório e em alguns voluntários, e os investigadores acreditam que este irá funcionar na generalidade da população. Agora, é altura de saber se estão certos.
Historicamente, os médicos verificavam se um tratamento funcionava ou não testando-o nos seus doentes. Assim, para a mesma doença, podiam comparar as respostas dos pacientes ao tratamento novo com as respostas a outros tratamentos, bem como é que a resposta variava entre os doentes. No entanto, se os doentes de facto recuperassem da doença não havia modo de afirmar se tal se devia ao tratamento ou a qualquer outro factor.
Outros factores poderiam levar à recuperação dos doentes: por exemplo, poder-se-iam simplesmente sentir melhor por serem tratados por um determinado médico (fenómeno conhecido como efeito placebo); poderiam ter recuperado de qualquer forma, sem recorrer a qualquer tratamento; ou, talvez, a recuperação deveu-se a mudanças na situação pessoal ou no estilo de vida. Não se tendo em conta este, e outros factores, poder-se-ia facilmente tirar conclusões incorrectas sobre a acção do tratamento. Os médicos teriam então incluído o tratamento na sua prática diária, acreditando erradamente na sua eficácia.
O desenvolvimento de ensaios aleatórios controlados
No século XIX, cientistas propuseram um método de controlar exactamente o que se passava e registar quaisquer mudanças nas condições do paciente. Nestas experiências controladas havia dois grupos de pacientes – o grupo de estudo, que recebia o novo tratamento, e o grupo controlo, que recebia o placebo (um medicamento inerte) ou um tratamento estabelecido. Os pacientes eram, então observados e os resultados de ambos os grupos (como se cada paciente sobreviveu ou morreu) eram registados e comparados.
Posteriormente, em 1917, o processo “cego” do método científico melhorou ainda mais. Onde nem o doente nem o investigador sabiam que tratamento o paciente estava a receber, assim os resultados não poderiam ser influenciados quer voluntariamente quer involuntariamente. Isto ficou conhecido como ensaio duplo cego (num ensaio uni cego, o doente ou o investigador sabe que tratamento está a ser administrado).
No entanto, os ensaios ainda podiam ser deliberadamente adulterados para provar que o tratamento funcionava através da inclusão de mais pacientes doentes no grupo de estudo do que no grupo de controlo. A solução para tal, primeira usada pelo UK’s Medical Research Council nos anos 40 no seu estudo das vacinas para a tosse coqueluche, foi escolher aleatoriamente os doentes que iriam receber o novo tratamento e os que iriam receber o tratamento de controlo.
Ensaios controlados com alocação aleatória aos dois grupos de estudo ficaram conhecidos como ensaios aleatórios controlados ou RCTs. Com a aleatoriedade, acaba-se não só com a distribuição aleatória de pacientes doentes e saudáveis pelos dois grupos mas também se alcança uma distribuição aleatória dos factos conhecidos (mas que podem influenciar a saúde do doente e, por conseguinte, o resultado do tratamento). Assim – porque, em teoria, a única diferença entre os dois grupos é se recebem ou não o tratamento que está a ser testado – pode-se assumir que qualquer diferença nos resultados é, possivelmente, devido ao tratamento e a nada mais.
Actualmente, os RCTs são universalmente usados na investigação clinica para avaliar novos tratamentos.
Evidência muda a prática médica
Antes de 1994, os médicos recomendavam aos pacientes com dores nas costas para descansarem na cama. No entanto, após rever todas as evidências disponíveis, o Clinical Standards Advisory Group apercebeu-se que o descanso na cama não era tão benéfico e que talvez fosse mesmo prejudicial. Isto levou a uma radical mudança no tratamento, sendo aconselhado aos doentes permanecerem activosw1.
Desenvolvendo e analisando RTCs
Mais pessoas, mais poder
Está-se a pensar testar um tratamento à pressão sanguínea atrás de um RCT, é necessário desenhá-lo com cuidado. Uma questão importante: Quantos pacientes serão incluídos no estudo? Tal depende de quão grande é o efeito que o novo tratamento tem: quanto maior o efeito, menor o número de pacientes necessários para distinguir as flutuações aleatórias que o estudo possa ter.
É evidente que é o efeito do tratamento que se pretende estudar num RCT. No entanto, antes de iniciar-se um RCT tem-se já algumas indicações de como o novo tratamento funciona, através, por exemplo, de testes de laboratório de pequena escala. Isto permite estimar a dimensão do efeito do tratamento.
Num doente saudável, a pressão arterial deve estar entre os 90 e os 120 mmHg. Mas pacientes com pressão sanguínea alta possuem constantemente pressões superiores a 140 mmHg, correndo o risco de terem ataques cardíacos e tromboses. Pode-se estimar que o novo tratamento irá diminuir o valor máximo da pressão sanguínea em 5 mmHg: depois do tratamento, espera-se que a pressão arterial média do grupo de estudo esteja pelo menos 5 mmHg mais baixa que a pressão arterial média do grupo de controlo.
Existem fórmulas estatísticas para determinar o tamanho da amostra necessária para o estudo de forma aumentar a probabilidade de detectar o efeito desejadow2. Para o tratamento da pressão arterial, estas fórmulas indicas que são necessários 64 pacientes em cada grupo para detectar uma diferença de 5 mmHgw3.
Quão diferente é o diferente?
O ensaio segue o seu rumo, os participantes têm vindo a ser monitorizados, e tem-se registado as diferenças na pressão sanguínea entre os pacientes dos grupos de estudo e de controlo. Graças à aleatoriedade da amostra, sabe-se que os dois grupos são comparáveis antes do ensaio. Então, ou o tratamento tem um efeito ou algum evento surpreendente ocorreu: o tratamento não teve qualquer efeito e as diferenças registadas no RCT devem-se ao mero acaso.
Imagine-se que a média da pressão sanguínea no grupo de estudo é mais baixa 5,2 mmHg do que a média registada no grupo de controlo. Como é que se decide se esta diferença é por acaso ou se se deve ao efeito real do tratamento? Apesar de tudo, vários factores podem fazer variar pressão sanguínea e nem todos podem ser controlados no RCT.
O que os estatísticos fazem é permitir alguma variação, em vez de confiar numa média para cada grupo, eles calculam um intervalo de valores para cada grupo, e confiam que o verdadeiro valor se situa neste intervalo. Este intervalo de valores é chamado de intervalo de confiança. Se os intervalos de confiança estabelecidos para o estudo da pressão sanguínea for de 141.2-148.9 mmHg para o grupo de controlo e de 133.7-139.3 mmHg para o grupo de estudo, pode-se verificar que os intervalos de ambos os grupos não se sobrepõem. Os estatísticos podem, assim, afirmar que a diferença observada entre os dois grupos é estatisticamente significativa – e pode-se assumir que esta se deve ao tratamento.
Mas quão confiante é o confiante? Geralmente, os estatísticos afirmam que um grau de 95% de confiança é bom o suficiente, isto significa que estão preparados para viver com o facto de que 5% das vezes (ou 1 em cada 20) estarem errados de que o efeito se deve ao acaso e não ao tratamento. Para se ter a certeza de que se tem o valor correcto, medem-se mais e mais pacientes, mas a única maneira de ter 100% de certezas é medir a população toda.
Se o resultado obtido não for estaticamente significativo, uma das questões fundamentais a colocar é se o ensaio envolvia pacientes suficientes. Talvez o efeito do tratamento seja menor ao inicialmente estimado – com uma amostra maior, pode-se detectar as diferenças entre os dois grupos.
Aplicando RCTs ao mundo real
Um RCT bem desenhado e devidamente analisado é uma ferramenta poderosa para a investigação médica – fornecendo aos médicos a informação necessária para tomar as decisões correctas no tratamento de pacientes. Não obstante, os RCTs tem limitações.
Primeiro, não é suficiente saber se o tratamento faz uma diferença estatisticamente significativa. É, também, necessário saber se a diferença clinicamente é significativa – por exemplo, a diminuição da pressão sanguínea em 5 mmHg faz uma diferença na saúde e bem-estar do paciente? No fim das contas, no exemplo descrito, o tratamento continua sem reduzir a pressão sanguínea para os valores normais de 90-120 mmHg. Para avaliar se o tratamento é clinicamente relevante, os médicos poderão ter de se direccionar para outros tipos de investigação.
Uma outra limitação dos RCTs é o facto de os pacientes envolvidos no ensaio não representarem a população real a ser tratada. Porque os ensaios pretendem controlar tantos factores quanto possível, normalmente possuem critérios restritos de inclusão e exclusão. Por exemplo, mulheres grávidas não são incluídas devido aos potenciais riscos para o bebé, isto implicou que ninguém percebesse que a talidomida provocava defeitos no desenvolvimento embrionário até ser utilizada na prática médica geral no final dos anos 50w4.
Ainda há a questão de como os RCTs são reportados. Ninguém quer publicar más notícias, em particular pessoas que passaram tempo e esforço a desenvolver um novo tratamento. Por isso, historicamente, os investigadores não publicam ensaios que não mostraram resultados ou se o antigo tratamento era mais eficaz. Alguns investigadores sem escrúpulos também reportaram resultados que seleccionam ou incompletos, o que fazia com que um tratamento parecesse melhor do que na realidade era. A comunidade científica tem caminhado no sentido de parar a manipulação de resultados através da criação de companhias e do registo do investigador no início do ensaio, assim é mais difícil esconder resultados desfavoráveis, embora ainda não exista a obrigatoriedade de reportar todos os resultados obtidos. Os jornais têm, também, estandardizado a informação que requerem para a submissão dos manuscritos dos investigadores, o que faz com que seja mais difícil esconder maus resultados.
Acima de tudo, os RCTs são caros e morosos. Como resultado, muitos ensaios não são conduzidos, ou o tamanho das amostras e a sua duração são limitadas. Tal pode significar que um ensaio não é suficientemente poderoso para detectar se o tratamento é efectivo quando de facto o pode ser. Pequenos ensaios podem, também, não diagnosticar importantes efeitos adversos (e que podem ser raros), e de detectar os efeitos a longo prazo.
Por consequência, os investigadores clínicos revêm, frequentemente, juntos os resultados dos ensaios numa análise meticulosa conhecida como revisão sistemática – tal aumenta, efectivamente, o tamanho da amostra. Organizações como Cochrane Collaborationw5 e o UK’s National Institute for Health and Clinical Excellencew6baseiam as suas recomendações para a comunidade médica em revisões sistemáticas.
Desde os anos 40, o uso de RCTs tem mudado significativamente a prática médica. Os médicos já não são dependentes das suas próprias observações mas podem confiar numa avaliação rigorosa para assegurar que os benefícios do novo tratamento ultrapassam os riscos.
Evidências podem mudar pontos de vistas
Uma revisão sistemática dos resultados para a minociclina, um antibiótico fortemente promovido para o combate à acne, foi recentemente conduzida para investigar a sua eficácia e segurança.
Um efeito secundário da minociclina são os potenciais e fatais problemas de auto-imunidade do fígado. Os problemas são raros e podem ter várias causas. Muitos médicos não têm conhecimento sobre tal e, mesmo que tenham, a ligação pode não ser necessariamente feita pela droga.
Foi só quando toda a informação foi revista junta é que a ligação foi estabelecida. Uma revisão sistemática mostrou que não havia evidências que a minociclina era melhor a tratar a acne que qualquer outro tratamento existente. Dados os riscos, os autores da revisão concluíram que não deveria ser usado preferencialmente em relação a qualquer outro tratamento (Garner et al., 2003).
Agradecimentos
Se gostou de ler este artigo mas gostaria de aprender mais sobre a matemática envolvida, leia a versão estendida e original deste artigow3, presenta na revista Plusw7, uma revista online gratuita que abre a porta para o mundo dos matemáticos com toda a sua beleza e aplicações.
References
- Garner SE (2003) Minocycline for acne vulgaris: efficacy and safety. Cochrane Database of Systematic Reviews 1: CD002086. doi: 10.1002/14651858.CD002086
Web References
- w1 – Para mais informações sobre descanso na cama, veja a secção ‘management’ do artigo ‘Low back pain and sciatica’, no sitio da internet do Patient UK (www.patient.co.uk) ou use o a ligação: http://tinyurl.com/y9gghww
- w2 – Pode ler uma boa explicação de Jerry Dallal sobre como o tratamento de dados e o tamanho da amostra pode afectar o poder estatístico em Little Handbook of Statistical Practice: www.jerrydallal.com/LHSP/sizenotes.htm
- w3 – Para uma leitura do original deste artigo, incluindo mais detalhes da estatistica veja:
- Garner S, Thomas R (2010) Evaluating a medical treatment – how do you know it works? Plus Magazine. http://plus.maths.org/latestnews/jan-apr10/rct
- w4 – Para saber mais sobre o desastre da talidomida e sobre as recentes investigações relacionadas com talidomida e a formação do limbo veja:
- Zimmer C (2010) Answers begin to emerge on how thalidomide caused defects. New York Times 16 Mar: D3. www.nytimes.com
- w5 – A Cochrane Collaboration é uma rede internacional de pessoas que ajudam técnicos de saúde, políticos e pacientes, na pratica de tomar boas decisões no que diz respeito a cuidados de saúde. Veja: www.cochrane.org
- w6 – O The National Institute for Health and Clinical Excellence (NICE) é uma organização independente que fornece orientação a nível nacional, promovendo e prevenindo boa saúde e tratando a má saude. Veja: www.nice.org.uk
- w7 – Para aprender mais sobre Plus, a revista gratuita online, visite: http://plus.maths.org
Resources
- Para uma breve descrição das quarto fases de um ensaio clinico, veja a informação em:
- Wynne K, Bloom S (2007) Oxyntomodulin: a new therapy for obesity? Science in School 6: 25-29. www.scienceinschool.org/2007/issue6/oxyntomodulin
- Ledford H (2010) Companies pledge to make more trial data public. Nature News 15 Jun. doi: 10.1038/news.2010.299.
- Para ouvir o podcast que acompanha a versão original deste artigo ((Plus podcast 22, February 2010: Evaluating a medical treatment), visite: http://plus.maths.org/podcast
- A Sense About Science produziu um guia útil sobre interpretar reivindicações médicas na imprensa (“Eu não tenho nada a perder tentando “). Pode ser descarregado gratuitamente a partir do sítio da internet da Sense About Science (www.senseaboutscience.org.uk) or via the direct link: http://tinyurl.com/63zv4l
- Freiberger M (2010) Medical research plagued by bad reporting. Plus Magazine. http://plus.maths.org/latestnews/jan-apr10/reporting
- Plus Magazine oferece uma gama de artigos, podcasts, e actividades de sala de aula sobre como abordar a matemática por trás da saúde e da medicina: “Sabes o que é bom para ti?” Veja: http://plus.maths.org/wellcome
Review
O artigo apresenta uma visão sobre a medicina moderna e baseada em evidências, que abrange a rota muitas vezes esquecida e raramente compreendida do desenvolvimento de medicamentos para o tratamento médico bem-sucedido. Métodos estatísticos e os seus problemas são discutidos, oferecendo oportunidades interdisciplinares de ensino a alunos com idades superiores a 14 anos.
Está cheio de tópicos interessantes para discussão com alunos mais velhos e professores de outras áreas disciplinares. Por exemplo:
- “Conhecimento não é estático: à medida que efeitos laterais ou novas evidências são acumuladas, o conhecimento prévio pode mudar.
- Muitas vezes, o ensaio clinico que é necessário para que a droga seja comercializada necessita de mais tempo do que o tempo de vida de determinados pacientes, aos quais devia ser permitido tomar parte no ensaio clinico – e quais destes pacientes deviam fazer parte do grupo de controlo e do grupo de estudo
- Por que é que o reporte de determinados tratamentos podem ser adulterados?
- Darão os estatísticos uma falsa sensação de segurança?
Pegando no exemplo da pressão sanguínea e como esta varia, a turma poderá medir a pressão sanguínea e ver como esta varia de aluno para aluno. Poderiam ainda correr para cima e para baixa em escadas durante alguns minutos e ver como tal faz varia a pressão sanguínea de uma pessoa. Perante este nível de variação, de que forma os investigadores determinam o efeito de drogas para baixar a pressão sanguínea?
O artigo pode ainda ser usado para desencadear actividades de maiores dimensões. Por exemplo, poderiam ser dados aos alunos artigos sobre um ensaio clinico ou sobre a “droga maravilhosa”, talvez relacionada com as suas condições familiares, como enxaqueca, intolerância à glucose ou alergias. Em grupos, os estudantes poderiam usar livros, internet e outras fontes de informação para pesquisar:
- A doença a ser tratada.
- Que tratamentos existem disponíveis para a doença?
- Se o novo tratamento foi testado em animais.
- Se ensaios clínicos sobre o novo tratamento rerão já sido publicados.
- De que forma os ensaios clínicos actuais são conduzidos e qual a analise estatística feita.
- Na opinião dos alunos, de que forma poderia ser melhorado o ensaio.
Com base nesta investigação, cada grupo de alunos poderá, então, escrever o seu próprio artigo de jornal sobre a investigação clinica. Os alunos acham que o artigo do jornal correcto? Se não, porquê?
Para a maioria dos professores, o artigo também pode ser uma fonte valiosa de informação sobre a história da investigação médica e de ensaios aleatórios controlados.
Friedlinde Krotscheck, Áustria