Poder dos testes para bioequivalência
Para a realização de um teste de hipóteses, estabelecem-se duas hipóteses: a hipótese nula (H0), em geral igualdade, por exemplo, de duas médias e a hipótese alternativa (Ha), por exemplo, de diferença entre as duas referidas médias. H0 somente existe para ser rejeita e, nunca, aceita. Assim, o teste estatístico buscará nos dados evidência contra H0: se encontrada, H0 é rejeitada e, caso contrário, diz-se que os dados não mostram evidência contra ela. Em bioequivalência (BE) a situação é um pouco mais complicada, já que desejamos mostrar a igualdade ou equivalência entre as médias das formulações T e R. Para isso, utilizam-se as idéias de Schuirmann (1969) e H0 e Ha são invertidas, o que se consegue utilizando dois testes simultaneamente, com duas hipóteses nulas e duas hipóteses alternativas: H0 do teste de Schuirmann diz que as formulações não são BE e, Ha, que são BE. Antes, porém, do estabelecimento das hipóteses, é preciso estabelecer o conceito de BE. Esta, por convenção, é definida quando o intervalo de confiança (IC) da razão entre as médias geométricas das formulações T e R estão dentro de certos limites, em geral, mas nem sempre, iguais a 80 e 125%. Outros critérios e limites podem ser usados.
Outro ponto a considerar é a capacidade que o teste de Schuirmann tem de comprovar a BE entre as formulações quando a BE realmente existe. A essa capacidade, dá-se o nome de poder, o qual, formalmente, é definido como a probabilidade que o teste tem de rejeitar H0. Estamos, portanto, tratando de duas situações distintas: a primeira, o critério que estabelece a BE (por exemplo, IC da razão das médias geométricas de T e R, estarem entre 80 e 125%) e, a segunda, a capacidade de mostrar a BE. Aparentemente isso é bastante claro, porém, tem sido freqüente se confundir essas duas situações: a probabilidade de estabelecer ou demonstrar a BE (o poder do teste) e a probabilidade da existência da BE entre as formulações T e R, lembrando que isso depende de um critério, por exemplo, os limites 80-125% do IC.
Discussão sobre esse tema tem surgido em razão da solicitação da agência reguladora brasileira para apresentação do poder do teste para comprovação da BE. Argumenta-se que, além de o IC calculado estar dentro dos limites pré-estabelecidos de BE, seria necessário que o poder do teste houvesse sido igual a, pelo menos, 80%. Tal poder aparece às vezes na literatura Estatística com o nome de ‘poder observado’ (entre aspas), pois, como se trata de uma probabilidade, somente tem sentido seu cálculo antes da ocorrência do evento ao qual ele está associado. Vejamos um exemplo para ilustrar. No caso de um estudo realizado com 20 voluntários no total, em que o coeficiente de variação (CV) foi igual a 42%, a razão entre as médias geométricas das formulações T e R foi igual a 100% e o IC calculado foi [80,17%; 124.74%]. Fica difícil imaginar que as formulações não são BE. Em primeiro lugar porque a razão foi de 100% e, em segundo lugar, porque o IC está dentro dos limites 80-125%. No entanto, o poder, nesse caso, foi igual a 10,6%, valor baixo, em razão do pequeno número de voluntários usados no estudo relativamente ao valor do CV. O poder é baixo porque o teste, por pouco, não foi capaz de mostrar a BE e, não, porque as duas formulações tinham baixa probabilidade de serem BE.
Passemos para algo um pouco mais formal, do ponto de vista matemático. O nível de significância (que em última análise fornece a amplitude do IC) e o poder são variáveis aleatórias P no intervalo [0, 1] e com distribuição de probabilidade conhecida. Ambos os valores (nível de significância – freqüentemente relatado como valor-p – e poder) podem ser calculados a partir dessa mesma expressão que representa a distribuição de probabilidade da variável P. Isso implica que, dado o nível de significância, o poder está completamente determinado, pois há uma relação inversa e de 1 para 1 entre eles: quando um sobe o outro desce e vice-versa. Quanto mais baixo o valor-p (e, portanto, mais evidência a favor da BE), maior o poder do teste de Schuirmann. Esse assunto é bem discutido em um artigo de Hoenig e Heisey publicado em importante revista da área, The American Statistician, de fevereiro de 2001, cujo sugestivo nome é: ‘O abuso do poder: a disseminada falácia do cálculo do poder em análise de dados’. Vários outros artigos e livros existem na literatura Estatística, discutindo a real e correta utilização do poder (que sempre deve ser usado no planejamento de um estudo), bem como criticando, com seguros subsídios matemáticos, a postura de alguns que insistem em defender a apresentação e importância do poder de um teste estatístico que já foi realizado.
Dr. Antonio Amarante
Responsável pelo Departamento
de Estatística da Scentryphar