Nas estatísticas, os valores p são um conceito importante utilizado para determinar o significado de um resultado. São utilizados para determinar se os resultados observados num estudo são devidos ao acaso ou se são estatisticamente significativos. Neste artigo vamos analisar o que são valores p, como são calculados e a sua importância na análise estatística.
O que é uma hipótese nula?
Todos os testes estatísticos têm uma hipótese nula. Na maioria dos testes, a hipótese nula é que não há relação entre as variáveis de interesse ou que não há diferenças entre os grupos.
Por exemplo, num teste t de duas caudas, a hipótese nula é de que a diferença entre dois grupos é zero.
Exemplo: Hipótese nula e alternativa
Quer saber se existe uma diferença na longevidade entre dois grupos de ratos alimentados com dietas diferentes, dieta A e dieta B. Pode testar estatisticamente a diferença entre estas duas dietas usando um teste t de duas caudas.
Hipótese nula (H0): não há diferença na longevidade entre os dois grupos.
Hipótese alternativa (HA ou H1): há uma diferença na longevidade entre os dois grupos.
Como são calculados os valores de P?
Os valores P são calculados utilizando software estatístico ou uma tabela de valores p. O valor p é a probabilidade de obter um resultado como extremo ou mais extremo do que o resultado observado, assumindo que a hipótese nula é verdadeira. O valor p é normalmente comparado com um nível de significância pré-determinado, conhecido como alfa, que é normalmente fixado em 0,05.
Se o valor p for inferior ao alfa, é considerado estatisticamente significativo e a hipótese nula é rejeitada. Isto significa que o resultado observado é improvável que seja devido ao acaso e é provável que seja devido ao efeito da variável independente. Se o valor p for superior ao alfa, a hipótese nula é aceite e conclui-se que não há diferença significativa entre os grupos comparados.
Importância dos valores de P na análise estatística
Os valores P são uma ferramenta importante na análise estatística. Ajudam os investigadores a determinar o significado dos seus resultados e a tirar conclusões sobre as relações entre as variáveis. Os P-values também podem ajudar a identificar erros num estudo ou falhas na concepção da investigação.
Contudo, é importante notar que os valores P não são uma medida da força de uma relação entre as variáveis. Eles apenas indicam se a relação é estatisticamente significativa ou não. É igualmente importante ter em conta outros factores, tais como o tamanho do efeito e o tamanho da amostra, ao interpretar os valores p.
Relatar os valores p
Os valores P para testes estatísticos são geralmente comunicados na secção de resultados de um trabalho de investigação, juntamente com a informação chave necessária para os leitores contextualizarem os valores P: por exemplo, o coeficiente de correlação numa regressão linear ou a diferença média entre grupos de tratamento num teste t.
Cuidado ao utilizar os valores p
Os valores de p são frequentemente interpretados como o risco de rejeitar a hipótese nula do teste quando a hipótese nula é realmente verdadeira.
Na realidade, o risco de rejeitar a hipótese nula é geralmente maior do que o valor p, especialmente quando se analisa um único estudo ou quando se utilizam amostras de pequenas dimensões. Isto porque quanto menor o quadro de referência, maior é a probabilidade de tropeçar num padrão estatisticamente significativo completamente por acidente.
Os valores de p são também frequentemente interpretados como apoio ou refutação da hipótese alternativa. Não é este o caso. O valor p só pode dizer se a hipótese nula é ou não suportada. Não pode dizer-lhe se ou porquê a sua hipótese alternativa é verdadeira.
A abordagem do P-Value aos testes de hipotese
A abordagem do valor p para o teste de hipóteses utiliza a probabilidade calculada para determinar se existem provas para rejeitar a hipótese nula. A hipótese nula, também conhecida como a conjectura, é a alegação inicial sobre uma população (ou processo de geração de dados). A hipótese alternativa afirma se o parâmetro da população difere do valor do parâmetro da população indicado na conjectura.
Na prática, o nível de significância é declarado antecipadamente para determinar quão pequeno deve ser o valor de p para rejeitar a hipótese nula. Uma vez que investigadores diferentes utilizam níveis de significância diferentes ao examinar uma questão, um leitor pode por vezes ter dificuldade em comparar resultados de dois testes diferentes. Os valores de p proporcionam uma solução para este problema.
Por exemplo, suponha-se que um estudo comparando os resultados de dois bens particulares foi realizado por investigadores diferentes que utilizaram os mesmos dados mas níveis de significância diferentes. Os investigadores podem chegar a conclusões opostas sobre se os bens são diferentes.
Se um investigador utilizasse um nível de confiança de 90% e o outro exigisse um nível de confiança de 95% para rejeitar a hipótese nula, e se o p-valor da diferença observada entre os dois retornos fosse 0,08 (correspondente a um nível de confiança de 92%), então o primeiro investigador descobriria que os dois activos têm uma diferença estatisticamente significativa, enquanto que o segundo não encontraria nenhuma diferença estatisticamente significativa entre os retornos.
Para evitar este problema, os investigadores poderiam reportar o p-valor do teste de hipóteses e permitir que os leitores interpretassem eles próprios o significado estatístico. A isto chama-se uma abordagem do valor p do teste de hipóteses. Os observadores independentes poderiam observar o valor p e decidir por si próprios se isso representa ou não uma diferença estatisticamente significativa.
O resultado final
O valor p é utilizado para medir o significado dos dados de observação. Quando os investigadores identificam uma relação aparente entre duas variáveis, há sempre a possibilidade de que esta correlação possa ser uma coincidência. Um cálculo do valor p ajuda a determinar se a relação observada pode surgir como resultado do acaso.