• Ligue Já +351 911 576 448
logo
notfound

Tamanho da amostra e poder estatístico: evitar arrependimentos na fase de resultados

O momento em que um estudante abre o software de estatística, corre o teste final e percebe que não consegue rejeitar a hipótese nula pode ser devastador. Passam-lhe pela cabeça noites mal dormidas, questionários partilhados vezes sem conta e, sobretudo, a pergunta que ecoa: “E se tivesse recolhido mais dados?” Este drama é mais comum do que se admite e, quase sempre, nasce de uma decisão precipitada sobre o tamanho da amostra. Falar de poder estatístico é, pois, falar de prevenção: é a arte de evitar remorsos na fase dos resultados.

 

Ao contrário do que a intuição sugere, o tamanho da amostra não se escolhe “por regra de bolso” nem “porque o orientador disse que cinquenta observações chegam”. O tamanho ótimo – e “ótimo” aqui significa equilibrar recursos e probabilidade de detetar efeitos reais – depende de quatro variáveis que dançam em conjunto: o nível de significância (α), o poder (1-β), o tamanho do efeito e a variância (ou proporção esperada). Alterar uma implica reajustar as outras. É um sistema de vasos comunicantes que, dominado, evita surpresas desagradáveis.

 

O Poder estatístico é a probabilidade de descobrir um efeito que realmente existe. Se definirmos β como a probabilidade de cometer um erro do tipo II (não detetar um efeito real), então poder = 1 – β. Na prática, quando dizemos que um teste tem poder de 0,80, afirmamos que existe 80% de probabilidade de rejeitar a hipótese nula quando esta é falsa. Repare-se que “80 %” não é um dogma, mas consagrou-se na literatura biomédica e nas ciências sociais como o patamar mínimo de conforto. Poderes de 0,90 ou 0,95 oferecem maior segurança, embora impliquem amostras maiores ou efeitos mais fáceis de detetar.

 

O enredo matemático por trás dos remorsos

Imagine-se um estudo que compara duas médias independentes (por exemplo, a ansiedade medida em escalas Likert entre estudantes de licenciatura e mestrado). Se a literatura sugere um tamanho de efeito (Cohen’s d) de 0,5 (considerado moderado ), fixarmos α em 5 % e ambicionarmos um poder de 80 %, precisaremos de cerca de 64 participantes por grupo. Diminuir o poder para 70 % corta-nos alguns inquiridos mas aumenta a probabilidade de falhar a deteção do efeito. Aumentar o poder para 90 % quase duplica o total exigido. Cada ponto percentual é uma negociação entre o custo e o risco.

 

Nos testes a proporções, o raciocínio é semelhante. Suponhamos que estimamos que 30% dos finalistas de Psicologia sofrem níveis clínicos de stress e queremos detetar uma diferença mínima de 10% face ao valor populacional de 20%. Com α = 0,05 e poder 0,80, serão precisos cerca de 274 estudantes. Nos estudos de regressão múltipla, há regras de thumb (10-15 casos por preditor), mas nenhuma substitui o cálculo formal que considere R² parcial esperado e a colinearidade. Ferramentas como GPower, a macro pwr do R, o PASS ou os módulos “SamplePower” do SPSS e “Power and Sample-size” do Stata fazem estes cálculos em poucos segundos, desde que o investigador alimente o motor com estimativas plausíveis dos parâmetros.

 

Contudo, onde arranjar esses parâmetros? A resposta clássica é a revisão da literatura: mergulhar em meta-análises, artigos semelhantes, relatórios estatísticos de organismos oficiais. Se a informação for parca, um estudo-piloto com 20-30 sujeitos pode estimar a variância ou a proporção inicial, tornando o cálculo realista. Vale lembrar que as dimensões de efeito relatadas nos artigos científicos tendem a inflacionar-se (o chamado sesgo de publicação), pelo que usar o valor mais conservador dentro do intervalo reportado poupa arrependimentos.

 

Consequências de um tamanho de amostra insuficiente

O primeiro e mais óbvio drama é o erro do tipo II: concluir que não existe efeito quando, na realidade, existe. O artigo académico resultante soa morno, o capítulo de resultados de uma tese termina em “não significativo” e o estudante fica sem história para contar. Menos visíveis, mas igualmente graves, são as interpretações erradas baseadas na magnitude do coeficiente estimado. Em amostras pequenas, os estimadores variam muito – um efeito real de 0,3 pode surgir como 0,8, criando a ilusão de um impacto forte, ou como 0,05, gerando descrença. Resultados instáveis não se repetem noutra amostra e falham na revisão por pares.

 

Há ainda o problema ético. Na investigação clínica, recrutar pacientes num ensaio sem garantia de poder suficiente viola o princípio de beneficência: expõem-se indivíduos a intervenções potencialmente inócuas. Nas ciências sociais, o custo é sobretudo académico, mas não menos importante: consomem-se bolsas públicas e horas de supervisão em estudos incapazes de responder às próprias questões.

 

A fase de planeamento: onde se decidem alegrias e arrependimentos

Planeie antes de recolher. Os guiões de grant proposals e de pré-registo (Open Science Framework, ClinicalTrials.gov) exigem um parágrafo de sample size calculation não por capricho, mas para proteger a ciência de resultados espúrios. Para chegar a esse número, siga uma rota em quatro passos:

 

1. Defina o desfecho primário (média, proporção, odds ratio, hazard ratio, etc.).
2. Especifique o tamanho do efeito mínimo clinicamente ou teoricamente relevante – não o que espera encontrar, mas o que faria diferença se o detetasse.
3. Escolha α e poder de acordo com a disciplina. Na Psicologia é habitual 5%/80 %, na Genética 1%/95 %.
4. Introduza a variabilidade esperada (desvio-padrão ou proporção) e deixe o software fazer o resto.

Alguns projetos incluem análises intermédias (designs sequenciais ou group-sequential). Nestes, parte-se de uma amostra mínima e avalia-se o efeito em pontos pré-marcados. Se já houver uma evidência convincente, pára-se, caso contrário, recruta-se mais. Esta técnica, comum em ensaios clínicos de fase III, poupa tempo e protege os participantes sem sacrificar o controlo de erros.

 

Dicas práticas para evitar a curva da penitência

A) Acerte nas suposições: use o desvio-padrão mais alto plausível – este inflaciona a variância e gera amostras ligeiramente maiores, salvaguardando-o da subpotência.
B) Acrescente 10% de margem para perdas (questionários incompletos, drop-outs). Melhor recolher 100 e analisar 90 do que recolher 90 e ficar com 80.
C) Mantenha a transparência: partilhe o cálculo no relatório – aumenta a credibilidade.
D) Resista à tentação dos p-hacks: não compense uma amostra curta com múltiplos testes à procura de significância.
E) Consulte um estatístico: meia hora de consultoria em Stata, SPSS ou R economiza meses a corrigir problemas. Para consultar um estatístico disponha da ajuda a trabalhos académicos.

 

Ferramentas à disposição dos estudantes

No SPSS, o módulo “SamplePower” guia o utilizador com caixas de diálogo intuitivas. No Stata, o comando power (disponível desde a versão 15) cobre cenários de proporções, médias e regressão. No R, o pacote pwr e, mais recentemente, pwr2 oferecem funções simples, enquanto o simr permite a simulação em modelos mistos. Todos geram gráficos de curvas de poder, úteis para convencer os orientadores a aumentar a amostra quando o orçamento obriga a cortes (no caso de investigações financiadas).

Para quem prefere interfaces gráficas independentes, o G*Power continua incontornável: gratuito, leve, multiplataforma. Apresenta-se em cinco passos, oferece tabelas-relâmpago e grava-se em PDF para anexar a protocolos.

 

Entre significância e relevância

Mesmo com o tamanho correto, não basta olhar para o p-value. O foco desloca-se para estimativas pontuais e intervalos de confiança. Uma diferença de 5 pontos num teste cognitivo pode ser estatisticamente significativa, mas será pedagogicamente relevante? Use o poder estatístico para garantir a deteção e use o raciocínio substantivo para julgar o impacto. Um estudo bem planeado dá-lhe ambas as perspetivas.

 

Considerações finais: planeamento como investimento

Evitar arrependimentos na fase de resultados não é apenas cumprir uma formalidade estatística, é respeitar o próprio esforço e o dos participantes. O tamanho de amostra e o poder formam o que sustenta a credibilidade de teses, artigos e relatórios técnicos. Quando negligenciados, deixam rachas que, mais cedo ou mais tarde, surgem nas defesas públicas, nas revisões por pares ou na aplicação prática dos achados.

 

Assim, antes de distribuir questionários, programar experiências ou recrutar voluntários, sente-se com o GPower aberto, a literatura à mão e um caderno de notas. Decida que efeito merece ser detetado, quanto risco aceita correr e quantos recursos pode alocar. Faça as contas, some a tradicional “gordura” de 10% e só então avance. O futuro-eu que, meses depois, abrirá o ficheiro do SPSS agradecer-lhe-á não deixar o êxito do projeto entregue ao acaso. Afinal, entre um artigo que termina com p = 0,18 e outro que revela um efeito claro (ou confirma, com poder suficiente, a ausência de impacto) vai a diferença entre um trabalho que convence e outro que se esvai no ruído da literatura.

 

Nada impede surpresas: a realidade é complexa. No entanto, um cálculo de tamanho de amostra informado e honesto reduz drasticamente a distância entre a expectativa e o resultado. No fim, talvez descubra que precisava de mais tempo ou mais participantes do que julgava. Mas melhor sabê-lo no início, quando ainda há margem para ajustes, do que no fim, quando só resta o arrependimento. Planeie com rigor hoje para não lamentar amanhã.

 

Nós, Especialistas Académicos oferecemos uma variedade de serviços de ajuda a teses de mestrado e doutoramento, ajuda em dissertações ou em projetos de pesquisa. Se necessita de ajuda com a estatística ou com o acompanhamento de trabalhos académicos não hesite em contactar-nos, estamos disponíveis 24 horas durante 7 dias .

Categorias:

Deixe um comentário

Fale Connosco

Especialistas Académicos

Garantia mais de 15 anos de experiência

Need An Advice?

Contacte-nos: +351 911 576 448

Especialistas Académicos © 2025 - Todos os direitos reservados.

WhatsApp Logo