Ao executar uma pesquisa ocorre que em alguns casos a amostra não reflete fielmente a população que você deseja representar. E isso pode falsear seus resultados.
Sendo um profissional da área de pesquisa (seja a área que for) é importante saber como corrigir esse viés para poder ter mais confiança nos resultados.
Depois de explicar como calcular um tamanho de amostra necessário para obter resultados significativos veremos como corrigir uma amostra. Seja em uma pesquisa de satisfação do cliente, seja um estudo de RH ou então uma análise de mercado, neste artigo vamos explicar as duas principais técnicas para recodificar uma amostra e melhorar a representatividade dos dados coletados.
O método de ajuste por ponderação é o mais comum.
Com um ajuste por ponderação todos os dados (respostas) são mantidos e, para a análise, são atribuídos pesos individuais a cada uma das respostas em função da categoria a qual ela pertence.
Esses pesos são superiores a 1 se a categoria está subrepresentada e inferior a 1 se ela está sobrerepresentada. Assim, na análise dos resultados a opinião de um indivíduo não terá peso 1 mas sim este novo peso calculado.
Por exemplo, se a amostra compreende duas vezes menos mulheres que o previsto o peso de uma mulher será de 2 e a resposta de cada mulher contará dobrada.
Para cada categoria convém calcular o peso que será utilizado tendo em vista o ajuste por ponderação.
Exemplo
No exemplo abaixo nos desejamos que a população de homens represente 48,5% de nossa amostra (proporcional à população brasileira, de acordo com o Censo 2023). No entanto, obtivemos apenas 39% de homens na pesquisa de campo. Os pesos se calculam simplesmente dividindo a frequência desejada pela frequência obtida, ou seja:
(48,5/100)/(39/100) = 0,485/0,39 = 1,2435
Em seguida aplicamos os pesos ao conjunto da base de respondentes. Para cada variável da pesquisa nos multiplicamos então a frequência obtida pelos pesos da recodificação de cada categoria. Com isto obteremos as novas frequências ajustadas.
O exemplo seguinte ilustra este princípio de cálculo.
A população foi dividida em 2 gêneros (Feminino e Masculino) e questionada sobre a intenção de comer chocolate na Páscoa.
Sobre a amostra obtida (230 pessoas, 140 mulheres e 90 homens) nós observamos que 70% das pessoas pretendem comer chocolate na Páscoa.
Segundo o princípio do ajuste por ponderação, nós aplicamos os pesos de ponderação correspondente à população feminina (ou seja, 0,8443, conforme a tabela acima) e à população masculina (1,2435) para obter as novas frequências ajustadas.
Com objetivo de encontrar as proporções desejadas, proporcionais à população, nós podemos suprimir aleatoriamente respondentes entre as categorias sobrerepresentadas.
Para fazer isto é preciso reduzir o tamanho global da amostra. Este método é o ajuste por extração.
O princípio do ajuste por extração
Este método de ajuste é utilizado quando há uma coleta massiva de dados (pesquisa por e-mailing, redes sociais, etc...). Entretanto, com um ajuste por extração nós perdemos a precisão na medida em que o erro associado aumenta.
Na pesquisa do exemplo acima nós conservamos 120 pessoas da população A então, proporcionalmente, o número é insuficiente e foi preciso suprimir alguns casos da população B para que ele represente 37% da amostra ajustada.
Para fazer isto é preciso encontrar o tamanho total da amostra resolvendo a seguinte equação: 120 = (63/100)*x, logo x=190.
A amostra total será então de 190 indivíduos no lugar dos 230.
Em seguida, é necessário reduzir a população B aleatoriamente a 70 pessoas (190-120). O erro passa então de 5 para quase 6 pontos.
Uma vez que a pesquisa foi enviada e as respostas coletadas é preciso extrair uma amostra representativa segundo os resultados obtidos.
Isto permite constituir uma amostra representativa a partir de uma grande base de respostas obtidas de uma amostra de conveniência.
Por exemplo, nós podemos utilizar esta abordagem como parte de uma pesquisa hospedada na internet e difundida por email. Efetivamente, a coleta de dados pela internet raramente garante um método de seleção aleatório na medida em que somente em casos excepcionais é possível ter uma base de emails com a totalidade da população.
Contudo, isto permite contatar rapidamente, e com menor custo, um grande número de interlocutores.
Para ilustrar este método de ajuste por extração pós-pesquisa, e ainda assim obter uma amostra representativa, veja o seguinte exemplo:
Desejamos conhecer o hábito de consumo dos jovens entre 14 e 25 anos de uma certa região no que diz respeito a aspectos culturais (compras, vídeos, festivais, sites especializados,...).
Decidimos enviar a pesquisa por email e também via redes sociais aos estudantes de estabelecimentos de ensino de uma certa região, bem como aos jovens trabalhadores.
Dispomos da distribuição estatística desse público por gênero, idade e situação profissional, por cidades e regiões. A população acima delimitada representada por volta de 800.000 indivíduos.
Em um mês 3.500 pessoas responderam à pesquisa. Entretanto, esta amostra não é representativa da população. Efetivamente foram obtidas menos respostas femininas que o desejado e também algumas cidades foram mais presentes (grandes centros e ambientes universitários).
Assim nós procedemos a um ajuste da amostra por extração a partir das cotas desejadas, de acordo com a distribuição estatística já sabida. Isso envolveu extrair, entre os 3.500 respondentes, um grupo que correspondesse às características pré-definidas. Finalmente foi possível chegar a uma amostra de 2.180 indivíduos, que fosse representativa dos jovens de 15 a 25 anos, e entre os critérios de gênero, idade, cidade e de atividade profissional.
Com isto foi possível confiar nos resultados obtidos nesta amostra ajustada.
Texto traduzido e adaptado de:
https://www.lesphinx-developpement.fr/blog/le-redressement-comment-corriger-un-echantillon/