Agora que explicamos como lidar com respostas ausentes em pesquisas, vamos ver como ajustar seus resultados identificando dados potencialmente arriscados para realizar análises robustas e obter resultados confiáveis.
Uma vez realizada a coleta e a entrada de dados, é de fato essencial realizar uma avaliação da qualidade das respostas e, se necessário, uma limpeza completa dos dados. Esta etapa ajuda a evitar que dados inconsistentes ou discrepantes enviesem os resultados e as conclusões do seu estudo. Neste artigo, chamamos sua atenção para 3 tipos de dados que podem corromper seus resultados.
Primeiro, para garantir a confiabilidade dos seus resultados, pode ser necessário eliminar respostas parcialmente concluídas. Por exemplo, quando os indivíduos responderam menos de 50% ou 60% das perguntas, eles geralmente devem ser excluídos da análise, exceto nos casos em que as respostas incompletas são devidas à estrutura do questionário, ou seja, a filtros predefinidos na sua pesquisa.
Além disso, é necessário avaliar as próprias questões. De fato, se mais da metade dos entrevistados não der uma resposta a uma pergunta específica, ela pode ser considerada irrelevante ou muito complexa. Este pode ser o caso de perguntas formuladas na forma de afirmações negativas com as quais os respondentes devem indicar seu grau de concordância (ou discordância).
Por exemplo: “Meu orientador não está ouvindo” ou “Não recebi nenhuma resposta às minhas solicitações”. O tratamento da dupla negativa é, portanto, um exercício que representa um esforço cognitivo particular e, portanto, não é algo fácil. A proporção de não respostas observadas neste tipo de questão pode, portanto, servir como um
indicador da compreensão da questão e deve levá-lo a não levar esta variável em consideração na sua análise final.
Além de respostas incompletas, dados singulares ou aberrantes também podem atrapalhar a análise estatística, criando vieses significativos. Portanto, é essencial identificar e tratar esses casos.
Para suas perguntas fechadas, uma resposta escolhida por menos de 1% dos entrevistados pode ser considerada suspeita. De fato, essas respostas podem resultar de erros de entrada de dados, falta de compreensão ou até mesmo um desejo deliberado de distorcer os resultados. Seria então apropriado realizar uma análise mais detalhada do perfil dos entrevistados que selecionaram esta resposta.
Para suas perguntas numéricas, as respostas que estiverem além ou abaixo de três desvios-padrão da média devem ser examinadas atentamente. Esses valores extremos podem de fato indicar comportamento anormal ou erros.
O objetivo será então determinar se esses valores discrepantes precisam ser corrigidos ou removidos para evitar afetar negativamente seus resultados. De fato, valores extremos impactam diretamente certos indicadores-chave, como a média (que é então “puxada para cima” ou “puxada para baixo” dependendo da direção dos dados extremos) e podem, portanto,
mudar drasticamente suas conclusões se forem simplesmente ignorados.
Por fim, respostas sistemáticas são outra fonte potencial de viés. Elas ocorrem quando os entrevistados adotam comportamentos automáticos ou maliciosos durante sua participação na pesquisa.
Por exemplo, falamos de resposta sistemática quando um respondente sempre seleciona a primeira opção de cada questão sem pensar, ou no caso de questões de escala, quando um respondente sempre escolhe o mesmo item da escala, o que sugere uma falta de engajamento na tarefa.
Esses comportamentos devem, portanto, ser identificados e as respostas correspondentes excluídas da análise. Para fazer isso, testes estatísticos ou verificações de consistência podem ser usados para identificar essas anomalias. No entanto, isso também pode ser considerado anterior à coleta de dados, introduzindo perguntas projetadas especificamente para identificar respostas automáticas, também chamadas de perguntas chamariz. Por exemplo: “Se você está lendo esta pergunta, responda à pergunta B.” Neste caso simples de configurar, um indivíduo cujo modo de resposta seria automático seria identificável por sua “resposta errada”.
Interessar-se pela qualidade dos seus dados é, portanto, um passo essencial para garantir a confiabilidade e a validade dos resultados do seu estudo. Isso ajuda, primeiramente, a evitar vieses causados por respostas incompletas, singulares ou sistemáticas, mas também nos permite dar um passo atrás em relação a um conjunto de dados, garantindo que as perguntas sejam devidamente compreendidas pelo maior número de pessoas ou que os entrevistados estejam envolvidos ou comprometidos. É adotando procedimentos de limpeza rigorosos que os analistas podem explorar dados de qualidade e fornecer conclusões precisas e relevantes. Não descurar esta etapa permite, portanto, garantir a credibilidade dos estudos realizados e assegurar que as decisões tomadas sejam tomadas em bases sólidas.
https://www.lesphinx-developpement.fr/blog/resultats-denquete-nettoyer-vos-donnees-pour-des-analyses-fiables/