Estamos às vésperas das eleições e achei oportuno lhes escrever sobre algo que vem me incomodando há muito tempo:
As pesquisas eleitorais realmente significam alguma coisa?  E aquela famosa margem de erro de 2% para cima ou para baixo, refletem de fato o grau de certeza obtido das amostras?
Os resultados das pesquisas tendem a interferir no processo eleitoral através da influência que causam nos eleitores a partir dos números que lhe são apresentados. Porém, até que ponto eles são válidos?
Estatística é a arte de torturar os números...
Alguém já disse uma frase, que eu gosto muito, que diz: “Estatística é a arte de torturar os números até que eles contem aquilo que queremos saber”.
Então, em solidariedade aos números torturados,  vamos tentar compreender como funcionam as pesquisas de opinião.
A maneira mais confiável de se obter conhecimento através de uma amostragem sobre uma dada população é utilizando critérios probabilísticos, cujo conceito é que:  “cada elemento da população tenha uma chance conhecida e diferente de zero de ser selecionado para compor a amostra”.
Agora imagine como seria oneroso e demorado amostrar aleatoriamente a população brasileira abrangendo todas as suas características sociais, econômicas, demográficas, e geográficas, entre outros parâmetros importantes.   Creio mesmo que seria inviável como ferramenta de opinião, mas seria somente desse modo que poderíamos afirmar no final, que o candidato Fulano possui N% das intenções de voto e que a margem de erro da pesquisa é de y%.
No entanto, para baratear e tornar mais rápida a realização das pesquisas, os institutos se utilizam de métodos não probabilísticos valendo-se da amostragem por quotas.
E o que vem a ser isso?
É uma técnica que só é viável se houver uma limitação das variáveis, por exemplo:  idade, geografia, faixa salarial, nível de escolaridade.  Quanto menos aspectos sejam controlados mais fácil a realização da amostragem. 
Vejam que só aí já perdemos muito da qualidade da pesquisa, visto que grandes nuances de nossa sociedade não serão percebidas. É virtualmente impossível estimar parâmetros populacionais confiáveis através desse método.
Em seguida, o pesquisador sairá a campo buscando fazer suas entrevistas até preencher o número de pessoas em cada uma das quotas, que devem ter sido estabelecidas com base em alguma estimativa populacional.
Portanto haverá uma influência subjetiva do pesquisador que entrevistará pessoas sequencialmente, e a seu critério, até completar as quotas.
Segundo uma análise de métodos de pesquisa feita na Inglaterra em 1953 (veja os detalhes em http://migre.me/1rqXF ), fizeram-se amostragens de um parâmetro populacional entre homens e mulheres utilizando-se os métodos probabilístico e de quotas afim de comparar os resultados com dados censitários da população.
No caso dos homens, em  12 estimativas utilizando-se o método de quotas houve discrepâncias significativas em 7, e para as mulheres houve 11 discrepâncias significativas em 12.
No método probabilístico houve apenas 1 discrepância importante nas 24 estimativas.
No entanto, apesar da pesquisa ser não probabilística e sujeita a tendências, os institutos que fazem nossas pesquisas eleitorais apresentam a margem de erro baseada em fórmulas probabilísticas, o que não faz nenhum sentido.
Trocando em miúdos
Com a técnica empregada e com o número de amostras – vi agora há pouco um resultado tomado sobre ~3.000 entrevistados em ~ 50 cidades – a margem de erro de 2% é totalmente desprovida de rigor técnico.
Do mesmo modo, isso também vale para os índices de popularidade de nosso presidente!
A pergunta que fica é:  Se a pesquisa tem o risco de ser tendenciosa e a margem de erro não significa nada, por que apresentar isso ao público?
Tudo bem que é melhor uma pesquisa ruim do que nenhuma pesquisa, mas fica o recado: Não levem os números da pesquisa muito a sério até a apuração das urnas.
Para saber mais:
http://migre.me/1rqXF 
http://migre.me/1rrqP
Assinar:
Postar comentários (Atom)
Nenhum comentário:
Postar um comentário