As danças dos números das pesquisas eleitorais

Muito já se discutiu se os institutos de pesquisa deveriam ou não divulgar pesquisas pré-eleitorais. Questionamentos mais incisivos são feitos em relação à capacidade de pequenas amostras, geralmente contendo menos de 1.500 casos, em estimarem as intenções de votos de populações muito maiores, de milhares até milhões de pessoas. <br /> <br />

Muito já se discutiu se os institutos de pesquisa deveriam ou não divulgar pesquisas pré-eleitorais. Questionamentos mais incisivos são feitos em relação à capacidade de pequenas amostras, geralmente contendo menos de 1.500 casos, em estimarem as intenções de votos de populações muito maiores, de milhares até milhões de pessoas.

As estimativas de intenções de votos são feitas por amostragens, por questões de custo e tempo. De fato, capturam a situação ou "foto" de uma realidade, no período de realização de uma dada pesquisa. Não capturam alterações futuras de intenções de votos.


O acerto das estimativas de intenções de voto de populações inteiras e grandes, tal como de uma cidade do porte de Porto Alegre, depende fundamentalmente da representatividade da amostra selecionada. Com pequenas amostras corretas, pode-se predizer as características de grandes populações. Inversamente, com grandes amostras viesadas, acaba-se predizendo incorretamente a realidade de grandes populações. No caso de Porto Alegre, pouco adianta colher grandes amostras de pessoas que circulam pela esquina democrática, porque esta amostra conteria grandes vieses em relação à verdadeira população da cidade inteira de Porto Alegre. Por ali, não circulam pessoas que representam de forma correta e proporcional a população da cidade. Encontrar-se-iam mais comerciantes informais, empregados do comércio e servidores públicos, assim como menos trabalhadores de fábricas e donas de casa.

Amostras constituem subconjuntos de populações. Com amostras realmente representativas, pode-se estimar com precisão (ou probabilidade) as características de populações. Nesse caso, o termo precisão significa poder estimar as características de uma população com certa probabilidade e margem de erro. Por exemplo, quando se afirma que uma amostra permite predizer a realidade de uma população com 95% de probabilidade e 3% de margem de erro, está se afirmando que em 95% das vezes a predição da média ou do percentual do universo pela média ou percentual da amostra está dentro da margem de erro de 3%, para mais ou para menos.

Deve ser observado que a regra anterior somente vale para amostras realmente representativas. Existem várias circunstâncias ou fatores que afetam negativamente a obtenção de "boas amostras", que sejam realmente representativas dos respectivos universos. Dentre tais fatores, inclui-se inclusive o tipo de amostragem, que se dividem em dois grandes grupos: amostragens probabilísticas e amostragens não-probabilísticas. As amostragens do primeiro grupo, tais como amostragem aleatória simples e sistemática, tendem a gerar amostras representativas.

No caso de pesquisas eleitorais, pelas já alegadas razões de custo e tempo, recorre-se normalmente a amostragens por cotas. Assim, divide-se a população em função de propriedades ou classes tidas como relevantes, tais como sexo, idade, instrução ou renda, e local de residência. Geram-se, então, proporções ou cotas para as amostras, que precisam refletir a realidade das populações em estudo. Tais cotas geram matrizes, em que as classes (de sexo, idade, instrução ou renda) perfazem cotas ou percentuais, de acordo com a realidade das populações. Para realizarem os levantamentos de dados, os pesquisadores dirigem-se aos locais de pesquisa indicados, com planilhas a serem completadas, com percentuais de pessoas por sexo, idade e instrução ou renda. Na geração dessas planilhas, recorre-se a naturais simplificações, na geração das respectivas "árvores" de cotas.

As amostragens por cotas não são probabilísticas porque levam-se em consideração tão somente as classes selecionadas como sendo relevantes. Outrossim, porque os pesquisadores selecionam os casos à medida em que preenchem os requisitos ou células das suas planilhas de cotas. Desses fatos, decorrem naturais limitações de predição das pesquisas, porque outros aspectos ou características não consideradas como sendo relevantes podem, de fato, influir mais ou menos; e porque os pesquisadores tendem a selecionar os casos por acessibilidade ou conveniência, sem serem rigorosamente imparciais e probabilísticos. Por exemplo, o simples histórico pessoal de cada pesquisador, eventuais idéias que expresse, ou forma de abordar, sua aparência e forma de trajar, geram naturais reações nos pesquisados, que podem ter mais ou menos empatia, ou responderem com maior ou menor influência do pesquisador. É natural, também, que os pesquisadores acessem lugares mais fáceis e públicos, sem irem a lugares mais difíceis. Tais fatores fazem com que as predições não sejam, de fato, tão corretas, quanto seriam fossem as amostras e as abordagens rigorosamente probabilísticas e imparciais. Por isso, as margens de erro são de fato maiores que as normalmente anunciadas nos relatórios das pesquisas e na mídia.

Os viéses dos levantamentos também explicam as razões para erros históricos ocorridos em pesquisas, como o erro em relação à estimativa de intenção de votos para o atual senador gaúcho Paulo Paim. Sabe-se que o público votante desse senador tende a estar em empregos formais e principalmente nas fábricas. Todavia, tais segmentações não constavam nas planilhas de cotas e, por isso, mesmo atendendo às cotas previstas (em termos de faixa de idade, sexo e instrução ou renda), o público votante do senador não era acessado na proporção adequada, porque se encontrava no interior das fábricas e empresas, no momento das pesquisas de rua.

Quando as amostras de casos são bem planejadas e corretamente executadas, elas têm elevada capacidade de predição. Fossem de fato probabilísticas, então diferentes tamanhos de amostras, com probabilidades de 95% ou risco de 5%, teriam as seguintes capacidades de inferência de populações infinitas:



Nas situações comuns, utilizam-se margens de erro de 3,0%, para os quais se precisa obter amostras representativas de 1.067 casos. Com tal equação, se poderia dizer: "com uma amostra representativa de 1.067 casos, tem-se 95% de probabilidade que a verdadeira proporção (ou percentual) da população seja a proporção (ou percentual) da amostra, com uma margem de erro de mais ou menos 3,0%". Ou seja, tal estimativa estará correta em 95% das vezes, ou uma vez errada em 20 vezes.

As pesquisas com amostras têm a grande vantagem de trazerem à luz intenções de votação, em determinado instante ou período. As razões dos erros de estimativa baseiam-se bem mais em falhas nos métodos ou técnicas de pesquisa, do que em alterações nos dados levantados. De modo geral, as equipes de levantamento dos dados são numerosas, contendo várias dezenas de pesquisadores. Além disso, as equipes que realizam os processamentos não possuem opiniões unânimes em relação aos candidatos pesquisados. Qualquer deslize viria à luz, mais cedo ou mais tarde, e seria fatal a qualquer instituto. Por isso, os erros advêm bem mais das falhas das técnicas, do que das mexidas (ou "pajelanças") nos números por algum aventureiro de instituto de pesquisa.


ExibirMinimizar
CEO Outllok, A era da liderança resiliente. Confira os Resultados.