Quem protesta no Brasil? Comparação entre 20 de Junho de 2013, 13 e 15 de Março de 2015 e a população.

[Esse post foi feito em parceria entre Natália S. Bueno e Rogério Jerônimo Barbosa. Todos os materiais de replicação e dados utilizados estão disponíveis no nosso repositório do Github.]

O jornal britânico The Guardian afirmou que os participantes do protestos de 15 de março de 2015 são “mais velhos, mais brancos e mais ricos” do que os participantes dos protestos de junho de 2013. Mas as evidências das pesquisas apoiam tal afirmação? Quais as diferenças e semelhanças entre os manifestantes e a população? Como podemos saber disso? Como podemos comparar os manifestantes nos dois momentos?

Antes de responder e investigar a validade da afirmação do The Guardian, vamos discutir se e como evidências de opinião pública nos ajudam a saber sobre os perfis dos manifestantes. Assim, a discussão dos três parágrafos seguintes pode parecer pouco relevante, mas nós acreditamos que a análise de pesquisas não pode ser feita sem algumas ressalvas. Aguente e leia – apostamos que valerá a pena.

A nossa estratégia é comparar dados da pesquisa de 20 de junho de 2013, realizada pelo Ibope com as pesquisas realizadas em 13 e 15 de março de 2015 pelo Datafolha e utilizar dados do Censo de 2010, feito pelo IBGE. Infelizmente, existem três problemas sérios para comparar essas pesquisas realizadas nas manifestações. Em primeiro lugar a pesquisa realizada em 2013 se refere a oito capitais (dos estados de SP, RJ, MG, RS, PE, CE, BA + Distrito Federal). As pesquisas realizadas em 2015 cobrem somente o município de São Paulo (em particular, a Avenida Paulista). Em segundo lugar, as amostras possuem tamanhos distintos (2.002 manifestantes em 2013, 303 manifestantes no dia 13 de março de 2015 e 432 manifestantes em 15 de março de 2015). Em terceiro lugar, e mais importante, as três amostras foram feitas por conveniência (não-aleatórias) e, presumimos, com procedimentos distintos. Quais as implicações desses problemas?

A dificuldade começa em fazer inferências sobre a população que participou nos três protestos a partir dessas amostras – afinal de contas, apesar de frequentemente utilizadas, as amostras por conveniência de populações em fluxo são controversas. Além disso, comparar amostras que cobrem populações distintas, em momentos diferentes, recolhidas com diferentes procedimentos é ainda mais espinhoso. Não nos arriscamos em falar em margens de erro ou construir intervalos de confiança devido a essas questões. É possível, então, dizer alguma coisa?

A rigor, não. Mas, infelizmente, até onde sabemos essa é a primeira comparação mais ou menos sistemática dos dois momentos. Motivados pelo nosso incômodo com afirmações sem a devida cautela, fazemos a mea culpa, apresentamos algumas comparações simples dessas duas amostras e como elas se comparam com dados representativos da população, advindos do Censo. Deve ficar claro que esses dados amostrais são sugestivos da composição dos manifestantes. No entanto, acreditamos que eles são superiores às nossas impressões pessoais e a afirmações que não fazem referências a evidências sistemáticas.

Quais os principais achados? Em primeiro lugar, em todas as manifestações, observamos maior frequência de homens do que na população em geral – com destaque para as duas manifestações mais recentes.

Grafico 1

Mas há também diferenças relevantes entre os manifestantes nos três momentos: os participantes dos protestos de março (seja no dia 13 ou no dia 15), parecem ser de fato mais velhos do que os que participaram em 20 de junho de 2013, como já apontava o The Guardian.

Grafico 2

Em termos de escolaridade, os manifestantes de 13 e 15 de março de 2015 tem mais escolaridade do que aqueles de junho de 2013. Enquanto 43% da amostra dos manifestantes de junho declararam possuir ensino superior, esse valor salta para 68% e 76% nas amostras de 13 e 15 de março. Na população das sete capitais e distrito federal (bem como no município de São Paulo, considerado separadamente) essa quantia é de aproximadamente 17% (o que já está muito acima da população do Brasil em geral).

Grafico 3

As amostras sugerem que os manifestantes de 15 de março possuem maior renda do que os de 20 de junho e 13 de março. Mas, o que mais se destaca não são as diferenças entre os perfis dos manifestantes de cada momento, mas sim entre eles e a população. Em especial, destaca-se a sub-representação do estrato mais baixo de renda e sobre-representação de todos os demais. Observamos que 2,5% da amostra de 2013 possuía renda de até 2 salários mínimos. Em 13 e 15 de março, 18,9% e 7,2% declararam ter essa renda. Em 2010, de acordo com o Censo, cerca de 57% (para as sete capitais) e 53% (em São Paulo) declararam receber até 2 salários mínimos.

Tabela

Os dados de todas as amostras sugerem que as manifestações foram compostas por pessoas nitidamente mais escolarizadas, com maior renda (com maior proporção de homens) do que a população. Noutras palavras, os indivíduos que se mobilizam politicamente, seja nas jornadas de junho, seja na sexta ou domingos passados, têm mais recursos socioeconômicos, em média, do que a população – algo que não é novidade para estudos sobre comportamento politico.

As informações que possuíamos sobre a motivação para participar dos protestos são, infelizmente, de difícil comparação porque as perguntas foram feitas de maneiras distintas em cada pesquisa, o que muda a compreensão do entrevistado e, portanto, sua resposta. Em 20 de junho, uma pluralidade dos respondentes (27,8%) foi protestar por melhorias do sistema de transporte público e contra o aumento da tarifa – em segundo lugar (24,2%), os manifestantes de junho foram motivados pela corrupção. Entre os respondentes de 15 de março de 2015, 47% dos entrevistados mencionou a corrupção como um dos motivos para participar e 27% pelo impeachment da Presidente Dilma Rousseff. Infelizmente, não encontramos esses dados para 13 de março de 2015.

Ao final, temos dois recados. Em primeiro lugar, apesar de algumas diferenças apontadas entre os dois grupos que se mobilizam em diferentes momentos, os perfis de 2013 (20 de junho) e de 2015 (13 ou 15 de março) possuem mais semelhanças entre si do que com a população em geral. Em segundo lugar, pesquisas tendem a ser mais válidas para compreender fenômenos do que nossas experiências particulares e, principalmente, do que afirmações categóricas em meios de comunicação sem evidências empíricas sistemáticas. No entanto, elas possuem problemas e devem ser lidas com a devida cautela.

Uma breve nota metodológica:

As informações que utilizamos sobre as manifestações se baseiam única e exclusivamente nos relatórios e reportagens dos jornais indicados. Infelizmente, não tivemos acesso aos microdados nem a detalhes sobre o plano amostral. Isso nos trouxe sérias dúvidas. Em primeiro lugar, não sabemos se as categorias “Fundamental”, “Médio” e “Superior” do quesito sobre escolarização diz respeito aos níveis de ensino completos ou se englobam também níveis incompletos. Assumimos que a categoria “Fundamental” agrega pessoas com fundamental completo ou menos. As demais categorias foram tratadas como dizendo respeito apenas aos níveis completos. De todo modo, as conclusões não se alteraram quando outra categorização foi feita. Também não sabemos se a variável “renda” das pesquisas se refere à renda individual (do trabalho ou de todas as fontes) ou à renda domiciliar (total ou per capita). Ou seja, há quatro interpretações possíveis! Testamos com a renda individual de todas as fontes e com a renda domiciliar per capita. No post, por simplicidade, só apresentamos o primeiro resultado, usando a renda individual, uma vez que ambas as medidas levam à mesma conclusão.

Os dados do Censo de 2010 foram baixados diretamente do site do IBGE. Disponibilizamos códigos em R para replicação completa das análises no nosso repositório no Github. Há 3 scripts:

  • read.SAScii.csv2.R : Trata-se de uma função que lê os microdados originais não formatados (em formato txt ) e os salva num arquivo do tipo CSV (separado por ponto-e-vírgula). É um código adaptado de Anthony Damico. Essa função é chamada automaticamente a partir do script “1 – Lendo Censo 2010 – RAW para CSV.R”
  • 1 – Lendo Censo 2010 – RAW para CSV.R : Script que faz download dos dados do Censo 2010 para as UFs desejadas, aplica a função read.SAScii.csv2, faz uma seleção de casos (apenas capitais) e variáveis desejadas, procede recodificações e depois salva os arquivos em uma pasta.
  • 2 – Analise do Censo.R: Script que abre o banco preparado pelo script anterior e executa análises descritivas simples.