Quem protesta no Brasil? Comparação entre 20 de Junho de 2013, 13 e 15 de Março de 2015 e a população.

[Esse post foi feito em parceria entre Natália S. Bueno e Rogério Jerônimo Barbosa. Todos os materiais de replicação e dados utilizados estão disponíveis no nosso repositório do Github.]

O jornal britânico The Guardian afirmou que os participantes do protestos de 15 de março de 2015 são “mais velhos, mais brancos e mais ricos” do que os participantes dos protestos de junho de 2013. Mas as evidências das pesquisas apoiam tal afirmação? Quais as diferenças e semelhanças entre os manifestantes e a população? Como podemos saber disso? Como podemos comparar os manifestantes nos dois momentos?

Antes de responder e investigar a validade da afirmação do The Guardian, vamos discutir se e como evidências de opinião pública nos ajudam a saber sobre os perfis dos manifestantes. Assim, a discussão dos três parágrafos seguintes pode parecer pouco relevante, mas nós acreditamos que a análise de pesquisas não pode ser feita sem algumas ressalvas. Aguente e leia – apostamos que valerá a pena.

A nossa estratégia é comparar dados da pesquisa de 20 de junho de 2013, realizada pelo Ibope com as pesquisas realizadas em 13 e 15 de março de 2015 pelo Datafolha e utilizar dados do Censo de 2010, feito pelo IBGE. Infelizmente, existem três problemas sérios para comparar essas pesquisas realizadas nas manifestações. Em primeiro lugar a pesquisa realizada em 2013 se refere a oito capitais (dos estados de SP, RJ, MG, RS, PE, CE, BA + Distrito Federal). As pesquisas realizadas em 2015 cobrem somente o município de São Paulo (em particular, a Avenida Paulista). Em segundo lugar, as amostras possuem tamanhos distintos (2.002 manifestantes em 2013, 303 manifestantes no dia 13 de março de 2015 e 432 manifestantes em 15 de março de 2015). Em terceiro lugar, e mais importante, as três amostras foram feitas por conveniência (não-aleatórias) e, presumimos, com procedimentos distintos. Quais as implicações desses problemas?

A dificuldade começa em fazer inferências sobre a população que participou nos três protestos a partir dessas amostras – afinal de contas, apesar de frequentemente utilizadas, as amostras por conveniência de populações em fluxo são controversas. Além disso, comparar amostras que cobrem populações distintas, em momentos diferentes, recolhidas com diferentes procedimentos é ainda mais espinhoso. Não nos arriscamos em falar em margens de erro ou construir intervalos de confiança devido a essas questões. É possível, então, dizer alguma coisa?

A rigor, não. Mas, infelizmente, até onde sabemos essa é a primeira comparação mais ou menos sistemática dos dois momentos. Motivados pelo nosso incômodo com afirmações sem a devida cautela, fazemos a mea culpa, apresentamos algumas comparações simples dessas duas amostras e como elas se comparam com dados representativos da população, advindos do Censo. Deve ficar claro que esses dados amostrais são sugestivos da composição dos manifestantes. No entanto, acreditamos que eles são superiores às nossas impressões pessoais e a afirmações que não fazem referências a evidências sistemáticas.

Quais os principais achados? Em primeiro lugar, em todas as manifestações, observamos maior frequência de homens do que na população em geral – com destaque para as duas manifestações mais recentes.

Grafico 1

Mas há também diferenças relevantes entre os manifestantes nos três momentos: os participantes dos protestos de março (seja no dia 13 ou no dia 15), parecem ser de fato mais velhos do que os que participaram em 20 de junho de 2013, como já apontava o The Guardian.

Grafico 2

Em termos de escolaridade, os manifestantes de 13 e 15 de março de 2015 tem mais escolaridade do que aqueles de junho de 2013. Enquanto 43% da amostra dos manifestantes de junho declararam possuir ensino superior, esse valor salta para 68% e 76% nas amostras de 13 e 15 de março. Na população das sete capitais e distrito federal (bem como no município de São Paulo, considerado separadamente) essa quantia é de aproximadamente 17% (o que já está muito acima da população do Brasil em geral).

Grafico 3

As amostras sugerem que os manifestantes de 15 de março possuem maior renda do que os de 20 de junho e 13 de março. Mas, o que mais se destaca não são as diferenças entre os perfis dos manifestantes de cada momento, mas sim entre eles e a população. Em especial, destaca-se a sub-representação do estrato mais baixo de renda e sobre-representação de todos os demais. Observamos que 2,5% da amostra de 2013 possuía renda de até 2 salários mínimos. Em 13 e 15 de março, 18,9% e 7,2% declararam ter essa renda. Em 2010, de acordo com o Censo, cerca de 57% (para as sete capitais) e 53% (em São Paulo) declararam receber até 2 salários mínimos.

Tabela

Os dados de todas as amostras sugerem que as manifestações foram compostas por pessoas nitidamente mais escolarizadas, com maior renda (com maior proporção de homens) do que a população. Noutras palavras, os indivíduos que se mobilizam politicamente, seja nas jornadas de junho, seja na sexta ou domingos passados, têm mais recursos socioeconômicos, em média, do que a população – algo que não é novidade para estudos sobre comportamento politico.

As informações que possuíamos sobre a motivação para participar dos protestos são, infelizmente, de difícil comparação porque as perguntas foram feitas de maneiras distintas em cada pesquisa, o que muda a compreensão do entrevistado e, portanto, sua resposta. Em 20 de junho, uma pluralidade dos respondentes (27,8%) foi protestar por melhorias do sistema de transporte público e contra o aumento da tarifa – em segundo lugar (24,2%), os manifestantes de junho foram motivados pela corrupção. Entre os respondentes de 15 de março de 2015, 47% dos entrevistados mencionou a corrupção como um dos motivos para participar e 27% pelo impeachment da Presidente Dilma Rousseff. Infelizmente, não encontramos esses dados para 13 de março de 2015.

Ao final, temos dois recados. Em primeiro lugar, apesar de algumas diferenças apontadas entre os dois grupos que se mobilizam em diferentes momentos, os perfis de 2013 (20 de junho) e de 2015 (13 ou 15 de março) possuem mais semelhanças entre si do que com a população em geral. Em segundo lugar, pesquisas tendem a ser mais válidas para compreender fenômenos do que nossas experiências particulares e, principalmente, do que afirmações categóricas em meios de comunicação sem evidências empíricas sistemáticas. No entanto, elas possuem problemas e devem ser lidas com a devida cautela.

Uma breve nota metodológica:

As informações que utilizamos sobre as manifestações se baseiam única e exclusivamente nos relatórios e reportagens dos jornais indicados. Infelizmente, não tivemos acesso aos microdados nem a detalhes sobre o plano amostral. Isso nos trouxe sérias dúvidas. Em primeiro lugar, não sabemos se as categorias “Fundamental”, “Médio” e “Superior” do quesito sobre escolarização diz respeito aos níveis de ensino completos ou se englobam também níveis incompletos. Assumimos que a categoria “Fundamental” agrega pessoas com fundamental completo ou menos. As demais categorias foram tratadas como dizendo respeito apenas aos níveis completos. De todo modo, as conclusões não se alteraram quando outra categorização foi feita. Também não sabemos se a variável “renda” das pesquisas se refere à renda individual (do trabalho ou de todas as fontes) ou à renda domiciliar (total ou per capita). Ou seja, há quatro interpretações possíveis! Testamos com a renda individual de todas as fontes e com a renda domiciliar per capita. No post, por simplicidade, só apresentamos o primeiro resultado, usando a renda individual, uma vez que ambas as medidas levam à mesma conclusão.

Os dados do Censo de 2010 foram baixados diretamente do site do IBGE. Disponibilizamos códigos em R para replicação completa das análises no nosso repositório no Github. Há 3 scripts:

  • read.SAScii.csv2.R : Trata-se de uma função que lê os microdados originais não formatados (em formato txt ) e os salva num arquivo do tipo CSV (separado por ponto-e-vírgula). É um código adaptado de Anthony Damico. Essa função é chamada automaticamente a partir do script “1 – Lendo Censo 2010 – RAW para CSV.R”
  • 1 – Lendo Censo 2010 – RAW para CSV.R : Script que faz download dos dados do Censo 2010 para as UFs desejadas, aplica a função read.SAScii.csv2, faz uma seleção de casos (apenas capitais) e variáveis desejadas, procede recodificações e depois salva os arquivos em uma pasta.
  • 2 – Analise do Censo.R: Script que abre o banco preparado pelo script anterior e executa análises descritivas simples.

8 respostas em “Quem protesta no Brasil? Comparação entre 20 de Junho de 2013, 13 e 15 de Março de 2015 e a população.

  1. Mais uma contribuição de jovens e qualificados pesquisadores. Sabemos mais do que sabíamos e sabemos quais os limites do que sabemos. Gláucio Soares

  2. Gostei. Diria, para provocar (não os autores, mas os superficiais) que mais educação, menos vandalismo. Sobre isto, parece que poucos se lembram…

  3. Achei plenamente necessária a análise de vocês. Especialmente por partirem de uma afirmação categórica de um jornal relativamente pouco questionado no Brasil.
    No entanto, agregaria um fator que dificulta ainda mais a afirmativa “os perfis de 2013 possuem mais semelhanças entre si do que com a população em geral”. Minha hipótese é de que não se pode inferir sobre junho a partir de uma pesquisa feita em 20 de junho de 2013. Posso falar somente de São Paulo, onde pude conferir nas próprias manifestações, portanto não tenho clareza sobre outras capitais. 20 de junho é o dia da saída de uma população que não tem mais necessariamente conexão com as motivações das outras 4 manifestações anteriores. 13 de junho, o dia da repressão massiva da polícia em São Paulo, é o momento de virada a partir do qual as pessoas vão às ruas por razões mais diversas do que o valor dos transportes. Seja contra a própria repressão, seja por pautas que começam a ser ensinadas pela imprensa, tais como “contra a corrupção”. O número de pessoas que foi às ruas contra a corrupção é bem surpreendente. Pensei que havia muito menos gente com essa motivação. Mesmo assim a questão dos transportes continua sendo a mais relevante e, de novo, depois de muitos dias de manifestação em que havia várias evidências de que as marchas eram somente por conta do valor da tarifa. Sei que estou quase fazendo uma afirmação categórica aqui, mas é só sobre São Paulo e só sobre manifestações menores do que aquela do dia 20.

    Se vocês aceitarem minha hipótese de que uma amostragem com pesquisas do dia 20 de junho não refletem “junho” como um todo, que outros dados vocês buscariam para produzir uma análise ainda mais precisa sobre esse período? A pergunta é sincera, pois não consigo encontrar meios de acessar junho sem partir de relatos de quem lá estava.

    • Obrigada pelo comentário! Infelizmente, não sabemos de dados para todos os momentos de junho. Após a publicação desse post, ficamos sabendo que existem dados para 17 junho no Largo do Batata e 20 de junho na paulista, do Datafolha. Espero que essa informação ajude.

  4. Trabalho criativo e competente! Adverte o leitor dos problemas metodológicos das comparações, sugerindo cautela nas inferências. Mesmo com evidência empírica de pouco lastro, o texto lança luzes quantitativas sobre as manifestações e avançam sobre o trivial “achismo”. Parabéns!

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s