Frente a um fenômeno nunca vivido neste século, pesquisadores do curso de Ciência de Dados da Universidade de Fortaleza (Unifor) se debruçaram sobre 1,2 milhões de publicações no Twitter a fim de mapear e compreender tendências dos sentimentos compartilhadas por brasileiros durante a pandemia de Covid-19.
Ao todo, foram 1.219.482 de tuítes selecionados de 86 cidades do País pelo professor e pesquisador chefe da Unifor, Luciano Gallegos, e pelo estudante de MBA em Ciência de Dados, Mario Maia.
A pesquisa realizada entre os meses de setembro e dezembro do ano passado, analisou o impacto da Covid-19 a partir de postagens do Twitter selecionadas entre os dias 2 de fevereiro até 1 de maio de 2020. Dentre os principais desafios, Luciano destaca a coleta de dados das redes sociais e a própria análise.
Demanda bastante tempo e processamento, e na análise o desafio esteve em escolher as melhores técnicas de inteligência artificial e de análise multivariada de dados para a descoberta de padrões não evidentes.
A partir da análise, perceberam que é possível visualizar um movimento de mudança dos estados afetivos em momentos relevantes, como durante o primeiro caso confirmado pelo novo coronavírus ou a primeira morte pela doença no Brasil.
Ferramentas e análises
A partir de bancos de dados com informações pré-classificadas, os programas utilizados analisavam a palavras para categorizar sentimentos positivos ou negativos, considerando inclusive a presença de figuras de linguagem, como sarcasmo, detalha o coordenador da pós-graduação da Unifor, Marcus Miranda.
Dentre as ferramentas utilizadas para identificar os sentimentos definidos como positivos, negativos ou neutros, Mario e Luciano escolheram o VADER e o Senticnet, ambas validadas pela comunidade científica.
Além disso, ao longo dos 90 dias analisados, também observaram três períodos relevantes da pandemia. Após cada um desses marcos, os pesquisadores notaram uma estabilização breve dos sentimentos entre os usuários do Twitter.
Um primeiro período ocorreu quando foi confirmada a primeira pessoa positivada para Covid-19 no Brasil, depois durante a evolução entre as confirmações de novos casos até a primeira morte pela doença registrada no País e no período logo após o primeiro óbito pela doença.
Durante a pesquisa, também conseguiram perceber quais palavras eram mais citadas nos grupos de tweets gerais, naqueles que tiveram maior ocorrência de sentimentos negativos e naqueles que tiveram registro de emoções positivas. Em todos os três grupos, são destacadas palavras como Bolsonaro, Morte, SUS, Deus e Quarentena.
No entanto, o coordenador explica que seria necessário uma pesquisa mais aprofundada capaz de criar relações entre as palavras e o significado dessas pendências. “Mas a informação está aqui, a partir disso, podemos tentar entender o que querem dizer, quais os 'insights' que a gente pode tirar”, acrescenta Marcus.
Divulgação do trabalho
Após a finalização da pesquisa, o trabalho “Covid-19 e Tweets no Brasil: coleta, tratamento e análise de textos com evidências de estados afetivos alterados em momentos impactantes” foi apresentado no X Brazilian Workshop on Social Network Analysis and Mining (BraSNAM 2021).
O encontro integra o XLI Congresso da Sociedade Brasileira de Computação (CSBC 2021), que ocorreu entre os dias 18 até 23 de julho, com a temática “Inovação e Transformação Digital: Enfrentando a Complexidade e as Incertezas do Mundo Contemporâneo”.
Para o coordenador da pós-graduação da Unifor, Marcus Miranda, essa apresentação representou uma grande conquista não só para Mario e Luciano, como para o curso de Ciência de Dados da instituição.
Eu vibrei muito, porque vinha acompanhando o trabalho e fiquei muito feliz. Um dos melhores sentimentos do educador é perceber que os alunos estão ganhando asas, chegando em cantos maiores, de destaque.
Agora, deseja que o curso siga avançando em pesquisas similares, que mesmo focando em problemas globais, buscam uma atuação mais local. Dessa forma, talvez seja possível aproximar ainda mais a inteligência artificial às problemáticas cotidianas.