Critérios para a análise de dados no NeoFluxo
Origem: WikiPos, a enciclopédia livre.
| Página principal • Reuniões • Participantes • Eventos • Links e referências • Documentos e projetos |
Na segunda fase do projeto do Observatório da Mídia Social Conectada - Neofluxo, os integrantes do grupo de pesquisa TECCRED se propuseram a discutir algoritmos que procurem pelo extenso banco de dados acumulado durante a eleição de 2010. O objetivo é discutir qual foi a dimensão que a prática do astroturfing atingiu naquele período, assim como analisar as consequências eleitorais dessa interferência.
Primeira etapa: Filtragem dos dados
Apesar de o banco de dados ter sido direcionado para capturar apenas um pequena parcela de todos os dados correndo pelas mídias sociais, foi observado que parte das mensagens acabam se referindo a tópicos não relacionados à discussão político-eleitorial. Na primeira etapa da análise do banco de dados, o grupo pretende criar critérios que eliminem este tipo de ruído.
PROBLEMA: Inicialmente, é preciso trocar a codificação dos caracteres que integram o banco de dados do NeoFluxo. Do modo como foi concebido originalmente, ele é incapaz de reconhecer acentos e todos os outros tipos de acentos especiais. Apenas símbolos alfanuméricos e parte da pontuação é reconhecida.
SOLUÇÃO SUGERIDA: Na abertura do banco de dados para os integrantes do grupo, Renato tentou alterar a codificação do banco de dados para Unicode UTF-8, que dá suporte a todos os símbolos da língua portuguesa. Isso não trouxe resultado porque, aparentemente, a definição da codificação deve ser definida durante a fase de agregação de dados. Se isso estiver correto, o banco de dados precisa ser compilado novamente, desta vez seguindo as especificações de codificação correta.
Segunda fase:
a) Terminologias acerca dos indivíduos e respectivas ações que devem ser identificadas
b) Estabelecimento de padrões: Indicar detalhadamente as perguntas que devem ser respondidas pelo projeto estabelecendo-se padrões para se alcançar tais respostas. Além de melhorar a abordagem metodológica, deve servir também para sintetizar o máximo de dúvidas possíveis em alguns padrões que possam, portanto, ser utilizados para o início de várias respostas
