Critérios para a análise de dados no NeoFluxo

Origem: WikiPos, a enciclopédia livre.

Image:teccred_nav.png Página principal • Reuniões • Participantes • Eventos • Links e referências • Documentos e projetos

Na segunda fase do projeto do Observatório da Mídia Social Conectada - Neofluxo, os integrantes do grupo de pesquisa TECCRED se propuseram a discutir algoritmos que procurem pelo extenso banco de dados acumulado durante a eleição de 2010. O objetivo é discutir qual foi a dimensão que a prática do astroturfing atingiu naquele período, assim como analisar as consequências eleitorais dessa interferência.

Primeira etapa: Filtragem dos dados

Apesar de o banco de dados ter sido direcionado para capturar apenas um pequena parcela de todos os dados correndo pelas mídias sociais, foi observado que parte das mensagens acabam se referindo a tópicos não relacionados à discussão político-eleitorial. Na primeira etapa da análise do banco de dados, o grupo pretende criar critérios que eliminem este tipo de ruído.

PROBLEMA: Inicialmente, é preciso trocar a codificação dos caracteres que integram o banco de dados do NeoFluxo. Do modo como foi concebido originalmente, ele é incapaz de reconhecer acentos e todos os outros tipos de acentos especiais. Apenas símbolos alfanuméricos e parte da pontuação é reconhecida.

SOLUÇÃO SUGERIDA: Na abertura do banco de dados para os integrantes do grupo, Renato tentou alterar a codificação do banco de dados para Unicode UTF-8, que dá suporte a todos os símbolos da língua portuguesa. Isso não trouxe resultado porque, aparentemente, a definição da codificação deve ser definida durante a fase de agregação de dados. Se isso estiver correto, o banco de dados precisa ser compilado novamente, desta vez seguindo as especificações de codificação correta.

Segunda fase:

a) Terminologias acerca dos indivíduos e respectivas ações que devem ser identificadas

b) Estabelecimento de padrões: Indicar detalhadamente as perguntas que devem ser respondidas pelo projeto estabelecendo-se padrões para se alcançar tais respostas. Além de melhorar a abordagem metodológica, deve servir também para sintetizar o máximo de dúvidas possíveis em alguns padrões que possam, portanto, ser utilizados para o início de várias respostas

Personal tools