Blog do IBPAD

  • Jornada do seu usuário com Gephi e Google Analytics

    Google Analytics é uma das ferramentas mais antigas do mundo "analytics digital", mas tenho a sensação de que é no geral muito pouco explorado. No post de hoje, trago uma forma diferente de analisar o fluxo de comportamento dos seus usuários utilizando a técnica de Análise de Redes com o software Gephi. Algumas perguntas interessantes que
  • O que é Linguística de Corpus? – Veja 5 aplicações

    Linguística de Corpus é a área da Linguística utilizada para coleta e análise de bases com dados textuais produzidos por falantes reais, a exemplo de discursos, debates em mídias digitais, textos históricos, e outras formas de produção, como as transcrições de entrevistas para análises posteriores. Em Linguística de Corpus, estas bases de dados textuais são
  • “Mulheres na política”: uma tag com grande participação masculina

    por Rosana Medeiros* No mês das mulheres, o monitoramento da tag “mulheres na política” permite observar algumas distorções que podem ser aprofundadas pelos dados da participação das mulheres nos cargos de poder. O Brasil ocupa a posição 152 entre os 190 países pesquisados no ranking de mulheres na política, perdendo para alguns países do oriente
  • O que condiciona o aparecimento e a circulação de boatos?

    por Iasminny Cruz* A primeira coisa que você precisa saber sobre os boatos nestes nossos dias atuais é que eles não são exatamente os culpados pelos nossos problemas de formação da opinião pública. Isso porquê os boatos não são uma mentira – nem uma verdade – a priori. Antes, para entende-los, nós precisamos levar em
  • Dominando APIs para extração de dados das mídias sociais

    Nos últimos meses, saíram duas novas versões da Facebook Graph API (a interface de coleta de dados da plataforma). Sempre que é divulgada uma API, há preocupações, rumores e mitos tanto da comunidade de pesquisa quanto do mercado sobre limitações no acesso aos dados. Por isso, é importante conhecer como as mudanças limitam a cessão
  • Descobrindo quais são os pacotes de séries temporais mais populares do R

    Sillas Gonzaga, Cientista de Dados e professor do curso Ciência de Dados com R, elaborou este post com o objetivo de explicar como utilizar códigos para descobrir quais pacotes de séries temporais são mais utilizados na programação R. Dentre os tópicos abordados, você verá: O que são as "Task views" do CRAN, o repositório oficial de pacotes do R;
  • Uma visão geral sobre a limpeza dos dados

    por Roberta Cardoso* Para chegar a resultados consistentes e confiáveis a partir de uma análise de dados é fundamental que a base satisfaça algumas condições - exigidas pelo formalismo matemático e pelos algoritmos que sintetizam a informação de caráter quantitativo (OLIVEIRA, GRECO e BRANDÃO, 2015), uma vez que estimativas apontam que cerca de 40% dos

OutrasInformações