Capturando dados do Twitter com R

 

Twitter RUm dos primeiros desafios para qualquer analista de dados oriundos de mídias sociais é a captura dos dados. Existem vários softwares pagos e gratuitos, mas nem todos são claros sobre como exatamente esta captura está sendo realizada. O R, que é gratuito, pode te ajudar bastante nesse processo.

 Mostro aqui o primeiro passo nessa direção.

 

Carlos Cinelli é professor do curso de Programação em R 

A primeira coisa que você tem que fazer é criar uma aplicação no Twitter, a partir deste link.

Após seguir as instruções do site, você irá copiar os códigos em Consumer Key (API Key) e Consumer Secret (API Secret).

Verifique se o seu nível de acesso (Access Level) está como Read and write, para você poder consultar e tuitar por meio da API. Em seguida, peça para gerar seus tokens de acesso e copie os códigos em Access Token e Access Token Secret.

Uma vez com os códigos em mãos, instale o pacote twitteR na sua máquina.

install.packages("twitteR")

 

Pronto! A a partir de agora você pode tanto consultar quanto tuitar, retuitar – tudo a partir do R. Vamos fazer alguns testes simples. Primeiramente precisamos passar as chaves de acesso para o twitteR.

library(twitteR)
 
# coloque suas chaves
api_key             <- "xxxx"
api_secret          <- "xxxx"
access_token        <- "xxxx"
access_token_secret <- "xxxx"
 
setup_twitter_oauth(api_key, api_secret, access_token, access_token_secret)

 

Para começar, que tal buscar os trends de Brasília neste momento?
# woeid -> where on earth id
# 455819 é o código de Brasília
trendsBrasilia <- getTrends(woeid = 455819)
# 10 primeiros apenas
trendsBrasilia$name[1:10]

Resultado:

##  [1] "#PurposeTourVancouver"      "#ARegraFinal"             
##  [3] "#GloboGolpista"             "Louise"                   
##  [5] "DIRECTIONERS AO ATAQUE"     "#SemJesusEu"              
##  [7] "#NoFuturoEu"                "HOJE TEM FLAMENGO"        
##  [9] "Doctor Who Back To Netflix" "Atlanta"

Os demais woied disponíveis podem ser obtidos com a função availableTrendLocations().

Vejamos outro exemplo: quais os últimos 50 tweets contendo a palavra ‘impeachment’?

imp <- searchTwitter('impeachment', n = 50)
imp[c(1, 25, 50)]

 

Resultado:
 
## [[1]]
## [1] "GeizeStella: RT @BlogOlhoNaMira: Específico: impeachment. Pedir fim da corrupção pra deputado corrupto é mandar lembrança pra quem não conhece https://t…"
##
## [[2]]
## [1] "paulogmmoura: De acordo com a literatura sobre impeachment, a consistência e a extensão dos protestos de rua são os aspectos... https://t.co/W3H92BUXtu"
##
## [[3]]
## [1] "prof_xico: RT @radaronline: Se impeachment passar, TSE deve sustar processo contra Temer https://t.co/y9tCw6jWJf"

E, como último exemplo, vamos utilizar a função tweet() para tuitar diretamente do R.

tweet("Tweet gerado com twitteR https://cran.r-project.org/web/packages/twitteR/index.html")

 

Esses são alguns dos comandos básicos. A partir daí é possível fazer consultas mais elaboradas e criar o seu próprio sistema de monitoramento de Twitter.

Atenção: lembre-se sempre de respeitar os limites estabelecidos pelo Twitter para a API.

Conheça o nosso curso de Programação em R. Turmas abertas em São Paulo e no Rio de Janeiro.

 

postrelacionados

Comentários

comments

Comentários (2)

Deixe um comentário