Pacotes brasileiros para R: micro-pacotes

Tem pacotes para R que têm muitas funções, e têm outros que possuem só uma função principal. Neste post, olhamos os pacotes brasileiros para R que caem nesta segunda categoria — ‘micro-pacotes’.

RSLP

O pacote rlsp, por Daniel Falbel, vai fazer a vida de quem trabalha com mineração de textos em português bem mais fácil. O pacote usa ‘stemming’ para a língua portuguesa. Em outras palavras, ele reduz palavras às suas raízes, facilitando a análise de textos. Um exemplo:

 

install.packages("rslp")

palavras

 

Um outro pacote do Daniel, ptstem traz mais ferramentas para a análise de texto, para quem tem interesse em nesta área.

cepR

O pacote cepR acessa dados postais do Brasil tais como nomes de bairros, cidades, estados, logradouros, CEPs e outras informações de interesse como altitude, longitude e latitude. O usuário precisa de um token do website CEPaberto, e daí pode procurar ou por CEPs ou por detalhes de bairros com o CEP. Por exemplo, a rua João Moura onde moro em São Paulo:



install.packages("cepR")

cepR::busca_cep(cep = "005412002", token = XXXXXXXXX)


    ## # A tibble: 1 x 10
    ##   estado    cidade    bairro      cep
    ##                  
    ## 1     SP São Paulo Pinheiros 05412002
    ##
    ## # ... with 6 more variables: logradouro , latitude ,
    ## #   longitude , altitude , ddd , cod_IBGE

 

GetTDData

O pacote GetTDData baixa dados do Tesouro do governo brasileiro, do website Tesouro Direto. O pacote arruma estes arquivos para você usar no R. Para quem está interessado em dados financeiras, é bem mais fácil do que baixar tudo e tentar importar um por um para R! O autor, Marcelo Perlin, tem outros pacotes para R que tratam com dados financeiros também.

riscoBrasil

Falando de dados financeiros, o pacote riscoBrasil baixa dados do índice do J.P. Morgan sobre o ‘risco Brasil’. O J.P. Morgan mantenha um Emerging Markets Bond Index com índices de risco para vários países, e o IBGE disponibiliza estes dados no caso do Brasil. O pacote tem uma função, `riscoBrasil()`, fazendo ele um ‘micro-pacote’ mesmo! Mais detalhes podem ser vistos na página do pacote, e pode ser instalado com `install.packages(“riscoBrasil”)`.

sabesp

O pacote sabesp do Júlio Trecenti, baixa e arruma dados da SABESP (a Companhia de Saneamento Básico do Estado de São Paulo). Júlio mostra como, com poucas linhas de código, pode produzir um gráfico bem informativo sobre o estado dos reservatórios de água em São Paulo:



# install.packages("devtools")  ## se não tem
# install.packages("lubridate") ## idem



devtools::install_github("jtrecenti/sabesp")
library(dplyr)
library(sabesp)
library(ggplot2)

datas %
  filter(titulo == 'volume armazenado') %>%
  ggplot(aes(x = data, y = info, colour = lugar)) +
  geom_line() +
  theme_bw() +
  geom_hline(yintercept = 0, colour = 'gray') +
  scale_x_date(date_labels = '%b %Y', date_breaks = '3 months',
               limits = as.Date(c('2012-12-01', '2015-12-01'))) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

postrelacionados

Comentários

comments

Deixe um comentário