1. Primeiros passos
Olá! Seja bem vindo ao pt_BR. A intenção deste site (ou seria um blog?) é trazer conteúdo de qualidade sobre mineração de textos em R em língua portuguesa. Por muito tempo tenho me interessado e trabalhado com mineração de textos mas nunca encontrei bons materiais em português. Isso é um pouco crítico pois muitos procedimentos utilizados em mineração de textos necessitam de dicionários ou processamentos que se aplicam à língua portuguesa. Infelizmente não existem muitos recursos disponíveis na internet e o objetivo deste site é preencher este vazio.
Os artigos publicados aqui pressupõem certa experiência com análise de dados em R. Você não precisa ser especialista em modelagem de dados, mas um conhecimento básico nos seguintes aspectos é fundamental:
R básico – como instalar o R, entender como funcionam os objetos, tipos de variáveis, estruturas condicionais, loops, etc. É o básico de programação e não está necessariamente relacionado à estatística. Entender como instalar e carregar pacotes também é importante.
dplyr – este pacote permite manipulação de dados no R de forma mais intuitiva e simples, onde você fazer manipulações sequenciais utilizando o pipe (%>%), facilitando a leitura e compreensão das manipulações de dados executadas.
ggplot2 – este pacote gráfico é o melhor e mais bonito conjunto de ferramentas de visualização que conheço para o R. Ele não é muito difícil de aprender e é baseado em gramáticas específicas, onde você vai especificando o nível de detalhe que quer nos gráficos de forma progressiva.
Existe muito material disponível na internet, inclusive em língua portuguesa, sobre como aprender R, dplyr e ggplot2. Dado isto, os artigos publicados aqui assumirão um conhecimento básico sobre estes tópicos para que seja possível avançar com mais velocidade.
Se você tiver feedbacks sobre os textos, não deixe de enviar um comentário por twitter, público ou DM. Meu perfil é @dansf86. Um abraço e bons estudos!