Data Mining with R

This site wants to bring you closer to the data mining world by understanding its techniques through examples and easy to follow explanations. To do so, we will rely on the R programming language since it builds an excellent educational environment for doing statistics.

The material you will find in this site is intended for educational purposes only. We are equally focused on both Data Mining algorithms and R programming since it is widely recognized as a free software for statistical computing.

We would like our value to be, keeping the learning process flow in a quiet and procedural way. With this objective in mind, in each case study you will be provided with all info needed to understand clearly each step, avoiding the need to skip to other sites looking for further info.

In R Language section you will find a "what is R guide"

In Mathematic principles section you will find basic concepts to be used later, in data mining algorithms

  • Distance
  • Information gain

In Data Mining with R section you will be able to follow step by step case studies of

  • Clustering
  • Outliers detection
  • Decision trees
  • Text Mining

Note: Since this site is powered by Google Sites, it is mobile OS friendly for IPhone, Android and Blackberry alike.

This site is work in progress, corrections and comments are welcome.

El objetivo de esta web es acercarte al mundo de la minería de datos a través de la comprensión de las técnicas que usa esta disciplina. Pare ello hemos diseñado ejemplos pensados para facilitar una rápida comprensión de los conceptos expuestos.

Aclarar que todo el contenido está en Inglés puesto que consideramos que con un vocabulario muy básico es posible seguir bien todo lo que se explica.

El material que se facilita en este sitio web tiene como propósito último la formación. Veréis que sobretodo nos centraremos en dos ámbitos, la Minería de Datos y la programación en lenguaje R, veréis que éste desarrolla muy bien y de una forma muy didáctica los cálculos de tipo  estadístico.

Nos gustaría que nuestro principal valor fuera el de saber mantener en el estudiante un ritmo de aprendizaje apropiado y a la vez procedimentado. Con este objetivo en mente, cada caso de estudio expuesto contendrá toda la información necesaria para poder seguirlo y entenderlo sin necesidad de tener que saltar a otras páginas web para completar conocimientos.

En la sección R Language encontraréis una guía básica para familiarizarse con el lenguaje R

En la sección Mathematic principles encontraréis conceptos básicos que se irán desarrollando en los diferentes casos de estudio de Minería de Datos.
  • Distancia
  • Ganancia de la información
En la sección Data Mining with R encontraréis casos de estudio fáciles de seguir
  • Segmentación
  • Detección de objetos outliers
  • Árboles de decisión