Introducción a al paquete R
PhD en Estadística, MSc en Analytics & Big Data, MSc en Estadística. Con 20 años de experiencia, actual director de analítica en el CNC, miembro del comité de expertos en pobreza en el DANE y consultor de la División de Estadística de la CEPAL. Ex-decano de la Facultad de Estadística USTA, ex-director de operaciones en el ICFES, PM CEV …
Puedes encontrarme en:
tidyverse
Objetivo: proyectos reproducibles y replicables en entornos colaborativos.
setwd(mi/ruta/)
getwd()
Organice sus scripts por tareas de manera ordenada hasta obtener los resultados.
objeto <- valor
Nombre_Funcion(arg1 = val1, arg2 = val2,...)
Hay diferentes paquetes que permiten leer y escribir diversos formatos de datos
haven
: Stata, SPSS, SASreadxl
y writexl
arrow
, data.table
, …haven -> Stata
:haven -> SPSS
:haven -> SAS
:readxl -> Excel
:arrow -> Parquet
:readr -> CSV
:Existen varias formas de observar la estructura de los datos
head(tus_datos) # Muestra las primeras 6 filas del data frame
str(tus_datos) # Muestra la estructura: tipo de dato de cada columna, dimensiones, etc.
length(tus_datos) # Devuelve la cantidad de columnas si es un data frame, o de elementos si es un vector/lista
glimpse(tus_datos) # (dplyr) Muestra estructura en un formato más legible
names(tus_datos) # Devuelve un vector con los nombres de las columnas
Los comandos head
, str
, names
son del paquete base mientras que glimpse
es del entorno tidyverse.
Tu turno:
Mi primer proyecto
input/
:Este material ha sido creado por Giovany Babativa-Márquez y es de libre distribución bajo la licencia Creative Commons Attribution-ShareAlike 4.0.
Si se copia parcial o totalmente, debe citar la fuente como:
Babativa-Márquez, J.G. Materiales del curso de Analítica de Datos. URL: https://github.com/jgbabativam/AnaDatos.
Diapositivas disponibles en GitHub.