Introducción al Análisis de Datos con R
Fundamentación
La producción y análisis de la información para la toma de decisiones en la gestión y eficiencia resulta fundamental para las políticas públicas y de desarrollo socio-económico en un país. Más si se toman en cuenta de que existen múltiples programas de carácter libre (sin costo) para realizar este tipo de labor. ¿Por qué es importante aprender R para funcionarios públicos? Describimos varias razones:
- Toma de decisiones basada en datos e información. Los funcionarios públicos necesitan analizar muchas veces grandes volúmenes de datos y R es un lenguaje poderoso para el análisis estadístico en este sentido.
- Transparencia y rendición de cuentas. R facilita la creación de informes automatizados los cuales pueden ser presentados a la ciudadanía en general.
- Automatización. Con R, es posible automatizar procesos de análisis de datos, reduciendo el tiempo y esfuerzo invertido en tareas repetitivas.
- Desarrollo de capacidades técnicas. Como con cualquier software, capacitar a los funcionarios en R mejora sus habilidades técnicas e informáticas, las cuales aumentan el capital humano y acervo de conocimiento de las instituciones. Siendo R un lenguaje muy flexible e interoperable con otros software de código abierto (Pyhton por ejemplo).
Objetivo general
Introducir a los estudiantes en el procesamiento y análisis de datos con el programa estadístico “R”. Relevar la importancia del software libre mostrando la potencia del motor “R” mediante interfases amenas (Rcommander; R-UCA; Jamovi) y más complejas (Rstudio). Adquirir las competencias esenciales para tener un conocimiento básico de procesamiento en estadísticas descriptivas y análisis multivariado para múltiples fuentes de datos (encuestas, registros, etc.).
Objetivos específicos
- Conocer los tipos de variables posibles en una base de datos. Instalación de programas. Cargar múltiples datos y librerías (“paquetes”) en las diferentes interfaces de R.
- Aprender procesamiento básico (estadística descriptiva e inferencial, medidas de tendencia central, correlación, diferencia de medias, tablas de contingencia). Aprendizaje de comandos esenciales en Rcommander y Jamovi. Generación de documentos auto-reproducibles en Rstudio.
- Visualización de datos
- Introducción de técnicas de análisis multivariado:
a. Modelo de tablas de contingencia
b. Introducción a la regresión lineal múltiple / regresión logística binaria