La ciencia de datos, o data science, es una nueva área de conocimiento que se ha vuelto cada vez más popular; se ha convertido en una habilidad necesaria en la actualidad. Para mejorar, o adquirir, competencias en data science y R, un lenguaje de programación, la Universidad Nacional Autónoma de México tiene disponible, a través de Coursera, el curso “Introducción a Data Science: Programación Estadística con R”, para que aprendas a programar.
El objetivo del curso es introducir a los alumnos al lenguaje de programación estadística R, un lenguaje computacional diseñado para el análisis estadístico de datos. Está dirigido a personas que tengan interés en utilizar esta herramienta para la lectura, manipulación, análisis y gráfica de data.
Características del programa
Este programa académico para aprender a programar tiene una duración aproximada de 47 horas y está dividido en 4 semanas o módulos de estudio. Sin embargo, si en algún momento la carga se torna excesiva, los estudiantes podrán restablecer las fechas límite de entrega en función de sus horarios.
Durante el primer módulo, los estudiantes aprenderán a programar instalando los programas y herramientas (disponibles para Windows, MacOS o Linux) que necesitarán a lo largo del curso. Además, se revisará el temario del mismo. Los estudiantes también tendrán una introducción al lenguaje para entender qué son los objetos, las clases y los tipos de datos. Además de leer y escribir datos a distintas fuentes y tipos de archivo.
Después, en la segunda etapa del programa, los alumnos aprenderán a usar R. Así como a utilizar las estructuras de control para agilizar tareas repetitivas al programar y a crear funciones para llevar a cabo tareas específicas o complejas. También estudiarán reglas de alcance, manejo de fechas y variables de las mismas además de la importancia de utilizar operaciones vectorizadas para acelerar el funcionamiento del código.
En la tercer semana, los estudiantes conocerán una familia de funciones vectorizadas para efectuar operaciones con un número reducido de líneas de código. Después tendrán un acercamiento al sistema de gráficos y las funciones que permiten modificarlo. En el módulo final, aprenderán qué son las expresiones regulares y cómo se deben utilizar con R; graficarán con el paquete ggplot2; aprenderán a identificar y reparar errores; y llevarán a cabo una simulación.
Al término del curso los estudiantes serán capaces de utilizar R para la manipulación de datos, análisis estadístico y representación gráfica a través del procesamiento de datos cuantitativos.