Modulo 3: Machine Learning aplicado a las Ciencias Sociales
Docente
Presentación
Esta materia se constituye como la tercera de un trayecto de materias optativas orientado a incorporar a las carreras de la EIDAES un conjunto de materias que permitan realizar a les estudiantes un primer acercamiento al campo disciplinar conocido como “Ciencias Sociales Computacionales”. Por ello, se plantean como una continuación y profundización de la materia Metodologías Cuantitativas. En este sentido, la orientación es correlativa a las materias “Metodología de la Investigación” y “Metodologías Cuantitativas”.
El objetivo general de este tercer módulo es brindar un acercamiento a algunas técnicas avanzadas de modelado de datos y aprendizaje automático para la investigación empírica. Particularmente, se trabajará desde un enfoque conceptual (fundamentos teórico-metodológicos, casos y problemas de aplicación, etc.) y técnico (análisis de algoritmos, herramientas con interfaces gráficas, etc.).
El curso intenta brindar insumos que sirvan para que les estudiantes logren comprender los fundamentos conceptuales y metodológicos de algunas técnicas básicas de machine learning: clustering, árboles de decisión, bagging y boosting.
Tanto los contenidos de los ejercicios prácticos como las lecturas más conceptuales giran en torno de una misma temática, que para el primer semestre de 2023 será el análisis de la estructura social. Esta focalización en un único tema pretende facilitar la comprensión de métodos y técnicas y, al mismo tiempo, aportar a la formación sustantiva de les estudiantes.
Para el procesamiento y análisis estadístico se utilizará el lenguaje R y datos de la Encuesta Permanente de Hogares del INDEC.
Durante el curso se espera que les estudiantes:
- se familiaricen con aspectos conceptuales del entrenamiento de modelos de machine learning
- conozcan los fundamentos de los análisis de clustering
- logren implementar e interpretar algunos métodos de machine learning
- adviertan la posibilidad de aplicar este tipo de herramientas a problemas vinculados al análisis de la estructura social
- identifiquen situaciones de aplicación de este tipo de herramientas a problemas de investigación básica y aplicada
Programa
Contenidos y materiales
Clase 1. Presentación - Aprendizaje No Supervisado E1: PCA
- Diapositivas
- Explicación y práctica - Notebook
- Explicación y práctica - RMarkdown
- Práctica independiente - Notebook
- Práctica independiente - RMarkdown
Clase 2. Aprendizaje No Supervisado E2: Análisis de Correspondencias Múltiples (MCA)
- Diapositivas
- Explicación y práctica - Notebook
- Explicación y práctica - RMarkdown
- Práctica independiente - Notebook
- Práctica independiente - RMarkdown
- Bibliografía-Baranger
- Bibliografía-De la Fuente Fernández
Clase 3. Aprendizaje No Supervisado E3: Clustering K-Medias
- Diapositivas
- Explicación y práctica - Notebook
- Explicación y práctica - RMarkdown
- Práctica independiente - Notebook
Clase 4. Aprendizaje No Supervisado E3: Clustering Jerárquico y pŕactica
- Diapositivas
- Explicación y práctica - Notebook
- Explicación y práctica - RMarkdown
- Práctica independiente - Notebook
Clase 5. Introducción al flujo de trabajo supervisado
- Diapositivas
- Explicación y práctica Parte 1 - Notebook
- Explicación y práctica Parte 1 - RMarkdown
- Explicación y práctica Parte 2 - Notebook
- Explicación y práctica Parte 2 - RMarkdown
- Práctica independiente - Notebook
Clase 6. Árboles de decisión - CART
- Diapositivas
- Explicación y práctica - Notebook
- Explicación y práctica - RMarkdown
- Práctica independiente - Notebook
Clase 7. Ensamble Learning E1 - Bagging + Random Forest
Clase 8. Ensamble Learning E2 - Boosting
- Diapositivas Random Forest
- Diapositivas Boosting
- Explicación y práctica - Notebook
- Explicación y práctica - RMarkdown
- Explicación y práctica parte 2 - Notebook
- Explicación y práctica parte 2 - RMarkdown