Introducción

En el dataset ‘./data/wb_bank_data_2019.csv’ tienen información construida por el Banco Mundial acerca de la distribución de la población ocupada según grandes sectores de actividad y categoría ocupacional:

  • SL.AGR.EMPL.ZS: % total el empleo en agricultura: consistente en las actividades de agricultura, silvicultura, caza y pesca
  • SL.IND.EMPL.ZS: % total de empleo en industria: en actividades de minas y canteras, manufacturas, construcción y energía, gas y agua.
  • SL.SERV.EMPL.ZS % total de empleo el servicios comprende comercio al por mayor y menor y restaurantes y hoteles, transporte, almacenamiento y comunicaciones, finanzas, seguros, servicios inmobiliarios y a las empresas y servicios personales, sociales y comunales.
  • SL.FAM.WORK.ZS: % total de trabajadores familiares
  • SL.EMP.MPYR.ZS: % total de empleadores
  • SL.EMP.SELF.ZS: % total de independientes (cuenta propias)
  • SL.EMP.WORK.ZS: % total de trabajadores asalariados

1. Carguen los paquetes a utilizar

> library(tidyverse)

2. Carguen el dataset

> df <- read_csv("./data/wb_bank_data_2019.csv")

3. ¿Qué formato tiene el dataset?

División del trabajo y desarrollo capitalista

Marx y Engels escribieron en “La ideología alemana”:

La división del trabajo dentro de una nación se traduce, ante todo, en la separación del trabajo industrial y comercial con respecto al trabajo agrícola y, con ello, en la separación de la ciudad y el campo y en la contradicción de los intereses entre una y otro. Su desarrollo ulterior conduce a la separación del trabajo comercial del industrial. (…) Las diferentes fases de desarrollo de la división del trahajo son otras tantas formas distintas de la propiedad; o, dicho en otros términos, cada etapa de la división del trabajo determina también las relaciones de los individuos entre sí, en lo tocante al material, el instrumento y el producto del trabajo…

Entonces, existe una relación entre el desarrollo capitalista y la división del trabajo. Podemos intentar una primera medición de esta relación a partir de la información del dataset. Para ello, vamos a analziar la relación entre la proporción de población ocupada en la rama agro (SL.AGR.EMPL.ZL) y la proporción de asalariados (SL.EMP.WORK.ZS).

Importante: notar el formato de la tabla y pensar cómo debería formatearla para poder trabajarla de forma correcta.

> df <- df %>%
+     pivot_wider(id_cols = c(iso3c, iso2c, country), names_from = indicatorID, values_from = value)

4. ¿Existe una correlación entre ambas variables? ¿Cómo lo podrían evaluar? Describa la relación

> df %>%
+     ggplot(aes(x = SL.AGR.EMPL.ZS, y = SL.EMP.WORK.ZS)) + geom_point() + xlim(0,
+     100) + theme_minimal()

5. Si consideran que tiene sentido, corran una regresión entre ambas variables

> lm <- lm(SL.EMP.WORK.ZS ~ SL.AGR.EMPL.ZS, data = df)

5. Impriman una tabla resumen de la regresión

> summary(lm)
## 
## Call:
## lm(formula = SL.EMP.WORK.ZS ~ SL.AGR.EMPL.ZS, data = df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -45.217  -5.620   1.575   6.802  27.923 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    86.56534    1.23605   70.03   <2e-16 ***
## SL.AGR.EMPL.ZS -1.12767    0.03817  -29.55   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 11.4 on 185 degrees of freedom
## Multiple R-squared:  0.8251, Adjusted R-squared:  0.8242 
## F-statistic:   873 on 1 and 185 DF,  p-value: < 2.2e-16

6. Interpreten los coeficientes

> ###

7. ¿Qué ajuste tiene la regresión?

> ###

8. Generen e interpreten un residual plot

> resid_plot <- tibble(resid_asal = residuals(lm), predict_asal = predict(lm, df),
+     asal_orig = df$SL.EMP.WORK.ZS)
> 
> resid_plot %>%
+     ggplot(aes(x = predict_asal, y = resid_asal)) + geom_point() + xlim(-10, 100) +
+     theme_minimal()