En el dataset ‘./data/wb_bank_data_2019.csv’ tienen información construida por el Banco Mundial acerca de la distribución de la población ocupada según grandes sectores de actividad y categoría ocupacional:
SL.AGR.EMPL.ZS
: % total el empleo en agricultura:
consistente en las actividades de agricultura, silvicultura, caza y
pescaSL.IND.EMPL.ZS
: % total de empleo en industria: en
actividades de minas y canteras, manufacturas, construcción y energía,
gas y agua.SL.SERV.EMPL.ZS
% total de empleo el servicios
comprende comercio al por mayor y menor y restaurantes y hoteles,
transporte, almacenamiento y comunicaciones, finanzas, seguros,
servicios inmobiliarios y a las empresas y servicios personales,
sociales y comunales.SL.FAM.WORK.ZS
: % total de trabajadores familiaresSL.EMP.MPYR.ZS
: % total de empleadoresSL.EMP.SELF.ZS
: % total de independientes (cuenta
propias)SL.EMP.WORK.ZS
: % total de trabajadores
asalariados> library(tidyverse)
> df <- read_csv("./data/wb_bank_data_2019.csv")
Marx y Engels escribieron en “La ideología alemana”:
La división del trabajo dentro de una nación se traduce, ante todo, en la separación del trabajo industrial y comercial con respecto al trabajo agrícola y, con ello, en la separación de la ciudad y el campo y en la contradicción de los intereses entre una y otro. Su desarrollo ulterior conduce a la separación del trabajo comercial del industrial. (…) Las diferentes fases de desarrollo de la división del trahajo son otras tantas formas distintas de la propiedad; o, dicho en otros términos, cada etapa de la división del trabajo determina también las relaciones de los individuos entre sí, en lo tocante al material, el instrumento y el producto del trabajo…
Entonces, existe una relación entre el desarrollo capitalista y la
división del trabajo. Podemos intentar una primera medición de esta
relación a partir de la información del dataset. Para ello, vamos a
analziar la relación entre la proporción de población ocupada en la rama
agro (SL.AGR.EMPL.ZL
) y la proporción de asalariados
(SL.EMP.WORK.ZS
).
Importante: notar el formato de la tabla y pensar cómo debería formatearla para poder trabajarla de forma correcta.
> df <- df %>%
+ pivot_wider(id_cols = c(iso3c, iso2c, country), names_from = indicatorID, values_from = value)
> df %>%
+ ggplot(aes(x = SL.AGR.EMPL.ZS, y = SL.EMP.WORK.ZS)) + geom_point() + xlim(0,
+ 100) + theme_minimal()
> lm <- lm(SL.EMP.WORK.ZS ~ SL.AGR.EMPL.ZS, data = df)
> summary(lm)
##
## Call:
## lm(formula = SL.EMP.WORK.ZS ~ SL.AGR.EMPL.ZS, data = df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -45.217 -5.620 1.575 6.802 27.923
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 86.56534 1.23605 70.03 <2e-16 ***
## SL.AGR.EMPL.ZS -1.12767 0.03817 -29.55 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 11.4 on 185 degrees of freedom
## Multiple R-squared: 0.8251, Adjusted R-squared: 0.8242
## F-statistic: 873 on 1 and 185 DF, p-value: < 2.2e-16
> ###
> ###
> resid_plot <- tibble(resid_asal = residuals(lm), predict_asal = predict(lm, df),
+ asal_orig = df$SL.EMP.WORK.ZS)
>
> resid_plot %>%
+ ggplot(aes(x = predict_asal, y = resid_asal)) + geom_point() + xlim(-10, 100) +
+ theme_minimal()