Planteo del problema

Actualmente, en factor~data estamos trabajando en la realización de un análisis de la accesibilidad a los diferentes servicios de salud en Argentina, con especial énfasis en los grandes aglomerados urbanos. En ese sentido, buscamos abordar dos objetivos generales:

  • generar un mapa con el mayor nivel de desagregación posible de la accesibilidad a la salud
  • identificar los determinantes más importantes de esta accesibilidad

Datos disponibles a la fecha

Para ello, será necesario integrar diferentes fuentes de información. Actualmente, poseemos disponibles tres datasets con los 52.400 radios de todo el país. El primero de ellos (./data/radios_hogar.csv), contiene alguna información del Censo Nacional de Población y Vivienda del año 2010.

  • link
  • provincia
  • depto
  • hogares_sin_nbi
  • banio_uso_exclusivo
  • cocina_gas_red
  • desague_red_cloaca
  • techo_membrana
  • piso_ceramica_baldosa
  • agua_de_red
  • revestimiento_techo
  • agua_canieria_dentro
  • tiene_bano_o_letrina_si
  • inodoro_con_cadena
  • regimen_tenencia_propietario

Cada variable contiene la proporción de hogares dentro de cada radio que son clasificados en cada categoría. Fueron construidas sobre las preguntas del cuestionario de hogar del Censo. Pueden encontrar información sobre las definiciones de las variables aquí. Será necesario explorar el cuestionario del Censo y pensar qué otra información puede agregarse para el análisis.

El segundo dataset (también a nivel de radio censal, disponible en ./data/vuln_sanit.csv) contiene los tiempos de acceso en minutos a tres tipos de establecimientos de salud:

  • tpo_hospital: tiempo de acceso a hospitales (alta complejidad)
  • tpo_ctro_salud: tiempo de acceso a centros de salid (media complejidad)
  • tpo_posta: tiempo de acceso a postas sanitarias (baja complejidad)

Contiene, además, un campo (geometry) con la información vectorial para generar la georreferenciación de cada uno de los radios.

El dataset está tomado del sitio poblaciones.org y está basado en los datos construidos en el este paper. Hay, además, en este link una versión resumida en castellano.

El tercer dataset (disponible en ./data/env_eph.csv) permite identificar qué radio pertenece a cada uno de los aglomerados urbanos relevados por la Encuesta Permanente de Hogares.

El cuarto dataset (./data/distribucion_establecimientos_productivos.zip) está comprimido (deberán descomprimirlo para trabajarlo) y tiene como unidad de registro los establecimientos productivos obrantes en los registros administrativos del Sistema Integrado Previsional Argentino (SIPA) y de registros de AFIP, excepto en el caso de las exportaciones que provienen del sistema registral de la Aduana. Contiene las siguientes columnas:

  • cuit: Identificador - Anonimización del CUIT de la empresa a la que pertenece el establecimiento.
  • lat: Latitud redondeada del establecimiento
  • lon: Longitud redondeada del establecimiento
  • provincia_id: Código de la provincia
  • in_departamentos: Código del departamento
  • proporcion_mujeres: Proporción de mujeres en el establecimiento productivo
  • anio: Año al que refiere la información del establecimiento en cuestión.
  • quintil: Quintil de exportaciones de bienes en el que se ubica la empresa según el nivel de exportaciones del año en cuestión.
  • sucursal: Indicador único por sucursal de cada cuit. El par cuit-sucursal conforma un establecimiento.
  • empleo: Cantidad agrupada de empleo del establecimiento
  • clae6: Actividad de la empresa a nivel de seis dígitos (CLAE6)

Disponen de mayor información metodológica sobre este dataset en este link.

Preguntas orientadoras para ir avanzando…

Será necesario especificar el problema a abordar.

  • ¿Cómo definir la “accesibilidad” a servicios de salud?
  • ¿Cómo medirla de la forma más completa posible con la información disponible?
  • ¿Qué indicadores/dimensiones pueden plantearse como posibles determinantes de la accesibilidad a servicios de salud?
  • ¿Puede el grado de de diversidad económica (o dicho en términos clásicos, la división social del trabajo) de una zona (radio, fracción, departamento, etc.) ser un factor determinante del acceso a servicios de salud?
  • ¿Existe relación entre la división social del trabajo y el grado de urbanización de una zona dada?

Además, deberemos pensar en las fuentes de información

  • ¿Qué información podemos utilizar de los datasets disponibles para la pregunta por los determinantes de dicha accesibilidad?
  • ¿Qué otra información del CNPyV 2010 podemos utilizar para enriquecer el dataset?
  • ¿Cómo podemos diferenciar zonas urbanas de zonas no urbanas? ¿Cómo podemos identificar los grandes aglomerados urbanos?
  • ¿Qué tipo de dato tiene cada una de las fuentes? ¿Tienen el mismo nivel de agregación? ¿Las unidades son las mismas? ¿Cómo podemos compatibilizarlos?
  • ¿Existen otras fuentes que puedan ser útiles para construir posibles determinantes de la salud?

También deberemos abordar el diseño del análisis y modelado

  • ¿Qué técnicas deberemos utilizar para abordar los objetivos planteados? ¿Cómo identificar los determinantes de la accesibilidad? ¿Cómo debemos preprocesar los datos?
  • ¿Se trata de un problema de aprendizaje supervisado (de clasificación o de regresión), no supervisado o puede pensarse como una combinación de ambos?
  • ¿Qué métricas deberemos utilizar para evaluar el problema?
  • ¿Qué diseño de remuestreo será necesario para una correcta estimación de los errores?

Entregables finales

Al finalizar el trabajo, cada equipo deberá entregar

  • un informe de resultados en el que se expondrán los criterios metodológicos llevados adelante para abordar los objetivos, los problemas encontrados, las soluciones a los mismos y los resultados. La extensión máxima del informe será 15 carillas en formato Times New Roman 12, con interlineado 1.5 en hoja A4.
  • una presentación en formato Google Slides o similar en el que presetan (en 8 diapositivas como máximo) los principales resultados y problemas del estudio
  • el código utilizado en formato “reutilizable”

Fecha de presentación

  • 30 de Junio de 2025