Actualmente, en factor~data estamos trabajando en la realización de un análisis de la accesibilidad a los diferentes servicios de salud en Argentina, con especial énfasis en los grandes aglomerados urbanos. En ese sentido, buscamos abordar dos objetivos generales:
Para ello, será necesario integrar diferentes fuentes de información.
Actualmente, poseemos disponibles tres datasets con los 52.400 radios de
todo el país. El primero de ellos
(./data/radios_hogar.csv), contiene alguna información del
Censo Nacional de Población y Vivienda del año 2010.
linkprovinciadeptohogares_sin_nbibanio_uso_exclusivococina_gas_reddesague_red_cloacatecho_membranapiso_ceramica_baldosaagua_de_redrevestimiento_techoagua_canieria_dentrotiene_bano_o_letrina_siinodoro_con_cadenaregimen_tenencia_propietarioCada variable contiene la proporción de hogares dentro de cada radio que son clasificados en cada categoría. Fueron construidas sobre las preguntas del cuestionario de hogar del Censo. Pueden encontrar información sobre las definiciones de las variables aquí. Será necesario explorar el cuestionario del Censo y pensar qué otra información puede agregarse para el análisis.
El segundo dataset (también a nivel de radio censal, disponible en
./data/vuln_sanit.csv) contiene los tiempos de acceso en
minutos a tres tipos de establecimientos de salud:
tpo_hospital: tiempo de acceso a hospitales (alta
complejidad)tpo_ctro_salud: tiempo de acceso a centros de salid
(media complejidad)tpo_posta: tiempo de acceso a postas sanitarias (baja
complejidad)Contiene, además, un campo (geometry) con la información
vectorial para generar la georreferenciación de cada uno de los
radios.
El dataset está tomado del sitio poblaciones.org y está basado en los datos construidos en el este paper. Hay, además, en este link una versión resumida en castellano.
El tercer dataset (disponible en ./data/env_eph.csv)
permite identificar qué radio pertenece a cada uno de los aglomerados
urbanos relevados por la Encuesta Permanente de Hogares.
El cuarto dataset
(./data/distribucion_establecimientos_productivos.zip) está
comprimido (deberán descomprimirlo para trabajarlo) y tiene como unidad
de registro los establecimientos productivos obrantes en los registros
administrativos del Sistema Integrado Previsional Argentino (SIPA) y de
registros de AFIP, excepto en el caso de las exportaciones que provienen
del sistema registral de la Aduana. Contiene las siguientes
columnas:
cuit: Identificador - Anonimización del CUIT de la
empresa a la que pertenece el establecimiento.lat: Latitud redondeada del establecimientolon: Longitud redondeada del establecimientoprovincia_id: Código de la provinciain_departamentos: Código del departamentoproporcion_mujeres: Proporción de mujeres en el
establecimiento productivoanio: Año al que refiere la información del
establecimiento en cuestión.quintil: Quintil de exportaciones de bienes en el que
se ubica la empresa según el nivel de exportaciones del año en
cuestión.sucursal: Indicador único por sucursal de cada cuit. El
par cuit-sucursal conforma un establecimiento.empleo: Cantidad agrupada de empleo del
establecimientoclae6: Actividad de la empresa a nivel de seis dígitos
(CLAE6)Disponen de mayor información metodológica sobre este dataset en este link.
Será necesario especificar el problema a abordar.
Además, deberemos pensar en las fuentes de información
También deberemos abordar el diseño del análisis y modelado
Al finalizar el trabajo, cada equipo deberá entregar