6.1 Geolocalización
El primer paso consiste en geocodificar las direcciones proporcionadas por los encuestados y verificar que las mismas coinciden con los segmentos cartográficos seleccionados. En caso de que algunas direcciones no tengan una precisión a nivel de segmento cartográfico, entonces será necesaria una revisión clerical para verificar las direcciones proporcionadas por los encuestados.
El paquete tidygeocoder (Cambon et al. 2021) puede ser útil para esa tarea, a continuación se presenta un ejemplo de juguete con cinco (5) direcciones en el departamento de Chuquisaca, Bolivia.
library(pacman)
p_load(dplyr, tidygeocoder)
datos <- tribble(
~DIRECCION, ~MUNICIPIO,
"Av. Jaime Mendoza 123", "Sucre",
"Calle Bolívar 456", "Monteagudo",
"Plaza 25 de Mayo 789", "Camargo",
"Av. del Maestro 321", "Villa Serrano",
"Calle Potosí 654", "Zudáñez"
)
datos |>
mutate(addrs = paste0(DIRECCION, ", ", MUNICIPIO, ", Bolivia")) |>
geocode(addrs, method = "arcgis")## # A tibble: 5 × 5
## DIRECCION MUNICIPIO addrs lat long
## <chr> <chr> <chr> <dbl> <dbl>
## 1 Av. Jaime Mendoza 123 Sucre Av. Jaime Mendoza 123, Sucre,… -19.0 -65.3
## 2 Calle Bolívar 456 Monteagudo Calle Bolívar 456, Monteagudo… -19.8 -64.0
## 3 Plaza 25 de Mayo 789 Camargo Plaza 25 de Mayo 789, Camargo… -18.0 -62.7
## 4 Av. del Maestro 321 Villa Serrano Av. del Maestro 321, Villa Se… -19.1 -64.3
## 5 Calle Potosí 654 Zudáñez Calle Potosí 654, Zudáñez, Bo… -19.0 -64.8
En caso de que algunos de los puntos de longitud y latitud no queden dentro de los segmentos de la muestra P, los revisores clericales deben verificar las direcciones y establecer si hay descritos algunos puntos de referencia que no se usaron durante el procesamiento automatizado que hubiera afectado la precisión del proceso automático. Los resultados de la geocodificación se utilizan durante el proceso de emparejamiento para identificar áreas de búsqueda alrededor de la dirección proporcionada por el encuestado.
Durante el proceso de geocodificación manual, los revisores asignan una coordenada que permita una mayor precisión. Si no es posible lograr una precisión que apunte a una UPM específica de la muestra P, entonces la misma podrá asociarse a más de una UPM para crear áreas de búsqueda que abarquen dicha dirección. Asimismo, es recomendable que se asigne un código que refleje el nivel de confianza que el revisor manual considera que hay en que la dirección se encuentra dentro del área de búsqueda.
Es recomendable que el emparejamiento automático de personas incluya los geocódigos asignados a las direcciones proporcionadas por los encuestados, así como los nombres, apellidos, la edad, el sexo, el día y mes de nacimiento. Otra información que puede ser usada en el proceso son: los números de teléfono de los encuestados del hogar, datos geográficos como el departamento, municipio o código del segmento. Con este propósito se puede usar un modelo de vinculación probabilística de registros conocido como record linkage.
Con el objetivo de examinar la completitud de los nombres, es recomendable que el nombre o apellido se considere suficiente cuando la combinación del primer y segundo nombre, así como la combinación de los apellidos, tengan al menos dos caracteres cada uno. Posteriormente, los revisores clericales deben analizar todos los registros marcados como insuficientes y actualizar los nombres cuando sea posible. Por ejemplo, puede haberse registrado el primer nombre de un niño pero no su apellido, el revisor clerical podrá completar el apellido basándose en el de los padres cuando el parentesco sea determinado. En estos casos, se podrá cambiar el estado de insuficiente a suficiente.
Al finalizar este procesamiento, cada persona de la muestra P y cada persona de la muestra E deben ser codificadas como coincidencia, posible coincidencia, duplicado, posible duplicado o sin coincidencia, y al finalizar la revisión clerical, se usarán los vínculos asignados a las personas de la muestra P y muestra E como insumos para estimar la cobertura neta de la población y sus componentes.