Ecuador - Estadísticas de Transportes 2020
ID del Estudio | ECU-INEC-DECON-ANET-2020-V1.3 |
Año | 2020 |
País | Ecuador |
Productor(es) | Instituto Nacional de Estadística y Censos (INEC) - Presidencia de la República del Ecuador |
Financiamiento | Instituto Nacional de Estadística y Censos - INEC - Financiamiento de toda la operación estadística |
Colección(es) | |
Metadatos | Descargar DDI Descargar RDF |
Creado el | 05 Apr, 2022 |
Última modificación | 05 Apr, 2022 |
Visitas a la página | 29703 |
Descargas | 6477 |
- Descripción de la operación estadística
- Descripción de Variables
- Obtener Microdatos
- Materiales Relacionados
Procesamiento de datos
Edición de datos
Para el procesamiento de datos es importante identificar y clasificar a las variables según su función: identificación, comunicación, cronológicas y estadísticas (cuantitativas y cualitativas), ya que de acuerdo a ello se generan algoritmos estandarizados que ayuden a la automatización de las tareas de transformación de registros administrativos en registros estadísticos. Cada BDD dentro de la fase de procesamiento estadístico pasan por el siguiente proceso:
* Proceso de perfilamiento. - Tiene como objetivo identificar anomalías 'de forma' presentes en cada variable (diseño-formato), revisándose principalmente lo siguiente: números en textos, texto en números, separador de fechas, decimal, etc.
* Proceso de corrección (diseño-formato). - Las anomalías encontradas en el perfilamiento son corregidas, sin alterar la esencia de las bases de datos.
* Proceso de estandarización. - La estandarización se aplica únicamente a las variables categóricas, consiste en la codificación, o categorización de información de Registros Administrativos de acuerdo a catálogos nacionales o internacionales; esto se hace uso de la herramienta METADEC4 desarrollada por el INEC.
* Proceso de precisión. - Se validan los datos de identificación directa5, para lo cual se cruza con los datos de identificación auxiliar (nombres y apellidos, razón social, nombre comercial, entre otras) de una fuente primaria (Registro Civil en el caso de personas) y a través de algoritmos probabilísticos y determinísticos se establecen tres grupos de registros: con id. Incorrectos 6, con ID. Válidos y verdaderos (id. correcto cuyos datos corresponden a la misma persona) y, con ID. Válidos pero falsos (id. correcto pero cuyos datos no corresponden a la persona).
Los casos con ID. Incorrectos y con ID. Válidos pero falsos se recuperan a través de métodos de integración determinísticos o probabilísticos (utilizando las variables: nombres, fecha y lugar de nacimiento) de la fuente primaria.
* Proceso de coherencia (validación y rectificación). - Son dos actividades que se desarrollan de forma consecutiva: la validación es la revisión de valores entre variables (Ej. Comparar el estado civil en función de la edad, y a rectificación en función de los procesos previos ejecutados.
* Proceso de conversión. - Generación de nuevas variables, a través de la recodificación de variables o cálculos matemáticos entre variables, de manera que las direcciones del INEC que consumen estas bases de datos reciban variables creadas bajo un mismo criterio.
* Proceso de unicidad. - Se identifican casos duplicados y se los depura, con el fin de contar con un registro por cada caso (hecho).
* Proceso de integración. - Se integran las variables nuevas y las existentes provenientes de otras fuentes, con dos propósitos: 1) robustecer el análisis temático con nuevas variables, y 2) mejorar la exactitud de las variables ya existentes. En esta fase se utilizan métodos determinísticos, usando de variables de identificación directa. Para llevar a cabo la integración es importante establecer por cada variable la fuente principal y las secundarias, en base a criterios de: mandato legal, oportunidad y disponibilidad.
* Proceso de seudonimización. - Con el objetivo de disponer de las bases de datos para el análisis y cuidar la confidencialidad 7 de la información, se procede con el reemplazo de la variable de identificación directa y eliminación de las variables de identificación auxiliares, tales como: nombres y apellidos, razón social, nombre comercial, entre otras. Este proceso permite oculta la identificación directa del individuo y garantiza la vinculación con otros registros administrativos (INEC, 2015b).
En esta fase de la producción del Anuario de Transporte (ANET), se realiza la validación de la información captada, previo la generación de productos a publicarse.
1.- Crítica e integración de la base de datos. - Para la crítica del ANET 2017 se considera las siguientes acciones:
- Revisión de formatos establecidos para la entrega de la información
- Revisión del número de variables requeridas
- Revisión de datos omitidos
La integración de las bases de datos se realiza de manera homologada en función de la información entregada por cada una de las fuentes de información:
2.- Clasificaciones y/o codificaciones
Para la clasificación y codificación de las variables suministradas en los distintos registros administrativos, se realiza y/o actualiza las sintaxis de codificación (en SPSS o STATA), a fin de garantizar homologación y consistencia (con las publicaciones de años anteriores) en la asignación de las categorías requeridas para la presentación de resultados, por ejemplo: Clase de vehículos, tipo de cargas, otras.
3.- Validación e imputación
Para este proceso se aplica estadística descriptiva y otras herramientas para el análisis de consistencia de la información de los principales resultados.
Validación. - Una vez criticada la información de vehículos matriculados, transporte ferroviario, transporte aéreo, transporte marítimo y fluvial y siniestro de tránsito, es sometida a análisis y validación en su totalidad de acuerdo a los siguientes pasos:
- Revisión de consistencia de información
- Derivación de nuevas variables
- Generación y revisión de tabulados preliminares
- Generación y revisión de indicadores
- Generación de archivos preliminares
Imputación. - Para este periodo, en relación a Vehículos Matriculados se efectuó un proceso de imputación de información para las variables de capacidad de pasajeros y capacidad de carga, cuyos registros fuesen valores perdidos, valores atípicos y valores cero.
Este ejercicio se estableció principalmente en una imputación aleatoria de los datos "missing", basados en el modelo "Hot-Deck" cuyo procedimiento consiste en el reemplazo de los valores perdidos por otro registro ya existentes en la muestra para reemplazarlo. (Little, R.J.A. & Rubin, D.B., 2002). Utilizando como variable de estratificación para el modelo la Clase de Vehículo, esto con el fin de que los valores a ser reemplazados sean por otros de la misma clase.
Otros procesamientos
La actividad previa al procesamiento estadístico es la transferencia y recopilación de datos desde las fuentes administrativas, para lo cual se establecen escenarios de transferencia (identificación de herramientas para entrega recepción de información y actores que intervienen) que permitan el acceso oportuno a los datos y se preserve los principios de confidencialidad, Integridad y disponibilidad de la información. El proceso de recolección se desarrolla de acuerdo a los procesos que se detallan:
Planificación de la captación. - Es el acercamiento del INEC con las distintas instituciones para analizar el estado de las distintas fuentes de información y calendarizar las fechas de solicitud oficial, entregas parciales, validación y entregas finales de la información.
Procesos de captación
- Para el registro de información de vehículos motorizados matriculados y siniestros de tránsito, la ANT realiza el registro de datos a través de varios sistemas informáticos, y el traspaso de bases de datos al INEC se ejecuta bajo los procesos detallados en los anexos 5 y 8, respectivamente.
- Con respecto al número de pasajeros nacionales y extranjeros transportados en ferrocarriles la información proviene de los registros administrativos de cada filial de Ferrocarriles del Ecuador EP; la filial Centro es la encargada de consolidar estos registros y el proceso de traspaso al INEC se detalla en el anexo 6.
- La obtención la información de transporte aéreo es a través del Boletín Estadístico de Tráfico Aéreo que publica anualmente la Dirección de Aviación Civil.
- Finalmente, en lo que se refiere a transporte marítimo y fluvial los datos son recolectados por cada Entidad Portuaria y Superintendencia Petrolera siendo el ente regulador la Subsecretaría de Puertos y Transporte Marítimo y Fluvial. El traspaso al INEC se detalla en el anexo 7.
Es importante mencionar que, si la información está incompleta o se detecta inconsistencias en los registros administrativos, el INEC, a través de la Dirección de Estadísticas Económicas se encarga de solicitar la aclaración a fin de que cada institución informante complete o corrija los datos; este proceso se hace vía correo electrónico, llamada telefónica, o reuniones técnicas interinstitucionales. Toda la información recolectada es remitida al INEC para su revisión, procesamiento y difusión.