Ecuador - Registro Estadístico de Empresas 2023 (Provisional)
ID del Estudio | ECU-INEC-DECON-REEM-2023-v1.3 |
Año | 2024 |
País | Ecuador |
Productor(es) | Instituto Nacional de Estadística y Censos (INEC) - Presidencia de la República del Ecuador |
Financiamiento | Instituto Nacional de Estadística y Censos (INEC) - INEC - Financiamiento de toda la operación estadística |
Colección(es) | |
Metadatos | Descargar DDI Descargar RDF |
Creado el | 03 Jun, 2024 |
Última modificación | 03 Jun, 2024 |
Visitas a la página | 18643 |
Descargas | 3019 |
- Descripción de la operación estadística
- Descripción de Variables
- Obtener Microdatos
- Materiales Relacionados
Procesamiento de datos
Edición de datos
La información por cada fuente se obtiene en diferentes formatos o diferentes motores de bases de datos, diferentes modos de transmisión; es por eso que se hace sustancial la intervención de procesos de Extracción, Transformación y Carga, ETL por sus siglas en inglés, que se encargan de transformar a toda la información y llevarla a la lógica definida en el DIEE.
Las herramientas de software con las que el DIEE trabaja son:
- Motor de Base de Datos para captación: Oracle Express Edition 10g
- Motor de Base de Datos para procesamiento: PostgresSQL 9.2
- Sistema de Gestión de Base de Datos: PgAdminIII 1.5
- Herramienta BI: Pentaho Data Integration 6.1
- Herramienta DQ: SQL Power DQguru
- Herramienta de análisis de información: SPSS 22
Para iniciar el procesamiento se prepara los siguientes documentos:
- Matriz de prioridades: corresponde a un documento que indica la priorización de actualización de variables conforme a su importancia dentro de la base de datos. Esto es, si es que la variable será destinada a la publicación, es relacionada con la publicación o no tiene ninguna relación.
En este mismo sentido, se elabora una matriz de prioridades por fuente de información, en la cual se detalla por variable, la jerarquía de las fuentes que actualizarán las variables existentes en la base de datos del REEM.
-Matriz de reglas: La matriz de reglas es un documento de guía para procesamiento, en el que se describe las acciones a seguir para el tratamiento de actualización de cada una de las variables que conforman la Base de Datos del Registro Estadístico de Empresas
- Plan de validación y tabulación: este documento evidencia la forma de validación y limpieza de las variables existentes en la base, además de identificar los tabulados que deberán ser elaborados con la información procesada para saber qué cantidad de datos se han subido con éxito y así poder ver si existe coherencia en la cantidad de información entre tablas de la base de datos.
Descripción del procesamiento:
La herramienta Pentaho es la que juega uno de los roles más importantes en esta fase debido a que aquí se trabaja con procesos ETL´s (Extracción, Transformación y Carga).
El procesamiento mediante la ejecución de ETL's consiste en los siguientes pasos:
i) Previo a la ejecución de los ETL´s, para extraer información válida y de mejor calidad para el REEM, se realiza el proceso de limpieza y depuración de la información, donde es necesario descartar registros al no acogerse a las reglas que deben cumplir las variables, por ejemplo los teléfonos para ser tomados en cuenta (de acuerdo al plan de validación).
ii) Creación de un repositorio alterno llamado PASO que contiene las tablas principales del REEM como son: la de empresa, unidad local y unidad legal. Su objetivo es actuar como puente de la información antes de llegar a la base final, ya que existen procesos que no se pueden ejecutar directamente en la base final.
iii) Inicialización de las tablas de PASO para cargar la información de la etapa de procesamiento, en la cual se cargará la información que tiene cambios con respecto a la base del REEM del año anterior y la nueva que será agregada a la base final.
iv) Se identifican las empresas y establecimientos tanto a los nuevos como a los antiguos, para poder así analizarlos por separado y ser procesados de distinta manera.
v) A las empresas y establecimientos antiguos, es decir, que ya fueron incorporados al directorio en años anteriores, se identifican las variables que han cambiado y necesitan ser actualizadas (de acuerdo al matriz de prioridades). A éstas se actualizan sus respectivas variables de control.
vi) Las empresas y establecimientos nuevos son insertados en PASO con un identificador interno único, para dar un seguimiento tanto de las empresas como de los establecimientos sin necesidad de utilizar el número de Registro Único de Contribuyentes - RUC. De igual manera se actualizan también sus respectivas variables de control.
vii) Cuando se tiene lista la información en el repositorio PASO se procede a actualizar las variables que cambiaron de las empresas y establecimientos antiguos y de los nuevos se insertan en la base del REEM (de acuerdo al matriz de prioridades).
viii) Para verificar y validar la información que se ha obtenido a partir del procesamiento se procede con conteos establecidos para verificar que la información sea consistente, si existen errores se procede a realizar un reprocesamiento de la base hasta que todos los errores sean subsanados por completo (de acuerdo al plan de validación y tabulación).
ix) Por último se procede con el congelamiento de la base de datos.
Este proceso se lo aplica sistemáticamente sobre las variables del directorio que sirven para la publicación, dentro de este proceso también se generan ciertas variables derivadas.
Otros procesamientos
1. ETAPA PREPARATORIA O PREVIA A LA CAPTACIÓN/RECOLECCIÓN:
Durante el año 2010, se participó activamente en capacitaciones técnicas con la finalidad de construir una metodología sólida para la creación de las bases de datos usadas en el Directorio de Empresas y Establecimientos. En el año 2011 se suscribieron acuerdos interinstitucionales con el Servicio de Rentas Internas (SRI) y el Instituto Ecuatoriano de Seguridad Social (IESS), que permitieron establecer y consolidar las bases de datos para la construcción del Directorio.
En el año 2018 se establecieron acuerdos con dos instituciones públicas para intercambiar información estas son: el Ministerio de Educación y del Servicio Nacional de Contratación Pública (SERCOP). El Ministerio de Educación proporciona información referente a instituciones públicas que contemplen el sostenimiento fiscal y fiscomisional y que pertenezcan a la educación pre básico, básico y bachillerato.
La planificación de la recolección de la información tanto para el año 2019, como para el 2020 fue realizada de acuerdo a los insumos: diseño de la recolección, tiempos de recolección, listado de empresas y sistema de call center; cuyos productos fueron un balance de recolección y bases de datos verificadas, que permitieron solventar con satisfacción esta etapa y proceder a la recolección.
Para el año 2021, debido a la culminación del convenio de intercambio de información interinstitucional suscritos con el SRI, se imposibilitó la transferencia de información del Servicio de Rentas Internas (SRI) al Instituto Nacional de Estadística y Censos (INEC). Razón por la cual, el Directorio de Empresas y Establecimientos (DIEE) dejó de contar con información de la variable “ventas totales”, procedente del SRI.
En este contexto, adicionalmente para los años 2021 y 2022 se recopiló información de otras fuentes como la Superintendencia de Compañías, Economía Popular y Solidaria, Superintendencia de Bancos, Encuesta Estructural Empresarial, entre otras; de los cuales se insume para el REEM lo siguiente:
• Ventas netas de bienes con tarifa cero
• Ventas netas de bienes con tarifa diferente de cero
• Ventas netas de servicios con tarifa cero
• Ventas netas de servicios con tarifa diferente de cero
• Exportaciones netas de bienes
• Exportaciones netas de servicios
• Ventas comisiones
• Ventas arrendamientos
• Ventas servicios construcción
Cabe subrayar que, a partir del año 2022, no todas las fuentes que se utilizan para recuperar información de ventas disponen esta desagregación de ventas como en el REEM, por lo que existe una subcobertura en la variable "exportaciones netas".
Para el año 2024 con información referida al año 2022. Es importante señalar que hasta abril 2024 no ha sido posible la renovación del convenio de intercambio de información interinstitucional entre el SRI y el INEC. No obstante, el REEM 2022 definitivo se construyó con información de ventas entregada de forma anonimizada y con estrato, cuya fuente de actualización es el SRI, también, se realizaron actualizaciones y validaciones internas con información de la Encuesta Estructura Empresarial (ENESEM). Además, se mantiene el uso de fuentes complementarias, tales como, la Superintendencia de Compañías, Superintendencia de Bancos (SBS), Superintendencia de Economía Popular Y solidaria (SEPS), Análisis REEM (AND) el cual es resultado de la investigación realizada por los miembros del equipo, mediante la información disponible en la web), etc.
Cabe señalar que, se completó la desagregación de la variable ventas, correspondiente a las ventas tarifa 0%, ventas tarifa 12%, exportaciones netas, ingresos por construcción, arrendamientos y comisiones, para los registros con fuente Análisis Estimación (ANE) y Superintendencia de Compañías (SCI). Por lo tanto, se eliminó la subcobertura de la variable exportaciones netas.
2. CAPTACIÓN/ RECOLECCIÓN DE LA INFORMACIÓN:
La recolección de la información desde las fuentes primarias (SRI e IESS) utilizan métodos de recolección automática, así la información que llega desde las fuentes externas fluye por un canal de comunicación propio para las instituciones públicas y que mediante el mismo se resguarda y se cumplimiento a la norma de confidencialidad de la información para datos sensibles.
Por parte del SRI, la información transferida corresponde a datos de la empresa, como el RUC; su ubicación geográfica; la persona de contacto, la actividad económica codificada según la Clasificación Internacional Industrial Uniforme, tipo de contribuyente.
La siguiente información dejo de ser remitida por la entidad antes mencionada desde el mes de marzo 2022: “Si la empresa realiza o no actividades de comercio exterior e información correspondiente a ventas, clasificadas según el tipo de gravamen: ventas netas con tarifa cero, ventas netas con tarifa diferente de cero, y exportaciones netas. Esta información tiene diferentes periodicidades de actualización, que varían desde actualizaciones diarias, a actualizaciones mensuales. Para suplir esta información; se procedió a recopilar información de fuentes externas disponibles, y además, se estableció métodos de imputación, a fin de aproximarse a la estructura real. La información obtenida fue incorporada a la base de datos del Directorio de Empresas 2021, de manera que su cobertura no se vea afectada. Estas fuentes son:
- Superintendencia de Compañías se recupera información de los balances anuales (2021) de las empresas que se rigen bajo esta institución.
- Superintendencia de Bancos se recuperó información de los Bancos a nivel nacional, que son regulados por esta institución.
- Superintendencia de Economía Popular y Solidaria, se recuperó información del sector financiero dentro del cual se encontraban cooperativas y mutualistas a nivel nacional.
- Servicios de Rentas Internas, se recuperó la última información que se obtuvo antes de la culminación del convenio.
- Encuesta Estructural Empresarial, se recuperó información disponible para grandes y medianas empresas, para el caso de las empresas PETROECUADOR Y PETROAMAZONAS.
Por parte del IESS la información que se transfiere al REEM corresponde al RUC, fecha de corte de información, número de establecimiento, dirección, teléfono, teléfono representante legal, número de afiliados hombres, número de afiliadas mujeres, remuneraciones de afiliados hombres, remuneraciones de afiliadas mujeres, número de días laborados con código de división política.
Por parte del Ministerio de Educación la información que se transfiere al REEM corresponde a un código de institución que será el punto clave para ingresar la información en el REEM este código identificará a la institución educativa en lugar del RUC que se maneja en el REEM; adicionalmente las variables: Nombre de institución, Nivel de educación, Zona, Provincia, cantón, parroquia, empleo promedio, empleo hombres, empleo mujeres, dirección institución, fecha de creación institución.
Por parte del SERCOP la información que se transfiere al REEM corresponde al RUC, Razón Social, provincia, cantón, parroquia, calle, intersección y número.
Adicionalmente, el REEM se alimenta de fuentes internas, principalmente de la información proveniente de las encuestas económicas realizadas por el INEC, como son:
- Censo Nacional Económico
- Encuesta anual de manufactura, minería y construcción
- Encuesta anual de comercio interno
- Encuesta anual de hoteles, restaurantes, servicios generales, de enseñanza y transporte.
- Encuestas Ambientales
- Equipo Call Center, el cual se encarga de capturar y verificar la información directamente con el informante de la empresa a través de llamadas telefónicas.
El Registro Estadístico de Empresas (REEM) se estructura tomando la información de diferentes fuentes, entre las principales se tiene: el SRI, IESS, Superintendencia de Compañías, Ministerio de Educación, bases de datos con verificaciones de Call Center, e información obtenida de operaciones estadísticas del INEC como son: Encuesta Estructural Empresarial.
Esta información es complementada y validada, en el proceso se utilizan matrices de equivalencias para lograr la correspondencia entre las codificaciones del REEM y los registros administrativos.
En el año 2024, para la construcción del Registro Estadístico de Empresas 2023 provisional se realizaron ajustes y cambios en el cálculo de variables derivadas solamente para la base provisional 2023: para el cálculo de la forma institucional, estrato de ventas y RIMPE10 se utiliza información del año 2022. Mientras que, para el cálculo del tamaño de empresas, origen de la estratificación y estructura para la estratificación, se considera la información de ventas y RIMPE del año 2022 y de plazas del 2023.
Bajo lo expuesto se calcularon indicadores referentes al número de empresas, plazas de empleo, empleo y remuneraciones, con sus respectivas desagregaciones. El plan de tabulados dispone información del número de empresas, plazas de empleo, empleo y masa salarial y en lo que respecta a la variable ventas los tabulados están vacíos.