Ecuador - Directorio de Empresas y Establecimientos 2011
ID del Estudio | ECU-INEC-DIEC-DIEE-2011-v1.6 |
Año | 2011 |
País | Ecuador |
Productor(es) | Instituto Nacional de Estadística y Censos (INEC) - Secretaría Nacional de Planificación y Desarrollo (SENPLADES) |
Financiamiento | Instituto Nacional de Estadística y Censos (INEC) - INEC - Financiamiento de toda la operación estadística |
Colección(es) | |
Metadatos | Descargar DDI Descargar RDF |
Creado el | 07 Jun, 2016 |
Última modificación | 09 Jun, 2016 |
Visitas a la página | 513921 |
Descargas | 933109 |
- Descripción de la operación estadística
- Descripción de Variables
- Obtener Microdatos
- Materiales Relacionados
Procesamiento de datos
Edición de datos
La plataforma informática del Directorio no solo funciona como plataforma de recolección de datos, sino también como una plataforma de procesamiento y difusión.
La plataforma está construida con tecnología data warehouse, idónea para recolectar e integrar datos de distintas fuentes para integrarlos en un solo repositorio ya que considera procesos para realizar carga, transformación y depuración desde las fuentes. Adicionalmente, simplifica el problema de acceso a la información y en consecuencia, acelera el proceso de análisis y disminuye el tiempo en la realización de consultas.
El procesamiento de la información se realiza en varias etapas que se detalla a continuación:
1. Transimisión de datos desde las fuentes y actualización de la información
2. Validación de la información
3. Archivo de la información
4. Conformación del directorio
1. Transimisión de datos desde las fuentes y actualización de la información
1.1 La infomarción que se transmite desde las fuentes es filtrada en el data ware house además de un filtro manual. Los datos que no cumplen los estándares de formato, valores, de completitud, entre otros, a efectos de incrementar la calidad de los datos y hacer más eficientes los procesos.
1.2 Se actualiza la información (variables del Directorio) en función de la fuente de la fuente que las provee, a saber:
- El Servicio de Rentas Internas (SRI) provee de las variables de identificación, estratificación, ubicación, entre otras.
- El Instituto Ecuatoriano de Seguridad Social (IESS) provee la variable de personal ocupado (afiliado).
2. Validación de la información
2.1 La información de actualización que llega de las fuentes, y que por algún motivo es discriminada por el primer filtro del data ware house, son actualizadas por el personal del call center.
2.1.1 Validación del data ware house
- Esta actividad se realiza utilizando las reglas de consistencia, validación y códigos, definidos para cada variable de cada fuente de acuerdo a la metodología.
2.1.2 Validación manual
- La validación se realiza a la información que por algún motivo evidencian inconsistencias reportadas automáticamente por la herramienta de carga y actualización, o información nueva que necesite ser verificada. Esta información es asignada al grupo de verificadores (call center) con cargas mensuales y reportes de cobertura y novedades semanales.
- La función del call center consiste en establecer contacto con las fuentes vía telefónica, páginas web institucionales de las mismas fuentes, y de fuentes secundarias como Superintendencia de Compañías, Cámaras de la Producción, Gremios, Asociaciones, entre otras, a fin de asegurar la calidad de los datos. A su vez, la información modificada se considera como otra fuente de actualización e ingreso al Directorio.
- Una vez validada la información, ésta es incorporada en la base del Directorio, que constituye una fuente de datos para el análisis económico, así como un marco muestral para realizar otras investigaciones.
3. Archivo de la información.-
El Directorio, es un respositorio de información que archiva, actualiza y valida información automáticamente con un sistema personalizado. Su plataforma es:
· Base de datos: Postgres V 9
· ETL (herramienta para extracción, transformación y carga): Pentaho V3.6, BI server V 2.0
· Sistema Operativo: Centos V 5.4
4. Conformación del directorio
En base a los procesos descritos, se obtiene el Directorio de empresas que:
- Funciona como marco muestral para investigaciones económicas.
- Provee información oficial y actualizada de las empresas y establecimientos del país de manera continua.
- Provee de la estructura del sector productivo y demografía de empresas.
- Sirve como insumo para cuentas nacionales.
Otros procesamientos
La fase de recolección comprende dos etapas:
1.- Etapa de organización y planificación
2.- Recolección de la información
3.- Actualización de la información.
1.- Etapa de organización y planificación:
El diseño, construcción e implementación del Directorio ha implicado:
1.1 Definir los usos y usuarios del Directorio.
1.2 Disponer de un análisis completo sobre la situación actual de los Directorios de Empresas en los países miembros de la CAN.
* Para mayor detalle respecto a análisis realizado y los resultados obtenidos, remítase al documento "Informe del Estudio sobre Directorio de Empresas INEC 2009", provisto como material de referencia externo.
1.3 Determinar la disponibilidad de información de las fuentes para la actualización permanente del directorio.
1.4 Definir la cobertura, variables, actualizaciones y la estructura del Directorio tanto técnica como informáticamente.
* Para mayor detalle respecto a la definición de la cobertura, variables, actualizaciones y la estructura del Directorio, remítase al documento "Informe del Estudio sobre Directorio de Empresas INEC 2009", provisto como material de referencia externo.
1.5 Establecer las posibles fuentes para el Directorio
* Para mayor detalle respecto a análisis realizado y los resultados obtenidos, remítase al documento "Informe del Estudio sobre Directorio de Empresas INEC 2009", provisto como material de referencia externo
1.6 Establecer la necesidad de acuerdos o convenios con las instituciones seleccionadas como fuentes de información del Directorio para el envío de información periódica.
1.7 Definir los procesos de actualización del DIEE tomando como base principalmente las características de la información a ser recibida de la fuente fiscal.
* Para mayor detalle respecto a los procesos de actualización, remítase a los documentos "Metodología de carga Instituto Ecuatoriano de Seguridad Social (IESS)" y "Metodología de carga Servicio de Rentas Internas (SRI), provistos como materiales de referencia externo.
1.8 Contratar servicio de red para la transmisión de datos (anillo interministerial).
En los subprocesos del macro proceso de Organización y preparación del Directorio, hay procesos transversales, a saber:
- La investigación, desarrollo e implementación de sistemas informáticos, la continua capacitación del talento humano, y el análisis de la condiciones legales, presupuestarias, entre otras.
2.- Recolección y actualización de la información:
2.1 El Directorio de Empresas y Establecimientos (DIEE) recopila datos de registros administrativos provenientes de instituciones estatales, a saber:
- Servicio de Rentas Internas (SRI): Variables de identificación, estratificación, ubicación, entre otras.
- El Instituto Ecuatoriano de Seguridad Social (IESS): Variable de personal ocupado (afiliado).
- Eventualmente se prevé, que el Directorio se alimente de encuestas internas estructurales y coyunturales del INEC que actúan como fuentes de información
2.2 El conjunto de datos proveniente de estas instituciones, fluye a través la red de transmisión de datos (anillo interministerial) de manera permanente y automática mediante conexión directa a las fuentes.
* A efectos de entender con mayor claridad el modo en que se recolectan los datos desde las distintas fuentes hacia el Directorio, remítase a al documento "Ilustración gráfica del proceso de recolección de datos"
3. Actualización de información:
La actualización de información involucra dos actividades:
3.1 Incorporar al Directorio nuevos registros completos de unidades legales, empresas y unidades locales, interrelacionadas entre sí. La agregación de nuevos los nuevos registros trae consigo sus respectivas variables de identificación, ubicación, dirección, estratificación y demografía.
3.2. Actualizar los valores de una o más variables de las ya existentes en el directorio.
3.2.1 La información desde las fuentes a un repositorio temporal en el DIEE con periodicidad diaria y mensual dependiendo del tipo de información y la fuente, es decir:
- El Servicio de Rentas Internas (SRI), proporciona información de identificación, ubicación, estratificación, entre otras, con periodicidad diaria.
- El Instituto Ecuatoriano de Seguridad Social (IESS), proporciona información con periodicidad mensual de personal ocupado (afiliado), que corresponde al antepenúltimo mes en relación al periodo de referencia, así por ejemplo:
Si el mes de entrega es junio 2012, la información corresponde a abril del 2012.
3.3 Los procesos de actualización, están sujetos a verificación y se guardan datos históricos para estudiar la historia de una empresa (análisis longitudinal) en el tiempo.