La integración de datos para el análisis es el proceso de combinación de datos de diversas aplicaciones, en formatos de datos diferentes, de múltiples ubicaciones, para que los usuarios y los sistemas identifiquen de forma más fácil las correlaciones y obtengan una visión más completa del rendimiento operativo o empresarial. La integración comienza con el proceso de ingestión de datos e incluye pasos secuenciales, como limpieza, preparación, asignación de extracción, transformación y carga (ETL, Extract, Transform, Load) y transformación.
Por ejemplo, la integración de los datos de los clientes conlleva la extracción de información sobre cada cliente individual de sistemas empresariales dispares, como ventas, contabilidad y marketing. Dicha información luego se combina en una única vista del cliente para ser utilizada en el servicio al cliente, programas de lealtad y oportunidades de incrementos de venta y de venta cruzada.
Como estrategia, la integración de datos es el primer paso para transformar los datos sin procesar en información valiosa y significativa. La integración de datos permite a las empresas combinar datos de diversas aplicaciones, en formatos diferentes, de múltiples ubicaciones para que los analistas y científicos de datos identifiquen con más facilidad las correlaciones y los conocimientos a fin de obtener una mejor visión del rendimiento operativo y empresarial.
Una plataforma de integración de datos consta de un software utilizado y administrado principalmente por profesionales de TI. Permite recopilar, ordenar y transformar datos de diversas aplicaciones, en formatos diferentes y varias ubicaciones para que se puedan aplicar a diversos resultados empresariales. Los resultados se pueden enviar a usuarios específicos, unidades de negocio, socios estratégicos, aplicaciones o soluciones prospectivas, y se pueden ver en informes o paneles de análisis.
Un diagrama de flujo de datos (DFD, Data Flow Diagram) es una forma de representar cómo fluyen los datos a través de un proceso o sistema. Incluye entradas y salidas de datos, almacenes de datos y los diversos subprocesos por los cuales pasan los datos. Los diagramas de flujo de datos se crean utilizando símbolos y notaciones estandarizados para describir diversas entidades y sus relaciones.
Una herramienta de integración de datos empresariales para análisis incluye el software utilizado para realizar procesos de integración de datos de distintas aplicaciones, en formatos de datos diferentes y de varias ubicaciones. Estas herramientas realizan la limpieza, la preparación, la transformación y la asignación de datos. Las herramientas más ideales se deben diseñar para satisfacer sus requisitos de integración de datos de la periferia al núcleo y a las nubes múltiples, y debe incorporar una arquitectura de metadatos que admita el gobierno de datos.