Todos los blogs

Descubrimiento y fiabilidad de los datos para mejorar la toma de decisiones empresariales

Liam Yu
Senior Product Solutions Marketing Manager, Integrated Systems

25 de septiembre de 2023


Las empresas se ahogan en datos. Los datos estructurados, semiestructurados o no estructurados de las empresas modernas impulsadas por los datos lo son todo, en todas partes y a la vez. Pero eso también supone un reto para las empresas que buscan transformar sus datos en información útil para el éxito empresarial.

El enorme volumen de datos está poniendo a prueba la capacidad de las empresas para encontrar datos fiables y fidedignos que impulsen sus decisiones empresariales. Los catálogos de datos tradicionales sólo ofrecen descubrimiento de datos estructurados. No existe una solución integral que ayude a las organizaciones a descubrir datos fiables de todo tipo.

Lo que se necesita es una solución que reúna los tres componentes clave del rompecabezas del reto de los datos: descubrimiento de datos, observabilidad de los datos y fiabilidad de los datos.

Estos tres componentes también coinciden cada vez más con las necesidades de las empresas de aplicar los datos para mejorar el rendimiento laboral, tomar decisiones empresariales acertadas y obtener valor de los datos de que disponen.

Descubrimiento de datos

Tanto si los datos están en un documento PDF como en un documento de Word, en una base de datos relacional, en un registro o en una telemetría registrada por una máquina, la empresa típica tiene enormes cantidades de ellos. Un estudio reciente calculó el volumen total de datos almacenados por una empresa típica en 10 petabytes (PB) -una cantidad equivalente a más de 23.000 millones de archivos-, de los cuales más de la mitad (52% ) se consideraban datos oscuros, lo que significa que son datos a los que no se ha asignado valor alguno.

La razón de esa cantidad de datos sin clasificar es sencilla: No hay tiempo suficiente en el día para que nadie, en ninguna empresa, dedique tiempo a comprender qué porcentaje de sus datos es valioso para la organización. Recopilar e integrar esos datos suele implicar extraerlos manualmente de distintas fuentes, formatos, proveedores de sistemas y una variedad de ubicaciones on-prem, a través de múltiples nubes y arquitecturas de borde.

El concepto de descubrimiento de datos es sinónimo de lectura o elaboración de perfiles de esos datos. Las nuevas herramientas de software de inteligencia artificial (IA) y aprendizaje automático (ML), como Pentaho Data Catalog, permiten a las empresas automatizar la clasificación, el etiquetado y la gestión de archivos de datos para comprender la calidad de sus datos. Estas herramientas permiten a las empresas comprender el contenido y el contexto de los datos mediante la generación de información sobre esos datos o sus metadatos. Por ejemplo, podría revelar cuántas veces se menciona el nombre de alguien en los historiales médicos de los pacientes de un hospital. O podría descubrir el número de veces que se utiliza la frase "tipo de interés" en los registros financieros de un cliente.

Esto es crucial para las empresas que buscan determinar cuántos de sus datos tienen valor para su negocio, influyen en los resultados positivos de los clientes o generan mejores procesos empresariales. Solo mediante la automatización del proceso de descubrimiento de datos pueden las empresas dar el primer paso para captar ese tipo de información sobre sus datos.

Observabilidad de los datos

El segundo pilar de una estrategia de datos eficaz es garantizar que los datos sean visibles y tengan sentido para los usuarios de la empresa. La observabilidad de los datos permite supervisar su uso en toda la empresa. Esta supervisión es fundamental para responder a preguntas como: ¿Quién utiliza los datos? ¿Dónde se originaron los datos? ¿Se han modificado? Y si se han modificado, ¿cuándo, dónde, por qué y por quién?

La observabilidad de los datos proporciona a las empresas la capacidad de rastrear y registrar cada archivo de datos, documento o registro. Armadas con esa información, las empresas pueden crear una línea de base para el comportamiento normal. Este conocimiento es fundamental para proteger a la empresa contra los ciberataques. Facilita a la empresa la identificación de comportamientos anormales o anómalos potencialmente amenazadores.

La observabilidad de los datos también permite a las empresas identificar los datos que, una vez recopilados, nunca se han tocado ni consumido. Datos "oscuros" o "muertos" que quizá nunca tengan valor para la empresa. Las empresas pueden determinar si esos datos no consumidos deben trasladarse a medios de almacenamiento menos costosos, archivarse o retirarse. Y, por último, la observabilidad de los datos permite a las organizaciones ver cómo se utilizan los datos en las operaciones normales del día a día. Permite a las empresas supervisar los datos en tiempo real, mejorar más ágilmente los procesos empresariales e incluso contribuir a alcanzar objetivos de sostenibilidad.

Fiabilidad de los datos

El tercer pilar de una estrategia de datos eficaz es determinar si los datos son fiables y fidedignos. ¿Se puede confiar en los datos para tomar decisiones críticas? La fiabilidad de los datos es posible gracias a los otros dos pilares de la estrategia:

  • Descubrimiento de datos: La automatización en torno a la comprensión de lo que son los datos.
  • Observabilidad de los datos: Monitorización de su uso en toda la organización.
  • Fiabilidad de los datos: ¿De dónde proceden los datos? ¿Cuál es su calidad? ¿Son exactos? ¿Confío en la fuente de esos datos? ¿Quién los ha modificado? ¿Es coherente de principio a fin?

Una única versión de la verdad

Una estrategia de datos basada en estos tres pilares permite a las empresas aplicar los datos que poseen para mejorar las operaciones empresariales, posibilitar una mejor toma de decisiones empresariales e impulsar la automatización asistida por IA en todas sus organizaciones.

El primer paso crucial es permitir la automatización del descubrimiento de datos. Sólo mediante la automatización del descubrimiento de datos pueden las empresas obtener inteligencia sobre todos sus datos. Es la clave para crear una única versión de la verdad mediante la comprensión de la versión correcta y más precisa de sus datos. Los datos que las empresas sabrán que son dignos de confianza y fiables para informar mejor la toma de decisiones empresariales e impulsar el éxito empresarial futuro.

Liam Yu es Director Senior de Marketing de Producto, Gestión de Datos, Hitachi Vantara.