Vea cómo los líderes del mundo que se basan en datos están cambiando el mundo.

WATCH ON DEMAND
es_la

Preguntas frecuentes sobre tipos de datos

¿CUÁLES SON LOS DIFERENTES TIPOS DE DATOS?

La revolución digital y el auge de Big Data han creado un enorme volumen de datos para el negocio promedio. En un estudio de 2017, titulado Data Age 2025: The Evolution of Data to Life-Critical, IDC predijo que los datos globales crecerán hasta 163 ZB (zettabytes, o un billón de gigabytes) para 2025.

La aparición de Big Data ha generado una amplia gama de tipos de datos que las empresas deben administrar y proteger. Estos tipos de datos incluyen los siguientes:

  • Datos estructurados, que son en gran medida numéricos que provienen de sistemas transaccionales y herramientas tecnológicas, como los sistemas de planificación de recursos empresariales (ERP, Enterprise Resource Planning).
  • Datos no estructurados, que constan de tipos de archivos aleatorios, incluidas imágenes, grabaciones de audio/video y archivos de Microsoft Office, que no están sujetos a reglas.
  • Datos semiestructurados, que representan un híbrido de estos tipos, donde el archivo puede contener información numérica, pero esos datos son difíciles de extraer (por ejemplo, una hoja de cálculo de Microsoft Excel).

Cada uno de estos tipos de datos plantea desafíos únicos en términos de crear una estrategia de gobierno de datos que almacene la información, proteja la privacidad y la seguridad, y cumpla con las reglamentaciones gubernamentales sobre datos.

¿QUÉ SON LOS DATOS ESTRUCTURADOS?

La mayoría de las empresas tiene una sólida comprensión de los datos estructurados, que generalmente tienen un formato de fila y columna, y elementos de metadatos muy explícitos, como mes/día/año. Los datos estructurados, en gran parte numéricos, provienen de sistemas transaccionales, bases de datos y aplicaciones administrativas (por ejemplo, sistemas de ERP). Si bien las empresas tienen una cantidad abrumadora de datos estructurados, generalmente saben cómo administrarlos, analizarlos y aplicarlos debido a lo bien que están definidos.

¿QUÉ SON LOS DATOS NO ESTRUCTURADOS?

El mayor desafío para la mayoría de las organizaciones radica en comprender y extraer valor de los datos no estructurados. Estos se presentan en muchos formatos, cada uno con diversos grados de complejidad, como imágenes, archivos de audio, archivos de oficina o productividad, y notas escritas a mano que se han escaneado. Estos datos pueden originarse, y lo hacen, de cualquier lugar: interna o externamente, de terceros, a través de dispositivos periféricos y de otras fuentes.

Debido a que los datos no estructurados no se rigen por reglas estrictas o formatos compartidos, puede ser difícil administrar y aplicar una estrategia de gobierno de datos coherente. Aun así, pueden contener información clave que las organizaciones necesitan aprovechar en el mundo empresarial actual, altamente competitivo y siempre activo.

Por ejemplo, considere una queja importante de un cliente que queda en el correo de voz. La minería de valor del archivo de audio requiere una aplicación de software capaz de reproducirlo, una persona que lo escuche físicamente y otra que determine qué información es valiosa y cuál no lo es. Convertir el audio a texto como parte de la estrategia de procesamiento de datos crea una vista coherente de la grabación que cualquier persona con acceso autorizado a la grabación puede interpretar según sea necesario. También permite que el correo de voz se combine con otras formas de análisis, sin comprometer la fuente original.

Otros datos no estructurados que contienen información clave podrían incluir las notas escritas a mano de un técnico de mantenimiento que presta servicio a una pieza esencial del equipo de producción. Con respecto a los datos de terceros, un pronóstico del tiempo a largo plazo o una publicación negativa en las redes sociales por parte de un influencer pueden afectar significativamente la demanda de algunos productos. Es fácil ver el enorme valor potencial de este tipo de datos.

¿QUÉ SON LOS DATOS SEMISTRUCTURADOS?

Por último, los datos semiestructurados representan un híbrido de estos dos tipos de datos. Este grupo podría incluir las hojas de cálculo de Excel que contienen información financiera importante, pero los datos en sí son difíciles de extraer. Estos objetos de datos pueden tener una estructura interna, pero carecen de la estructura externa necesaria para los procesos estándares de administración de datos. Al igual que los datos no estructurados, estos objetos contienen información importante que puede ser difícil de extraer y aplicar sin una estrategia inteligente de gobierno de datos.

Los datos semiestructurados se refieren a cualquier información que utilice un esquema de autodescripción, como XML o JSON. Estos tipos de datos tienen un esquema abierto que permite la flexibilidad de datos de la aplicación. A veces, este tipo de datos se combina con datos estructurados para registrar propiedades adicionales para tipos específicos de registros dentro de un almacén de datos estructurados.

Un esquema abierto significa que los datos semiestructurados no dependen de la aplicación que los creó para definir la estructura incrustada. Por ejemplo, una base de datos Oracle se consideraría un tipo de datos estructurados. Las reglas que rigen la base de datos están vinculadas y aplicadas por la aplicación que crea el archivo o, en este caso, la base de datos.

Con los conjuntos de datos semiestructurados, las definiciones y restricciones se incrustan en el archivo, independientemente de la aplicación que las creó. Por ejemplo, los archivos XML y las hojas de estilo en cascada para páginas web son formas de datos semiestructurados. Casi cualquier tipo de aplicación puede crearlos, como el Bloc de notas, una aplicación de creación de sitios web o una aplicación de Office como Word, por lo que no hay forma de que la aplicación aplique estructura o reglas a estos tipos de datos.

Los datos semiestructurados son difíciles de administrar para las organizaciones porque no necesariamente tienen el mismo nivel de organización y previsibilidad que los datos estructurados. No residen en campos fijos o en registros. Al mismo tiempo, tienen más rigidez que los datos no estructurados porque contienen elementos que pueden separar los datos en varias jerarquías (como es el caso de los archivos delimitados por comas o tabulaciones).

A diferencia de los datos estructurados, que representan los datos como una tabla plana, los datos semiestructurados pueden contener jerarquías de niveles en n de información anidada. Esto significa que puede ser fácil aplicar procesos de administración de datos estándares a datos semiestructurados, y puede ser fácil extraer información de ellos. El problema real es asegurarse de que su empresa tenga las herramientas y la tecnología necesarias para cargar los datos en modelos de datos estructurados o no estructurados, que puedan administrarse a través del gobierno de datos.

¿CUÁLES SON LOS DOS DESAFÍOS MÁS GRANDES RELACIONADOS CON ESTOS TIPOS DE DATOS?

Por lejos, el mayor desafío para las empresas hoy en día es el crecimiento explosivo de datos no estructurados. De hecho, el 80 % de todos los datos nuevos creados en la actualidad no están estructurados. Eso es más de lo que la mayoría de las organizaciones mantenerse al día, e indica que es probable que las empresas estén recopilando información que ni siquiera conocen. Esto puede hacer que sea extremadamente difícil usar y proteger de manera adecuada los datos no estructurados, y crea un elemento de riesgo, ya que la falta de reconocimiento genera una propensión a que las organizaciones violen sin querer la creciente cantidad de reglamentaciones que abordan la privacidad de los datos.

El segundo desafío es saber qué hacer con los datos. Un volumen de datos tan grande y creciente requiere infraestructura para almacenar y retener. La mayoría de las organizaciones no están equipadas para el tiempo administrativo y los costos significativos necesarios para mantener los datos. Más importante aún, su gran volumen hace que sea difícil para las empresas extraer los importantes conocimientos estratégicos que existen.

Los datos nunca dejarán de crecer, su complejidad siempre variará y la cantidad de productores y consumidores seguirá siendo interminable. Es por eso que la respuesta radica en el gobierno inteligente de datos, lo que significa establecer políticas y mejores prácticas destinadas a limpiar, etiquetar, proteger, administrar y garantizar la accesibilidad a datos no estructurados, así como a datos estructurados y semiestructurados. Con una estrategia de gobierno de datos bien definida, su empresa estará mejor preparada para lidiar con el crecimiento, la calidad, la relevancia y la facilidad de uso de los datos.

¿CÓMO PUEDE AYUDARME EL GOBIERNO DE DATOS A ADMINISTRAR DIFERENTES TIPOS DE DATOS?

En términos simples, el gobierno inteligente de datos significa controlar los datos, mantenerlos protegidos y permitir el acceso a ellos para llevar a cabo una estrategia comercial de nivel superior. Pero el gobierno de datos también significa saber dónde se originaron los datos, dónde se encuentran actualmente, quién puede acceder a ellos, qué contienen y cuánto tiempo deben conservarse. El gobierno inteligente de datos también implica que los datos triviales se distinguen de la información estratégicamente importante.

Una vez que los datos se centralizan y se gestionan cuidadosamente, se puede liberar su verdadero potencial estratégico. Las empresas pueden identificar fácilmente las necesidades del cliente, anticiparse a los problemas emergentes, explorar nuevas oportunidades comerciales y responder a las consultas regulatorias. Pueden optimizar los costos de almacenamiento y administración de estos activos de información, al tiempo que permiten que las partes interesadas clave en el negocio aprovechen los datos para mejorar la toma de decisiones.

Cuando se trata del gobierno de datos, es clave lograr un equilibrio adecuado. Los datos de todo tipo se deben ser administrar de cerca, pero la organización aún necesita que sean accesibles, respaldando los altos grados de flexibilidad y velocidad que son esenciales en el mundo en constante movimiento de hoy.

La buena noticia es que existen soluciones innovadoras y automatizadas que pueden ayudar a racionalizar y acelerar el proceso de gobierno de datos y ahorrar tiempo y costos valiosos a su organización.

¿QUIÉNES SON LOS LÍDERES EN EL GOBIERNO DE DATOS?

Hitachi Vantara literalmente escribió el libro sobre el gobierno de datos. Con un liderazgo establecido en almacenamiento y administración de datos, los expertos de Hitachi pueden hacer que la compleja tarea del gobierno de datos sea fácil y directa, a través de soluciones automatizadas que ayudan a su empresa en lo siguiente:

  • Garantizar la calidad de los datos.
  • Hacer que los datos sean identificables.
  • Centralizar los datos y hacerlos accesibles.

Con la implementación de soluciones automatizadas que limpian, identifican y centralizan sus datos estructurados, no estructurados y semiestructurados, Hitachi puede ayudarlo a crear una “fuente única de verdad” que tenga un enorme valor estratégico. Puede obtener nuevos conocimientos sobre sus operaciones diarias, sus clientes y socios comerciales, sus finanzas y las tendencias emergentes que afectarán a su empresa y sus resultados financieros.

¿CÓMO PUEDE AYUDAR UN GOBIERNO DE DATOS INTELIGENTE A MI EMPRESA EXACTAMENTE?

El gobierno inteligente de datos proporciona una variedad de beneficios estratégicos para la empresa típica, entre otros:

  • Mejora de la toma de decisiones. Los datos bien gobernados son más fáciles de acceder y aplicar, lo que significa que las partes interesadas de toda la empresa pueden tomar decisiones basadas en hechos, no en intuiciones o conjeturas.
  • Eficiencias operativas. Los datos críticos, incluidas las métricas de rendimiento, pueden utilizarse para identificar y abordar los cuellos de botella y las ineficiencias en la forma en la que la empresa trabaja todos los días. Tener acceso a datos precisos y actuales es esencial para lograr esto.
  • Mejor comprensión y linaje de datos. Comprender la "traza de datos" y todas las responsabilidades por los datos se traduce en respuestas oportunas a las auditorías, actividades de evaluación temprana de casos más efectivas y un enfoque más proactivo para prevenir la corrupción y las filtraciones de datos.
  • Cumplimiento regulatorio. Cada vez más, las empresas deben cumplir con las complejas regulaciones de privacidad y seguridad relacionadas con los datos que administran y almacenan. El gobierno de datos es un aspecto clave para garantizar y probar el ajuste de la organización con las reglas establecidas en los requisitos regulatorios aplicables.
  • Aumento de los ingresos. Con la confianza de tener datos precisos, limpios y en tiempo real, las empresas pueden tomar mejores y más rápidas decisiones que impacten positivamente en las ventas y los márgenes operativos.
¿CON QUÉ FRECUENCIA DEBERÍA REVISAR SUS POLÍTICAS CON RESPECTO A DIFERENTES TIPOS DE DATOS MI EMPRESA?

Debido a que los volúmenes de datos crecen exponencialmente, Hitachi Vantara recomienda que su empresa revise las políticas y prácticas de gobierno de datos trimestralmente. Si observa el “panorama general” con respecto a los datos cada tres meses, su empresa puede identificar tendencias emergentes, solucionar problemas y garantizar que los datos continúen funcionando como un recurso estratégico.

Además de establecer una cadencia para el gobierno de datos, Hitachi recomienda que cada organización incluya el puesto de director de datos o CDO. Dentro de la organización, el CDO sirve como “la voz de los datos”, protegiéndolos e incrementando su contribución estratégica de manera continua.

¿CÓMO IMPACTAN LOS DIFERENTES TIPOS DE DATOS LA INICIATIVA DE DATAOPS DE MI EMPRESA?

Un concepto emergente, DataOps (u operaciones de datos) es la administración de datos a nivel empresarial para la era de la inteligencia artificial. Con la implementación de una estrategia global de DataOps, puede conectar sin problemas a sus consumidores y creadores de datos para encontrar y usar con rapidez todo el valor de sus datos.

Las operaciones de datos no son un producto, un servicio ni una solución. Es una metodología, un cambio tecnológico y cultural destinado a mejorar el uso de datos de su organización a través de una mejor calidad de datos, un tiempo de ciclo más corto y una gestión de datos superior.

Dado que DataOps abarca todo el ciclo de recopilación y aplicación de información, es absolutamente esencial que su organización administre todo tipo de datos de manera eficiente. Si cuenta con datos limpios, bien administrados e inmediatamente accesibles, su iniciativa de DataOps se puede respaldar con la información correcta que necesita para tomar decisiones estratégicas basadas en hechos, no en conjeturas.

Debido a que Hitachi Vantara tiene experiencia comprobada tanto en DataOps como en gobierno de datos, en todos los tipos de datos, Hitachi es un socio natural. Dado que inculca una cultura y una mentalidad basadas en datos, Hitachi puede ayudar a que los datos se enfoquen en su negocio todos los días.

es