Ciudad de México, mayo de 2019
Publicación de blog creada por: Hu Yoshida
De acuerdo con Harvard Business Review, "los estudios intersectoriales muestran que, en promedio, menos de la mitad de los datos estructurados de una organización se usan activamente para tomar decisiones, y menos del 1% de sus datos no estructurados se analizan o se usan en absoluto. Más del 70% de los empleados tienen acceso a los datos que no deberían y el 80% del tiempo de los analistas se dedica simplemente a descubrir y preparar datos. Las violaciones de datos son comunes, los conjuntos de datos deshonestos se propagan en silos y la tecnología de datos de las empresas a menudo no es suficiente a las demandas que se plantean". Eso estaba en un informe en 2017. ¿Qué ha cambiado desde entonces?
Pocos marcos de gestión de datos están centrados en los negocios
La administración de datos ha existido desde el inicio de TI centrándose en una gran cantidad de tecnología, así como en implementaciones de grandes volúmenes de datos, gobernabilidad, mejores prácticas, herramientas, etc. Sin embargo, los grandes centros de datos en los últimos 25 años (por ejemplo, almacenamiento de datos, gestión de datos, Data Lakes, Hadoop, Salesforce y ERP han dado como resultado más silos de datos que no son fáciles de entender, relacionar o compartir. Pocos marcos de gestión de datos, si es que hay alguno, se centran en el negocio, no solo para promover el uso eficiente de los datos y la asignación de recursos, sino también para comprender el significado de los datos, así como las tecnologías que se aplican a los datos para que los ingenieros pueden mover y transformar los datos esenciales que necesitan los consumidores.
Introduciendo DataOps
Hoy en día, más clientes se centran en los aspectos operativos de los datos en lugar de los aspectos básicos de captura, almacenamiento y protección de datos. Tras el éxito de DevOps (un conjunto de prácticas que automatiza los procesos entre el desarrollo de software y los equipos de TI, para que puedan construir, probar y lanzar el software de forma más rápida y confiable), las empresas ahora se centran en DataOps. Andy Palmer puede describirlo mejor, quien acuñó el término en 2015, "El marco de herramientas y cultura que permite a las organizaciones de ingeniería de datos entregar datos de forma rápida y completos a sus usuarios, así como la intersección de la ingeniería de datos, integración, calidad y seguridad. Fundamentalmente, DataOps es un término general que intenta unificar todos los roles y responsabilidades en el dominio de la ingeniería de datos mediante la aplicación de técnicas de colaboración en equipo. Su misión es entregar datos alineando la carga de las pruebas junto con diversas tareas de integración y despliegue".
En Hitachi Vantara, hemos estado aplicando nuestras tecnologías a DataOps en cuatro áreas:
Pentaho
Infraestructura de TI
Resumen
Los sistemas de Big Data se están convirtiendo en un centro de gravedad en términos de almacenamiento, acceso y operaciones.
Las empresas buscan DataOps para acelerar el proceso de conversión de datos en negocios. DataOps es necesario para comprender el significado de los datos, así como las tecnologías que se aplican a los datos para que los ingenieros puedan mover, automatizar y transformar los datos esenciales que necesitan los consumidores.
Hitachi Vantara proporciona herramientas y plataformas DataOps a través de:
La estudiante graduada Katie Bouman usa DataOps para capturar la primera imagen de un agujero negro.
Para obtener más información sobre Hitachi, visite el sitio web de la compañía en http://www.hitachi.com.
Contactos para Medios:
Medios y Relaciones Públicas
Hitachi Vantara México
e: mexico@hitachivantara.agency