Veja como os líderes que são orientados por dados estão mudando o mundo.

WATCH ON DEMAND
pt_br

Perguntas frequentes sobre tipos de dados

QUAIS SÃO OS DIFERENTES TIPOS DE DADOS?

A revolução digital e a ascensão do big data criaram um enorme volume de dados para a maioria das empresas. Em um estudo de 2017, Data Age 2025: The Evolution of Data to Life-Critical, a IDC estimou que o volume de dados globais chegará a 163 ZB (zettabytes ou um trilhão de gigabytes) até 2025.

O surgimento do big data gerou diversos tipos de dado que as empresas devem gerenciar e proteger. Esses tipos de dado incluem:

  • Dados estruturados, que são, em grande parte, numéricos e provenientes de estruturas transacionais e ferramentas de tecnologia, como os sistemas de Planejamento de recursos corporativos (ERP, Enterprise Resource Planning).
  • Dados não estruturados, que são compostos por tipos de arquivos aleatórios, inclusive imagens, gravações de áudio/vídeo e documentos do Microsoft Office, e não estão sujeitos a regras.
  • Dados parcialmente estruturados, que representam uma combinação dos tipos anteriores, ou seja, o arquivo pode conter informações numéricas, mas os dados são difíceis de extrair (por exemplo, uma planilha do Microsoft Excel).

Cada um desses tipos de dado apresenta desafios específicos para criar uma estratégia de governança de dados que armazene as informações, proteja a privacidade e a segurança e cumpra as regulamentações governamentais relacionadas.

O QUE SÃO DADOS ESTRUTURADOS?

A maioria das empresas tem uma excelente compreensão sobre os dados estruturados, os quais normalmente têm um formato de coluna e linha e elementos de metadados muito explícitos, como mês/dia/ano. Os dados estruturados, em grande parte numéricos, vêm de sistemas transacionais, bancos de dados e aplicativos de back-office (por exemplo, sistemas de ERP). Embora as empresas tenham uma enorme quantidade de dados estruturados, elas geralmente sabem como gerenciá-los, analisá-los e aplicá-los por serem bem definidos.

O QUE SÃO DADOS NÃO ESTRUTURADOS?

O maior desafio para grande parte das organizações é entender e extrair valor dos dados não estruturados. Esses dados vêm em muitos formatos, cada um com vários graus de complexidade, como imagens, arquivos de áudio, documentos de escritório ou produtividade e anotações escritas à mão que foram digitalizadas. Esses dados podem vir de qualquer lugar: de dentro e de fora da empresa, de terceiros, de dispositivos de borda e de outras fontes.

Como os dados não estruturados não são controlados por normas rígidas ou formatos compartilhados, pode ser difícil gerenciar e aplicar uma estratégia consistente de governança de dados. Ainda assim, eles podem conter informações críticas que as organizações precisam aproveitar no mundo dos negócios altamente competitivo e sempre ativo de hoje.

Por exemplo, considere que um cliente importante deixou uma reclamação no correio de voz. Extrair valor do arquivo de áudio exige um aplicativo de software capaz de reproduzi-lo, uma pessoa para ouvi-lo e outra pessoa para identificar quais informações são valiosas e quais não são. Converter o áudio em texto como parte da estratégia de processamento de dados cria uma visualização consistente da gravação que pode ser interpretada, conforme necessário, por qualquer pessoa com acesso autorizado a ela. Isso também permite que o correio de voz seja combinado com outras formas de análise sem comprometer a fonte original.

Outros dados não estruturados que contêm informações importantes podem incluir notas escritas à mão de um técnico de manutenção que esteja trabalhando em uma peça essencial do equipamento de produção. Com relação aos dados de terceiros, uma previsão do tempo de longo prazo ou uma publicação negativa de um influenciador em mídias sociais pode afetar significativamente a demanda por alguns produtos. É fácil ver o enorme valor potencial desse tipo de dado.

O QUE SÃO DADOS PARCIALMENTE ESTRUTURADOS?

Por fim, os dados parcialmente estruturados representam uma combinação desses dois tipos de dados. Esse grupo pode incluir planilhas do Excel que contenham informações financeiras importantes, mas cujos dados sejam difíceis de extrair. Esses objetos de dados podem conter uma estrutura interna, mas não terem a estrutura externa necessária para os processos padrão de gerenciamento de dados. Assim como os dados não estruturados, eles contêm insights importantes que podem ser difíceis de extrair e aplicar sem uma estratégia de governança de dados inteligente.

Os dados parcialmente estruturados designam quaisquer informações que usam um esquema autoexplicativo, como XML ou JSON. Eles têm um esquema aberto que permite a flexibilidade dos dados de aplicativos. Às vezes, esse tipo de dado é combinado com dados estruturados para registrar propriedades adicionais de tipos específicos de registros em um armazenamento de dados estruturado.

O esquema aberto significa que os dados parcialmente estruturados não dependem do aplicativo que os criou para definir a estrutura incorporada. Por exemplo, um banco de dados Oracle seria considerado um tipo de dado estruturado. As regras que controlam o banco de dados são vinculadas e aplicadas pelo aplicativo que cria o arquivo ou, nesse caso, o banco de dados.

Com conjuntos de dados parcialmente estruturados, as definições e restrições são incorporadas ao arquivo, independentemente do aplicativo que as criou. Por exemplo, arquivos XML e folhas de estilos em cascata para páginas web são formatos de dados parcialmente estruturados. Eles podem ser criados por quase qualquer tipo de aplicativo, como Bloco de Notas, ferramentas de criação de sites ou um componente do Office, como o Word. Dessa forma, não há como o aplicativo empregar estruturas ou regras nesses tipos de dado.

É um desafio para as organizações gerenciarem os dados parcialmente estruturados porque eles não têm necessariamente o mesmo nível de organização e previsibilidade que os dados estruturados. Eles não residem em campos ou registros fixos. Ao mesmo tempo, esses dados têm mais rigidez do que dados não estruturados por conterem elementos que podem separar os dados em várias hierarquias (pense em arquivos delimitados por vírgula ou por tabulação).

Diferentemente dos dados estruturados, que são representados como uma tabela simples, os dados parcialmente estruturados podem conter hierarquias de diversos níveis de informações aninhadas. Isso significa que pode ser fácil aplicar processos de gerenciamento de dados padrão aos dados parcialmente estruturados e extrair informações deles. O problema real é garantir que sua empresa tenha as ferramentas e a tecnologia necessárias para carregar dados em modelos de dados estruturados ou não estruturados para que possam ser gerenciados por meio da governança de dados.

QUAIS SÃO OS DOIS MAIORES DESAFIOS RELACIONADOS A ESSES TIPOS DE DADO?

O maior desafio para as empresas atualmente é, de longe, o aumento explosivo dos dados não estruturados. Na realidade, 80% dos dados criados hoje não são estruturados. Isso é mais do que a maioria das organizações consegue manter e indica que as empresas provavelmente estão coletando informações das quais nem sequer estão cientes. Isso pode fazer com que seja extremamente desafiador usar e proteger adequadamente os dados não estruturados e também gera um elemento de risco, pois a falta de conscientização torna as organizações propensas a violarem involuntariamente o crescente número de regulamentos que tratam da privacidade de dados.

Outro desafio é saber o que fazer com os dados. É preciso ter infraestrutura para armazenar e reter esse volume cada vez maior de dados. A maioria das organizações não está preparada para arcar com os consideráveis tempo e custos administrativos necessários para manter os dados. E ainda mais relevante é o fato de que esse volume enorme torna difícil para as empresas extrair as informações estratégicas importantes contidas nos dados.

Os dados nunca param de crescer, sua complexidade sempre varia e o número de produtores e consumidores, ao que tudo indica, continuará sendo interminável. É por isso que a resposta está na governança inteligente de dados. Isso significa estabelecer políticas e práticas recomendadas para limpar, rotular, proteger, gerenciar e garantir acessibilidade a dados não estruturados, assim como aos dados estruturados e parcialmente estruturados. Com uma estratégia de governança de dados bem definida, sua empresa estará melhor preparada para lidar com o aumento, a qualidade, a relevância e a usabilidade dos dados.

COMO A GOVERNANÇA DE DADOS PODE ME AJUDAR A GERENCIAR DIFERENTES TIPOS DE DADO?

Em uma linguagem mais simples, a governança inteligente de dados significa controlar os dados, mantê-los protegidos e torná-los acessíveis para poder cumprir a estratégia de negócios de alto nível. No entanto, a governança de dados também significa saber de onde os dados vieram, onde estão localizados no momento, quem pode acessá-los, o que eles contêm e por quanto tempo devem ficar armazenados. A governança inteligente de dados também pressupõe que os dados triviais foram separados das informações estrategicamente importantes.

Assim que os dados são centralizados e cuidadosamente gerenciados, seu verdadeiro potencial estratégico pode ser liberado. As empresas podem identificar facilmente as necessidades dos clientes, antecipar problemas emergentes, explorar novas oportunidades de negócios e responder às averiguações regulamentares. Elas podem otimizar os custos de armazenamento e administração desses ativos de informações e, ao mesmo tempo, permitir que as principais partes interessadas nos negócios aproveitem os dados para aprimorar a tomada de decisões.

Quando o assunto é governança de dados, é fundamental encontrar um equilíbrio adequado. Todos os tipos de dados devem ser gerenciados com atenção, mas a organização ainda precisa torná-los acessíveis, suportando os altos graus de flexibilidade e velocidade que são essenciais no mundo em constante mudança de hoje.

A boa notícia é que existem soluções automatizadas e inovadoras que podem ajudar a simplificar e acelerar o processo de governança de dados, economizando o tempo e os custos valiosos da sua organização.

QUEM SÃO OS LÍDERES EM GOVERNANÇA DE DADOS?

A Hitachi Vantara é autoridade no assunto e escreveu um livro sobre governança de dados. Com liderança estabelecida em armazenamento e gerenciamento de dados, os especialistas da Hitachi podem transformar a complexa tarefa de governança de dados em algo simples e claro, por meio de soluções automatizadas que ajudam sua empresa a:

  • Garantir a qualidade dos dados.
  • Tornar os dados identificáveis.
  • Centralizar e tornar os dados acessíveis.

Ao implementar soluções automatizadas que limpam, identificam e centralizam os dados estruturados, não estruturados e parcialmente estruturados, a Hitachi pode ajudar você a criar uma fonte única e confiável com um grande valor estratégico. Você pode obter novas informações sobre operações diárias, clientes e parceiros comerciais, finanças e tendências emergentes que afetarão a sua empresa e os seus resultados financeiros.

COMO EXATAMENTE A GOVERNANÇA INTELIGENTE DE DADOS PODE AJUDAR MEUS NEGÓCIOS?

A governança inteligente de dados fornece uma série de benefícios estratégicos para as empresas regulares, inclusive:

  • Tomada de decisões aprimorada. Os dados bem administrados são mais fáceis de acessar e aplicar. Isto é, as partes interessadas em toda a empresa podem tomar decisões com base em fatos, e não em intuições ou suposições.
  • Eficiências operacionais. Os dados críticos, incluindo as métricas de desempenho, podem ser usados para identificar e solucionar gargalos e ineficiências na maneira como a empresa trabalha diariamente. Ter acesso a dados atuais e precisos é essencial para conseguir isso.
  • Melhor compreensão e linhagem de dados. O entendimento da trilha de dados e de todas as responsabilidades pelas informações é transformado em respostas oportunas às auditorias, em atividades mais eficazes de avaliação precoce de casos e em uma abordagem mais proativa para evitar a corrupção e a violação de dados.
  • Conformidade regulamentar. As empresas estão precisando cada vez mais ficar em conformidade com as regulamentações complexas de privacidade e segurança relacionadas aos dados que elas gerenciam e armazenam. A governança de dados é crucial para garantir e demonstrar o alinhamento organizacional com as normas estabelecidas em quaisquer requisitos regulamentares.
  • Aumento da receita. Equipadas seguramente com dados precisos, limpos e em tempo real, as empresas podem tomar decisões melhores e mais rápidas que impactam de forma positiva as margens operacionais e de vendas.
COM QUE FREQUÊNCIA A MINHA EMPRESA DEVE REVISAR AS POLÍTICAS A RESPEITO DOS DIFERENTES TIPOS DE DADO?

Como o volume de dados está aumentando exponencialmente, a Hitachi Vantara recomenda que a sua empresa revise as políticas e práticas de governança de dados a cada trimestre. Observando a situação geral dos dados a cada três meses, a sua empresa conseguirá identificar tendências emergentes, solucionar problemas e garantir que os dados continuem funcionando como um recurso estratégico.

Além de estabelecer uma cadência para a governança de dados, a Hitachi recomenda que todas as organizações incluam o cargo de diretor de dados (CDO). Na organização, o CDO atua como um porta-voz dos dados, protegendo e maximizando continuamente a contribuição estratégica das informações.

COMO OS DIFERENTES TIPOS DE DADO AFETAM A INICIATIVA DE DATAOPS DA MINHA EMPRESA?

Um conceito emergente, o DataOps, ou as operações de dados, é o gerenciamento de dados no nível corporativo para a era da inteligência artificial. Ao implementar uma estratégia abrangente de DataOps, você pode conectar perfeitamente seus consumidores e criadores de dados para encontrar e usar com rapidez todo o valor dos seus dados.

As operações de dados não são um produto, um serviço ou uma solução. Trata-se de uma metodologia, uma mudança tecnológica e cultural para aprimorar o uso que a sua organização faz das informações, por meio de dados de qualidade melhor, ciclos mais curtos e gerenciamento superior dos dados.

Como o DataOps abrange todo o ciclo de coleta e aplicação de informações, é extremamente necessário que a sua organização gerencie todos os tipos de dado com eficiência. Com dados limpos, bem gerenciados e prontamente acessíveis, a sua iniciativa de DataOps pode ser mantida com as informações certas de que você precisa para tomar decisões estratégicas com base em fatos, e não em suposições.

Com experiência comprovada em DataOps e governança de todos os tipos de dado, a Hitachi Vantara é um parceiro natural. Ao incutir cultura e mentalidade orientadas por dados, a Hitachi pode fazer com que os dados seja a prioridade diária dos seus negócios.

pt