Alle Blogs

Bessere Datenerkennung und -zuverlässigkeit für eine bessere Entscheidungsfindung

Liam Yu
Senior Product Solutions Marketing Manager, Integrated Systems

25. September 2023


Unternehmen ertrinken in Daten. Strukturierte, halbstrukturierte oder unstrukturierte Daten sind für das moderne, datengesteuerte Unternehmen alles, überall und auf einmal. Aber das ist auch eine Herausforderung für Unternehmen, die ihre Daten in verwertbare Informationen für den Geschäftserfolg umwandeln wollen.

Das schiere Datenvolumen stellt die Fähigkeit von Unternehmen in Frage, vertrauenswürdige und zuverlässige Daten zu finden, um ihre Geschäftsentscheidungen zu treffen. Herkömmliche Datenkataloge bieten nur eine strukturierte Datenermittlung. Es gibt keine End-to-End-Lösung, mit der Unternehmen vertrauenswürdige Daten über alle Datentypen hinweg erkennen können.

Was wir brauchen, ist eine Lösung, die die drei Schlüsselkomponenten des Datenpuzzles zusammenbringt: Datenerkennung, Datenbeobachtung und Datenzuverlässigkeit.

Diese drei Komponenten richten sich auch zunehmend nach den Bedürfnissen von Unternehmen, Daten anzuwenden, um die Arbeitsleistung zu verbessern, fundierte Geschäftsentscheidungen zu treffen und Wert aus den Daten zu ziehen, die sie haben.

Datenerkennung

Unabhängig davon, ob sich Daten in einem PDF-Dokument, einem Word-Dokument, einer relationalen Datenbank, einem Protokoll oder einer maschinell aufgezeichneten Telemetrie befinden, verfügt das typische Unternehmen über große Mengen davon. Eine kürzlich durchgeführte Studie berechnete das Gesamtvolumen der von einem typischen Unternehmen gespeicherten Daten auf 10 Petabyte (PBs) — eine Menge, die mehr als 23 Milliarden Dateien entspricht —, von denen mehr als die Hälfte (52% ) als „dunkle“ Daten eingestuft wurden, d.h. Daten, denen überhaupt kein Wert zugewiesen wurde.

Der Grund für diese Menge an nicht klassifizierten Daten ist einfach: In jedem Unternehmen bleibt nicht genug Zeit, um zu verstehen, welcher Anteil der Daten für das Unternehmen wertvoll ist. Das Sammeln und Integrieren dieser Daten erfordert in der Regel eine manuelle Extraktion aus verschiedenen Quellen, Formaten, Systemanbietern und einer Vielzahl von Standorten vor Ort, in verschiedenen Clouds und Edge-Architekturen.

Das Konzept der Datenermittlung ist gleichbedeutend mit dem Lesen oder Profilieren dieser Daten. Neue Softwaretools für künstliche Intelligenz (KI) und maschinelles Lernen (ML) wie Pentaho Data Catalog ermöglichen es Unternehmen, die Klassifizierung, Kennzeichnung und Verwaltung von Datendateien zu automatisieren, um die Qualität ihrer Daten zu verstehen. Diese Tools ermöglichen es Unternehmen, Dateninhalte und -kontext zu verstehen, indem sie Erkenntnisse über diese Daten oder deren Metadaten generieren. Es könnte zum Beispiel aufdecken, wie oft der Name einer Person in den Krankenakten eines Krankenhauses erwähnt wird. Oder es könnte aufdecken, wie oft der Begriff „Zinssatz“ in den Finanzunterlagen eines Kunden vorkommt.

Dies ist entscheidend für Unternehmen, die feststellen möchten, wie viele ihrer Daten für ihr Geschäft von Wert sind, positive Kundenergebnisse beeinflussen oder bessere Geschäftsprozesse generieren. Nur durch die Automatisierung des Datenerkennungsprozesses können Unternehmen den ersten Schritt zur Erfassung solcher Erkenntnisse über ihre Daten unternehmen.

Datenbeobachtbarkeit

Die zweite Säule einer erfolgreichen Datenstrategie besteht darin, sicherzustellen, dass die Daten für die Geschäftsanwender sichtbar und sinnvoll sind. Die Datenbeobachtbarkeit bietet die Möglichkeit, die Datennutzung im gesamten Unternehmen zu überwachen. Diese Überwachung ist entscheidend für die Beantwortung solcher Fragen wie: Wer nutzt die Daten? Woher stammen die Daten? Wurden sie geändert? Und wenn sie geändert wurden, wann, wo, warum und von wem?

Die Datenbeobachtbarkeit bietet Unternehmen die Möglichkeit, jede Datendatei, jedes Dokument oder jede Aufzeichnung zu verfolgen und aufzuzeichnen. Mit diesen Informationen können Unternehmen eine Grundlage für normales Verhalten schaffen. Dieses Verständnis ist entscheidend für den Schutz des Unternehmens vor Cyberangriffen. Es erleichtert dem Unternehmen, potenziell bedrohliche abnormale oder anormale Verhaltensweisen zu erkennen.

Die Datenbeobachtbarkeit ermöglicht es Unternehmen auch, Daten zu identifizieren, die nach ihrer Erfassung nie angerührt oder genutzt wurden. „Dunkle“ oder „defekte“ Daten, die möglicherweise nie einen Wert für das Unternehmen haben. Unternehmen können feststellen, ob diese nicht genutzten Daten auf weniger kostspielige Speichermedien verschoben, archiviert oder stillgelegt werden sollten. Und schließlich ermöglicht die Datenbeobachtung Unternehmen zu sehen, wie sie Daten im normalen Tagesgeschäft nutzen. Sie ermöglicht es Unternehmen, Daten in Echtzeit zu überwachen, Geschäftsprozesse schneller zu verbessern und sogar zur Erreichung von Nachhaltigkeitszielen beizutragen.

Datenzuverlässigkeit

Die dritte Säule einer erfolgreichen Datenstrategie besteht darin, festzustellen, ob die Daten vertrauenswürdig und zuverlässig sind. Können die Daten bei geschäftskritischen Entscheidungen vertrauenswürdig sein? Die Datenzuverlässigkeit wird durch die beiden anderen Säulen der Strategie ermöglicht:

  • Datenerkennung: Die Automatisierung, um zu verstehen, was Daten sind.
  • Datenbeobachtbarkeit: Überwachung der Nutzung im gesamten Unternehmen.
  • Verlässlichkeit der Daten: Woher stammen die Daten? Welche Qualität haben sie? Sind sie genau? Kann ich der Quelle dieser Daten vertrauen? Wer hat sie geändert? Sind sie von Anfang bis Ende konsistent?

Eine einzige Version der Wahrheit

Eine Datenstrategie, die auf diesen drei Säulen aufbaut, ermöglicht es Unternehmen, die von ihnen gespeicherten Daten anzuwenden, um den Geschäftsbetrieb zu verbessern, bessere Geschäftsentscheidungen zu treffen und die KI-gestützte Automatisierung in ihrem gesamten Unternehmen voranzutreiben.

Der entscheidende erste Schritt besteht darin, die Automatisierung für die Datenerkennung zu ermöglichen. Nur durch die Automatisierung der Datenerkennung können Unternehmen Informationen über alle ihre Daten erhalten. Es ist der Schlüssel zur Schaffung einer einzigen Version der Wahrheit, indem es die korrekte und genaueste Version seiner Daten versteht. Die Daten, von denen Unternehmen wissen, dass sie vertrauenswürdig und zuverlässig sind, um bessere Geschäftsentscheidungen zu treffen und den zukünftigen Geschäftserfolg voranzutreiben.

Liam Yu ist Senior Product Marketing Manager, Data Management, Hitachi Vantara.