Häufig gestellte Fragen (FAQ) zu Datentypen

WELCHE VERSCHIEDENEN DATENTYPEN GIBT ES?

Die digitale Revolution und der Aufstieg von Big Data haben dazu geführt, dass ein durchschnittliches Unternehmen mit einem enormen Datenvolumen konfrontiert ist. In einer Studie aus dem Jahr 2017 mit dem Titel Data Age 2025: The Evolution of Data to Life-Critical prognostizierte IDC, dass die globalen Daten bis 2025 auf 163 ZB (Zettabyte oder eine Billion Gigabyte) anwachsen werden.

Der Siegeszug von Big Data hat eine Vielzahl von Datentypen hervorgebracht, die Unternehmen verwalten und sichern müssen. Sie werden in drei Gruppen unterteilt:

  • Strukturierte Daten, die weitgehend numerisch sind und aus Transaktionssystemen und Technologietools wie ERP-Systemen (Enterprise Resource Planning) stammen.
  • Unstrukturierte Daten, die aus zufälligen Dateitypen wie Bildern, Audio-/Videoaufzeichnungen und Microsoft-Office-Dateien bestehen und keinen Regeln unterliegen.
  • Semistrukturierte Daten, die eine Mischung aus diesen Typen darstellen, wobei eine Datei numerische Daten enthalten kann, die sich jedoch nur schwer extrahieren lassen (z. B. eine Microsoft Excel-Tabelle).

Jeder dieser Datentypen stellt besondere Anforderungen an die Erstellung einer Data-Governance-Strategie, die die Informationen speichert, die Privatsphäre und Sicherheit schützt und den Datenbestimmungen entspricht.

WAS SIND STRUKTURIERTE DATEN?

Die meisten Unternehmen verfügen über solide Kenntnisse im Umgang mit strukturierten Daten. Diese liegen üblicherweise in einem Format aus Zeilen und Spalten vor und besitzen deutlich erkennbare Metadaten-Elemente wie Monat/Tag/Jahr. Als weitgehend numerische Informationen stammen strukturierte Daten aus Transaktionssystemen, Datenbanken und Back-Office-Anwendungen (z. B. ERP-Systemen). Trotz ihrer überwältigenden Menge wissen die Unternehmen im allgemeinen genau, wie strukturierte Daten verwaltet, analysiert und angewendet werden, da sie gut definiert sind.

WAS SIND UNSTRUKTURIERTE DATEN?

Für die Mehrzahl der Unternehmen ist es sehr viel schwieriger, das Konzept der unstrukturierten Daten zu verstehen und deren Wert auszuschöpfen. Unstrukturierte Daten liegen in vielen Formaten mit unterschiedlich hoher Komplexität vor, z. B. als Bilder, Audiodateien, Büro- oder Produktivitätsdateien sowie als handschriftliche und eingescannte Notizen. Unstrukturierte Daten können von überall her stammen; sie können intern oder extern sein, von Dritten, über Edge-Geräte oder aus anderen Quellen ins Unternehmen fließen.

Da unstrukturierte Daten keinen strengen Regeln oder gemeinsamen Formaten unterliegen, kann es schwierig sein, eine konsistente Data-Governance-Strategie zu verwalten und auf sie anzuwenden. Dessen ungeachtet können sie wichtige Erkenntnisse beinhalten, die Unternehmen in der wettbewerbsintensiven Always-On-Geschäftswelt nicht ungenutzt lassen dürfen.

Ein Beispiel für unstrukturierte Daten könnte eine Beschwerde sein, die ein wichtiger Kunde auf dem Voicemail-System hinterlassen hat. Um den inhärenten Wert der Audiodatei zu erschließen, braucht es eine Softwareanwendung, die sie abspielen kann, eine Person, die sie anhört, und eine weitere Person, die feststellt welche Informationen wertvoll sind und welche nicht. Wenn die Tonaufnahme hingegen im Rahmen der Datenverarbeitungsstrategie in eine Textform umgewandelt wird, entsteht eine konsistente Repräsentation des Anrufs, die von jedem autorisierten Benutzer nach Bedarf interpretiert werden kann. Darüber hinaus kann die Voicemail-Nachricht mit anderen Analyseformen kombiniert werden, ohne die ursprüngliche Quelle zu verändern.

Eine weitere Art von unstrukturierten Daten, in denen wichtige Erkenntnisse verborgen sind, können die handschriftlichen Notizen eines Technikers sein, der eine wesentliche Komponente der Produktionsanlage wartet. Daten aus externen Quellen wie z. B. eine langfristige Wettervorhersage oder ein negativer Social-Media-Beitrag eines Influencers können wiederum die Nachfrage nach bestimmten Produkten erheblich beeinflussen. All dies zeigt das gigantische Potenzial, das in unstrukturierten Daten schlummert.

WAS SIND SEMISTRUKTURIERTE DATEN?

Die dritte Gruppe, semistrukturierte Daten stellt eine Mischung aus den oben genannten Datentypen dar. Zu ihr zählen beispielsweise Excel-Tabellen, die wichtige Finanzinformationen enthalten, deren Daten aber schwer zu extrahieren sind. Die entsprechenden Datenobjekte können zwar strukturiert sein, es fehlt ihnen jedoch die externe Struktur, die für standardmäßige Datenverwaltungsprozesse notwendig ist. Wie ihre unstrukturierten Pendants enthalten auch diese Objekte essentielle Erkenntnisse, die sich ohne eine intelligente Data-Governance-Strategie nur schwer extrahieren und anwenden lassen.

Semistrukturierte Daten beinhalten alle Informationen, die ein selbstbeschreibendes Schema verwenden, z. B. XML oder JSON. Kennzeichnend für diese Daten ist ein offenes Schema, das die Flexibilität von Anwendungsdaten ermöglicht. Mitunter werden sie mit strukturierten Daten kombiniert, um in einem strukturierten Datenspeicher zusätzliche Eigenschaften für bestimmte Arten von Datensätzen zu erfassen.

Durch ihr offenes Schema sind semistrukturierte Daten nicht von der Anwendung abhängig, die sie erzeugt hat, um die eingebettete Struktur zu definieren. Ein Beispiel für einen strukturierten Datentyp ist eine Oracle-Datenbank: Die für die Datenbank geltenden Regeln werden von der Applikation bestimmt und angewendet, mit der die Datei oder in diesem Fall die Datenbank erzeugt wird.

Bei semistrukturierten Datasets sind die Definitionen und Beschränkungen unabhängig von der Anwendung, mit der sie erstellt wurden, in der Datei eingebettet. Beispiele für semistrukturierte Daten sind XML-Dateien und kaskadierende Stylesheets für Webseiten. Sie können von fast jeder Art von Anwendung erstellt werden, z. B. von Notepad, einer Website-Builder-App oder einer Office-Anwendung wie Word. Daher kann die Anwendung keine Struktur oder Regeln auf diese Datentypen anwenden.

Semistrukturierte Daten sind für Unternehmen schwierig zu verwalten, da sie nicht unbedingt den gleichen Grad an Organisation und Vorhersagbarkeit aufweisen wie strukturierte Daten. Sie sind nicht in festen Feldern oder Datensätzen enthalten. Zugleich sind sie weniger flexibel als unstrukturierte Daten, da sie Elemente beinhalten, die verschiedene Hierarchien festlegen können (z. B. durch Kommas oder durch Tabulatoren getrennte Dateien).

Im Gegensatz zu strukturierten Daten, die als flache Tabelle darstellbar sind, können semistrukturierte Daten Hierarchien von verschachtelten Informationen auf n Ebenen enthalten. Entsprechend einfach kann es sein, Standardprozesse für die Datenverwaltung auf semistrukturierte Daten anzuwenden und Erkenntnisse daraus zu extrahieren. Das eigentliche Problem besteht darin sicherzustellen, dass Ihr Unternehmen über die nötigen Tools und Technologien verfügt, um die Daten in strukturierte oder unstrukturierte Datenmodelle zu laden, die mittels Data Governance verwaltet werden können.

WIE LAUTEN DIE ZWEI GRÖSSTEN HERAUSFORDERUNGEN BEI DIESEN DATENTYPEN?

Die mit Abstand größte Herausforderung für Unternehmen ist das explosionsartige Wachstum der unstrukturierten Daten. Tatsächlich gehören 80 % aller neu erstellten Daten dem unstrukturierten Typ an – ein Faktum, das die meisten Unternehmen überfordert und vermuten lässt, dass sie fortlaufend Informationen sammeln, ohne dass ihnen dies überhaupt bewusst ist. In dieser Situation kann es äußerst schwierig sein, unstrukturierte Daten angemessen zu nutzen und zu sichern. Abgesehen davon besteht die Gefahr, dass die Unternehmen unwissentlich gegen die zunehmende Zahl von Datenschutzvorschriften verstoßen.

Die zweite Herausforderung besteht darin zu wissen, was mit den Daten zu tun ist. Ein derart großes und ständig wachsendes Datenvolumen benötigt eine geeignete Infrastruktur für die Speicherung und Aufbewahrung der Daten. Die meisten Unternehmen sind jedoch nicht in der Lage, den erheblichen Verwaltungs- und Kostenaufwand für die Pflege der Daten zu stemmen. Und nicht nur das: Die enorme Menge der Daten macht es extrem schwer, die darin verborgenen strategischen Erkenntnisse ans Tageslicht zu bringen.

Die Daten werden niemals aufhören zu wachsen, ihre Komplexität wird immer variieren, und die Anzahl der Produzenten und Verbraucher wird scheinbar endlos bleiben. Weil dies so ist, benötigen die Unternehmen eine intelligente Data Governance. Konkret bedeutet dies, dass sie Richtlinien und Best Practices festlegen müssen, mit denen sich sowohl unstrukturierte als auch strukturierte und semistrukturierte Daten bereinigen, kennzeichnen, schützen und verwalten lassen und die den Zugriff auf all diese Daten gewährleisten. Mit einer präzise definierten Data-Governance-Strategie ist Ihr Unternehmen sehr viel besser gewappnet, um die Herausforderungen von Datenwachstum, Datenqualität, Datenrelevanz und Datenverwendbarkeit zu bewältigen.

WIE KANN MIR DATA GOVERNANCE BEI DER VERWALTUNG DER VERSCHIEDENEN DATENTYPEN HELFEN?

Intelligente Data Governance bedeutet im einfachsten Sinne, Daten unter Kontrolle zu bringen, sie zuverlässig zu schützen und den Zugriff darauf zu ermöglichen, um die übergeordnete Geschäftsstrategie umzusetzen. Data Governance bedeutet aber auch zu wissen, woher die Daten stammen, wo sie sich derzeit befinden, wer darauf zugreifen kann, was sie enthalten und wie lange sie aufbewahrt werden sollen. Kennzeichnend für eine intelligente Data Governance ist zudem, dass triviale Daten von strategisch wichtigen Informationen unterschieden werden.

Wenn die Daten erst einmal zentralisiert und sorgfältig verwaltet sind, kann ihr wahres strategisches Potenzial freigesetzt werden. Für Unternehmen heißt das, dass sie Kundenbedürfnisse leicht identifizieren, aufkommende Probleme antizipieren, neue Geschäftsmöglichkeiten erkunden und auf behördliche Anfragen reagieren können. Sie können die Kosten für die Speicherung und Verwaltung ihrer Daten-Assets optimieren und gleichzeitig den wichtigsten Stakeholdern des Unternehmens ermöglichen, Daten für eine bessere Entscheidungsfindung zu nutzen.

Bei der Data Governance geht es immer darum, ein angemessenes Gleichgewicht zu finden. Daten aller Art müssen sorgfältig verwaltet werden. Zugleich müssen sie weiterhin zugänglich sein, um das hohe Maß an Flexibilität und Geschwindigkeit zu gewährleisten, das in unserer schnelllebigen Welt unerlässlich ist.

Glücklicherweise gibt es innovative, automatisierte Lösungen, mit denen sich der Data-Governance-Prozess rationalisieren und beschleunigen lässt, so dass Ihr Unternehmen wertvolle Zeit und Kosten spart.

WER IST DER FÜHRENDE ANBIETER IM BEREICH DATA GOVERNANCE?

Hitachi Vantara hat buchstäblich das Handbuch zur Data Governance geschrieben. Als anerkannte Leader für die Datenspeicherung und -verwaltung sind die Experten von Hitachi bestens gerüstet, um die komplexe Aufgabe der Data Governance einfach und überschaubar zu machen. Automatisierte Lösungen helfen Ihrem Unternehmen dabei, Folgendes zu erreichen:

  • Zuverlässige Datenqualität
  • Identifizierbarkeit der Daten
  • Zentralisierung und Zugänglichkeit der Daten

Durch die Implementierung automatisierter Lösungen, die Ihre strukturierten, unstrukturierten und semistrukturierten Daten bereinigen, identifizieren und zentralisieren, kann Hitachi Ihnen dabei helfen, eine „Single Source of Truth" zu schaffen – eine alleinige, gemeinsame Datenbasis, die von enormem strategischem Wert ist. Gestützt auf diese Datenbasis können Sie neue Erkenntnisse über Ihre täglichen Abläufe, Ihre Kunden und Handelspartner, Ihre Finanzen und aufkommende Trends gewinnen, die sich auf Ihr Unternehmen und seine Finanzergebnisse auswirken.

WIE KANN DIE INTELLIGENTE DATA GOVERNANCE MEINEM UNTERNEHMEN KONKRET HELFEN?

Ein typisches Unternehmen profitiert in mehrfacher Hinsicht von einer intelligenten Data Governance:

  • Bessere Entscheidungsfindung. Gut gemanagte Daten sind einfacher zugänglich und anwendbar. Die Folge: Stakeholder im gesamten Unternehmen können Entscheidungen auf Grundlage von Fakten treffen und nicht auf Intuition oder Vermutungen.
  • Betriebliche Effizienz. Kritische Daten wie Performance-Kennzahlen können dazu verwendet werden, Engpässe und Ineffizienzen in den täglichen Abläufen des Unternehmens zu identifizieren und zu beheben. Hierfür müssen genaue und aktuelle Daten zur Verfügung stehen.
  • Besseres Verständnis der Daten und ihrer Herkunft. Wenn der „Datenpfad“ und sämtliche Verantwortlichkeiten für die Daten bekannt sind, kann das Unternehmen schneller auf Audits reagieren, effektivere Maßnahmen für eine frühzeitige Fallbewertung ergreifen und proaktiver handeln, um Datenkorruption und Datenpannen zu vermeiden.
  • Einhaltung gesetzlicher Bestimmungen. Unternehmen müssen zunehmend komplexe Datenschutz- und Sicherheitsbestimmungen in Bezug auf die von ihnen verwalteten und gespeicherten Daten einhalten. Data Governance ist ein kritischer Aspekt, wenn es darum geht, die regulatorische Compliance sicherzustellen und nachzuweisen.
  • Höhere Einnahmen. Unternehmen, die über genaue, bereinigte Echtzeitdaten verfügen, können bessere und schnellere Entscheidungen treffen, die sich positiv auf Umsatz und operative Gewinnmargen auswirken.
WIE OFT SOLLTE MEIN UNTERNEHMEN SEINE RICHTLINIEN ZU DEN VERSCHIEDENEN DATENTYPEN ÜBERPRÜFEN?

Da das Datenvolumen exponentiell wächst, empfiehlt Hitachi Vantara eine vierteljährliche Überprüfung der Richtlinien und Praktiken für die Data Governance. Indem Sie sich alle drei Monate einen Überblick über Ihre Datensituation verschaffen, kann Ihr Unternehmen aufkommende Trends identifizieren, Probleme beheben und sicherstellen, dass Daten auch künftig ihre Aufgabe als strategische Ressource erfüllen.

Zusätzlich zu einem festen Data-Governance-Fahrplan sollte in jedem Unternehmen ein Chief Data Officer oder CDO vorhanden sein. Ein CDO hat eine Schlüsselposition mit Blick auf die Daten inne, er schützt sie und maximiert kontinuierlich ihren strategischen Beitrag zum Unternehmenserfolg.

WIE WIRKEN SICH VERSCHIEDENE DATENTYPEN AUF DIE DATAOPS-INITIATIVE MEINES UNTERNEHMENS AUS?

Als neues und vielversprechendes Konzept bezeichnet DataOps (zu deutsch: Datenoperationen) das Datenmanagement auf Unternehmensebene im Zeitalter der künstlichen Intelligenz. Durch die Implementierung einer übergreifenden DataOps-Strategie können Sie Ihre Datenkonsumenten und -ersteller nahtlos miteinander verknüpfen, um den Wert Ihrer Daten schnell festzustellen und umfassend zu nutzen.

DataOps ist weder ein Produkt noch eine Dienstleistung oder Lösung. Es ist eine Methodik, ein technologischer und kultureller Wandel, der mithilfe einer höheren Datenqualität, kürzeren Zykluszeiten und einem herausragenden Datenmanagement die Verwendung von Daten im Unternehmen verbessert.

Da DataOps den gesamten Zyklus des Sammelns und Anwendens von Informationen abdeckt, muss Ihr Unternehmen zwingend in der Lage sein, alle Arten von Daten effizient zu verwalten. Indem die Daten bereinigt, sorgfältig verwaltet und sofort zugänglich gemacht werden, erhält Ihre DataOps-Initiative genau die Informationen, die Sie benötigen, um strategische Entscheidungen auf der Grundlage von Fakten und nicht von Vermutungen zu treffen.

Mit seiner erwiesenen DataOps- und Data-Governance-Kompetenz für sämtliche Datentypen ist Hitachi Vantara ein natürlicher Partner Ihres Unternehmens. Durch die Einführung einer datengesteuerten Kultur und Denkweise kann Hitachi dazu beitragen, dass Daten im Mittelpunkt Ihrer täglichen Geschäftsabläufe stehen.

{ "FirstName": "Vorname", "LastName": "Nachname", "Email": "Geschäftliche E-Mail", "Title": "Stellenbezeichnung", "Company": "Firmenname", "Address": "Address", "City": "City", "State":"Bundesland", "Country":"Land/Region", "Phone": "Telefon", "LeadCommentsExtended": "Weitere Informationen (optional)", "LblCustomField1": "What solution area are you wanting to discuss?", "ApplicationModern": "Application Modernization", "InfrastructureModern": "Infrastructure Modernization", "Other": "Other", "DataModern": "Data Modernization", "GlobalOption": "Wenn Sie unten „Ja“ auswählen, stimmen Sie dem Erhalt kommerzieller Informationen über Produkte und Dienstleistungen von Hitachi Vantara per E-Mail zu.", "GlobalOptionYes": "Ja", "GlobalOptionNo": "Nein ", "Submit": "Senden", "EmailError": "Must be valid email.", "RequiredFieldError": "This field is required." }
{ "FirstName" : "Bitte geben Sie einen Vornamen ein.", "LastName" : "Bitte geben Sie einen Nachnamen ein.", "Title" : "Bitte geben Sie eine Stellenbezeichnung ein", "Company" : "Bitte geben Sie einen Firmennamen ein", "City" : "Bitte geben Sie eine Stadt ein", "State" : "Bitte geben Sie einen Staat ein", "Country" : "Bitte geben Sie ein Land ein", "Phone" : "Bitte geben Sie eine Telefonnummer ein", "phoneforForm" : "Bitte geben Sie eine Telefonnummer ein", "Email" : "Geben Sie eine gültige geschäftliche E-Mail-Adresse ein" }
de