Blog

Effektiv Datenqualität messen: Ein Leitfaden zur Umsetzung 2/2

mit Textmarker hervorgehobener Text

Der zweite Teil unserer Blog-Reihe zu Datenqualität soll Maßnahmen vorschlagen, mit denen Sie die Qualität Ihrer Unternehmensdaten steigern können.

Die drei wichtigsten Maßnahmen für nachhaltig verbesserte Datenqualität in diesem Artikel:

  1. Datenbereinigung

  2. Systemintegration

  3. Regelmäßige Datenqualitätsprüfungen

Verbesserung der Datenqualität durch Datenqualitätsmanagement

Eine reine Messung der Datenqualität ist sinnvoll, um sich einen ersten Überblick zu verschaffen. Dies führt jedoch noch nicht zu einer Verbesserung der Datenqualität. Daher schließt sich an eine Datenqualitätsmessung die Behebung von Datenfehlern, die Identifikation und Bekämpfung von Fehlerursachen sowie die Schaffung organisatorischer Maßnahmen (Aufbau und Umsetzung einer Data Governance) an.

Dies erfordert eine Kombination aus präventiven Maßnahmen, wie z.B. die Einführung von Prüfregeln zur Vermeidung von Datenqualitätsproblemen bereits bei der Datenanlage oder -änderung, und reaktiven Maßnahmen, wie z.B. Dublettenbereinigung und Fehlerkorrektur. Im begleitenden Datenqualitätsmanagement (Data Governance) werden diese Maßnahmen konsolidiert und verankert. Ziel ist es, eine optimale Kombination aus präventiven und reaktiven Maßnahmen zu finden, um Datenprobleme frühzeitig zu erkennen und damit Risiken und Kosten zu vermeiden. Langfristiges Ziel jeder Organisation ist die nachhaltige Umsetzung eines präventiven Ansatzes zur Sicherung der Datenqualität.

1. Datenbereinigung

Reaktiver Ansatz:

Datenbereinigung ist häufig der erste Ansatz zur Wiederherstellung einer korrekten Datenbasis als Grundlage für die Verbesserung der Datenqualität. Dabei spielt die Dublettenerkennung und -bereinigung eine entscheidende Rolle, ebenso wie die Erstellung von Prüfregeln zur Messung der Datenqualität und die Erfolgskontrolle nach der Bereinigung. Spezielle Softwaretools überprüfen den gesamten Datenbestand und finden Einträge, die sich auf das gleiche Geschäftsobjekt beziehen, aber unterschiedliche Informationen enthalten. In einem als Datenharmonisierung bezeichneten Prozess werden diese zu einem übergreifenden, aussagekräftigen Datensatz - dem Golden Record - zusammengeführt.

Weitere typische Korrekturen sind Plausibilitätsverletzungen (z.B. das Nettogewicht muss immer kleiner sein als das Bruttogewicht eines Artikels), Füllgrade und Grenzwerte wie Min- und Maxwerte (z.B. Postleitzahlen müssen genau fünfstellig sein und eine Zahl zwischen 01067 und 99998 ergeben). Darüber hinaus ist es sinnvoll, Formatanpassungen direkt bei der Datenbereinigung vorzunehmen, um die Datenstruktur zu vereinheitlichen. Typische Formatanpassungen sind z.B. die Verwendung von Standards für Datumsformate (z.B. TT.MM.JJJJ), Adressen (z.B. Hausnummern in eigenem Feld) oder Telefonnummern (z.B. Ländervorwahl-Ortsvorwahl-Rufnummer).

Die dauerhafte Wirkung der Datenbereinigung ist jedoch begrenzt. Im Laufe der Zeit erfährt Ihr Stammdatensatz durch die ständige Neuanlage und Aktualisierung von Daten durch verschiedene Fachabteilungen und Nutzer neue Qualitätsverluste. Nutzen Sie daher die Erkenntnisse aus Ihrem Datenbereinigungsprozess, um typische Datenqualitätsprobleme in Ihrem Unternehmen zu dokumentieren. Auf dieser Basis sollten Sie ein strukturiert abgelegtes Qualitätsregelwerk erstellen, das Sie für weitere qualitätssichernde Maßnahmen (Erfolgskontrolle) und den Aufbau präventiver Ansätze (Data Governance) nutzen können.

Schaubild: DATAROCKET Core als Stammdatenmanagement-Tool lädt Daten aus einer externen Datenquelle, Mappt diese im Referenzdatenmodell, analysiert, berinigt und pflegt die Daten und produziert Golden Records zur Weiterverarbeitung in DATAROCKET oder externen Tools

2. Systemintegration

In den meisten Unternehmen werden die Daten je nach Datentyp (Kundendaten, Materialdaten, Produktdaten, Debitorendaten, Kreditorendaten etc.) in mehreren Systemen (z.B. ERP-, CRM-, PIM-Systeme oder individuell aufgesetzte Datenbanken) parallel verwaltet. Bereits eine Änderung des verwendeten Datenmodells kann sich positiv auf die Datenqualität auswirken. So erleichtert beispielsweise die Trennung von Einheit und Wert und die Normierung auf eine Größe wie Kilogramm (kg) die spätere systemübergreifende Analyse der Datenqualität und den Aufbau unternehmensweit gültiger Kennzahlen zur Datenqualität im Reporting.

Darüber hinaus ist es ratsam, Ihre Systeme dahingehend zu optimieren, dass die Bedienung noch einfacher und intuitiver wird, z.B. durch eine Anpassung der Bezeichnungen von Datenfeldern, um die Verständlichkeit für alle beteiligten Anwender zu erhöhen. Besonderes Augenmerk sollte auch auf die verwendeten Schnittstellenprogramme gelegt werden, da der Datentransfer über Systemgrenzen hinweg eine häufige Fehlerquelle darstellt.

Um die Datenqualität weiter zu verbessern, ist es sinnvoll, eine zentrale Drehscheibe zu schaffen, die mit allen relevanten Systemen verbunden ist. Hier laufen alle Daten zu einem Single Point of Truth zusammen. Ein hinterlegtes Datenqualitätsregelwerk kann bereits während der Eingabe automatisiert prüfen, ob die neu hinzugefügten und bearbeiteten Werte gültig sind oder ob in diesem Moment ein Duplikat erzeugt wird.

3. Regelmäßige Datenqualitätsprüfungen

Um eine gleichbleibend hohe Datenqualität zu gewährleisten, ist neben der Datenbereinigung die Konzeption und Umsetzung von Data Governance-Prozessen unerlässlich. Dies führt häufig auch dazu, dass Prozesse angepasst werden müssen und das unternehmensweite Daten- und Qualitätsmanagement angepasst werden muss. Nur wenn die relevanten Geschäftsprozesse durch Data Governance Prozesse unterstützt werden oder zumindest regelmäßige Datenqualitätsprüfungen in die Geschäftsprozesse integriert sind, können identifizierte Datenqualitätsmängel langfristig beseitigt werden.

Ein Beispiel hierfür ist die Verteilung der Verantwortlichkeiten für die Datenerstellung, -pflege und -qualitätssicherung. Data Owners (Datenverantwortliche) benötigen Entscheidungskompetenzen - ihre Benennung ist daher eine organisatorische Frage. Sie werden durch die fachliche Expertise der Data Stewards unterstützt. Alle Mitarbeiterinnen und Mitarbeiter, die Aufgaben im Datenmanagement übernehmen, müssen entsprechend geschult werden. In der Praxis hat sich diese präventive Maßnahme als äußerst zielführend erwiesen, da sie neben der technischen Unterstützung durch die oben genannten Systemoptimierungen die Mitarbeiter in ihrer täglichen Arbeit enorm unterstützt.

Ebenso kann die regelmäßige Überprüfung der Datenqualität in den unternehmensweiten Prozessen etabliert werden. Eine permanente Überwachung kann durch wiederholte Messungen der Datenqualität realisiert werden. Diese ermöglichen einen Überblick über die Entwicklung und den aktuellen Stand der Datenqualität im Unternehmen.

Data Governance sichert langfristig höchste Datenqualität in Ihren Systemen

Um die Qualität Ihrer Daten über den gesamten Lebenszyklus zu sichern, ist die Einführung einer Data Governance notwendig. Richtlinien legen fest, welche Standards im Unternehmen Anwendung finden und welche Verantwortungsbereiche die Aufgaben im Datenmanagement übernehmen. In diesem Sinne ist Data Governance der Rahmen für Ihr Datenqualitätsmanagement. Sie profitieren davon, die unternehmensweite Ressource „Daten“ gezielt in Ihren Wertschöpfungsprozessen einzusetzen und die Datenqualität in Ihrem Unternehmen kontinuierlich zu stärken.

DATAROCKET Guide ist das Data Governance Tool zur Abbildung Ihrer Unternehmensdaten. Präsentieren Sie Ihre Unternehmensdaten und ordnen Sie Verantwortlichkeiten, Standards und Geschäftsbegriffe zu.

Sind Sie bereit, Ihr Datenwissen im Unternehmen zu sammeln und transparent abzubilden?

Das Tool zur Einführung von Data Governance Prozessen – Sammeln Sie das Wissen zu Ihren Unternehmensdaten und machen Sie Regeln, Verantwortlichkeiten und Richtlinien transparent.

Weitere Blog-Beiträge