Markus Ruf ist einer der Geschäftsführer von mip Management Informationspartner und konnte die Entwicklung des Data Warehouse über viele Jahre beobachten, während er DWH-Architekturen in Unternehmen der unterschiedlichsten Branchen und Größe aufbaute oder modernisierte. Im Interview beantwortet er Fragen zu traditionellen Systemen und neuen Technologien.
Herr Ruf, welche Gründe haben Unternehmen für die Einführung eines Data Warehouse?
In Daten innerhalb und außerhalb der Unternehmen stecken unglaubliche Mengen an Informationen und somit ein unschätzbares Wissen. Kaum ein Unternehmen kann es sich heute leisten, das nicht zu nutzen, um unternehmerische Vorteile zu erlangen. Je komplexer die Unternehmenswelt im Zuge der Digitalisierung wird, desto mehr werden Hilfsmittel zur Entscheidungsfindung eingesetzt. Doch die Datenmengen müssen verfügbar und nutzbar gemacht werden. Während früher Data Warehouses vorwiegend Entscheidungsprozesse im Management unterstützt haben, nutzen heute auch zunehmend Anwender aus den Fachbereichen die Möglichkeiten zur Aufbereitung, Darstellung und Visualisierung.
Viele sagen, das Data Warehouse in Zeiten von Big Data und Digitalisierung hat ausgedient. Wie ist Ihre Meinung dazu?
Das DWH hat keinesfalls ausgedient, im Gegenteil. Zum einen braucht man es nach wie vor für die Aufbereitung von Standardreports und Planungsszenarien. Zum anderen sollen vor allem unstrukturierte Daten aus externen Quellen integriert und sinnvoll verknüpft werden.
Moderne Techniken unterstützen dabei. Neben klassischen Datenbankorganisationen gewinnt beispielsweise Data Vault in Verbindung mit einer relationalen Datenbank (DB) zunehmend an Bedeutung, wenn häufig Änderungen in der DB durchgeführt werden müssen. Zumal heute auch die dazu benötigten Rechnerkapazitäten vorhanden sind.
Im Big-Data- und Data-Lake-Umfeld will man vor allem qualitative Informationen an das Data Warehouse ankoppeln. Es gilt, diese Daten zu analysieren und Muster zu erkennen. Muster wiederum können nur bewertet werden, wenn Vergleichsgrößen aus der Vergangenheit existieren. Das gilt für alle Analysen, die Vorhersagen bringen sollen, Stichwort: Predictive Analytics. Auch diese brauchen stets den Vergleich mit vorliegenden Datenprofilen, um Muster oder neue Trends identifizieren zu können. Die Daten über einen längeren Zeitraum vorzuhalten, ist eine der Aufgaben eines DWH.
Welche neuen Anforderungen an ein DWH bringt die Digitalisierung mit sich?
Immer mehr Prozesse sind digitalisiert und die Menge der zu nutzenden Informationen hat sich exponentiell vergrößert. Seien es Sensor- und Maschinendaten, umfangreiche Bild-/Audio-Dateien oder Informationen zum Nutzerverhalten aus dem Web. Die Anzahl der möglichen und geforderten Auswertungen, idealerweise in Echtzeit und die Zahl der Nutzer aus den Fachbereichen steigt enorm an.
Es wird immer mehr KI-gesteuerte Systeme geben, die ihre kognitiven Fähigkeiten erlernen müssen. Dazu wiederum braucht es den Vergleich mit bestimmten Systematiken, Mustern oder Profilen, die aus gespeicherten Informationen abgeleitet werden. Auch hierzu benötigt es immer den Vergleich mit der Vergangenheit.
Wann lohnt es sich für die Kunden ein bestehendes DWH zu modernisieren?
Größere unstrukturierte Datenmengen, höhere Userzahlen und Abfragefrequenzen sowie veränderte Recherchemodi bringen ältere Data Warehouses irgendwann an ihre Grenzen. Hier lohnt sich eine Bestandsaufnahme. Die Frage ist immer, welche neuen Anforderungen sich an das DWH stellen.
Ein radikaler Neuanfang ist in den meisten Fällen nicht nötig. Es geht eher darum, bestehende Lösungen und Architekturen zu ergänzen, zu erweitern. Die vielen neuen Tools bieten auch günstige Möglichkeiten für kleinere Unternehmen, das Beste aus ihren Daten herauszuholen.
Echtzeit und Performance - wie wichtig ist das heute in einer DWH-Umgebung?
Ein modernes Data Warehouse ist hochverfügbar, um laufende Auswertungen im Tagesgeschäft zu ermöglichen und Entscheidungen zu steuern. Welche Strategie dabei verfolgt wird, ist von Unternehmen zu Unternehmen, je nach Bedarf und Budget, unterschiedlich und muss individuell geklärt werden. Die Aufgabenstellung, der Nutzer und der Einsatzbereich bestimmen, ob eine (Fast)-Echtzeit-Verarbeitung notwendig ist.
Heute sind die Anforderungen und die Erwartungshaltung an die Geschwindigkeit der Ergebnis-Bereitstellung sehr hoch. Die Abfragen im DWH, die zum Teil komplex sein können, dürfen andere Systeme wie beispielsweise das ERP nicht belasten. Unsere Empfehlung ist es, das DWH auf einer eigenen Infrastruktur zu betreiben. Die beste Performance erzielt man mit einer guten Aufbereitung der Datenbasis und einer für ein DWH optimal konfigurierten Hardware.
Wie unterstützt mip Unternehmen bei der Datenverarbeitung?
Seit über 30 Jahren stehen wir Unternehmen beratend und projektbegleitend zur Seite und bilden das Bindeglied zwischen den Anforderungen des Business-Anwenders in der Fachabteilung und der IT. Mit neuen Anwendungen auch von strategischen Partnern und Dienstleistungen unterstützen wir dabei, semi- bzw. unstrukturierte Daten aus externen Datenquellen zu integrieren und bestmöglich zu nutzen.
Es macht für ein Unternehmen schon einen Unterschied, ob die genutzten Auswertungen alle auf einer umfassenden einheitlichen Datenbasis wie beim Data Warehouse basieren oder auf individuell gepflegten Excel-Listen mit abweichenden und unvollständigen Werten.
Herr Ruf, vielen Dank für das informative Interview!
Ausblick:
Teil 3 der Artikelserie „Intelligente Datenintegration“: Der Blick in die Zukunft mit der vorausschauenden Analyse (Predicitive Analytics)
Rückblick:
Teil 1 der Artikelserie „Intelligente Datenintegration“: Intelligente Datenintegration – Voraussetzung für aussagekräftige Datenanalysen