Herausforderungen und Lösungen
Der Automobilhersteller stand vor der Herausforderung, Daten aus über zehn unterschiedlichen Quellen zu integrieren. Diese Datenarten und Quellsysteme wiesen eine hohe Komplexität und Diversität auf, was die Notwendigkeit eines standardisierten Frameworks zur Datenintegration mit sich brachte. Das Ziel war, Datenqualitätsprobleme frühzeitig zu erkennen und die Datenqualität insgesamt zu verbessern.
Das Projektteam von statworx entwickelte hierfür ein Framework basierend auf der Medallion Architecture, das in Bronze-, Silver- und Gold-Layer unterteilt ist. Diese Struktur ermöglicht es, Daten schrittweise zu veredeln und zu validieren. Während der Implementierung legten die Data Engineers von statworx besonderen Wert auf die Datenqualität, um den hohen Anforderungen des Kunden gerecht zu werden.
Datenqualität im Fokus
Durch Workshops mit verschiedenen Abteilungen des Automobilherstellers wurden Prioritäten für die Datenqualität gesetzt und ein Dashboard entwickelt, das die Überwachung der Datenqualität unterstützt. Um Fehler zu minimieren und die Effizienz zu steigern, wurden automatisierte Tests und Deployments mittels CI/CD-Pipelines eingeführt. Die technische Umsetzung erfolgte unter anderem mit Databricks und Azure-Komponenten wie Azure Data Factory.
Mehrwert für den Kunden
Dank des neuen Frameworks kann der Automobilhersteller nun Daten schneller und zuverlässiger integrieren. Automatisierte Tests und ein schnelleres Onboarding neuer Datenquellen erhöhen die Flexibilität des Unternehmens und ermöglichen eine schnellere Reaktion auf Veränderungen. Das Data Quality Dashboard sorgt dafür, dass die Datenqualität kontinuierlich überwacht und verbessert wird.
Diese Entwicklung unterstreicht die Bedeutung von Qualität und Effizienz bei der Datenintegration. Mit dem richtigen System und den passenden Tools können Unternehmen ihre Daten umfassend nutzen und fundierte Entscheidungen treffen.