Aber wie gelingt der Einstieg in KI? Mit dem Automated-Machine-Learning-Tool (AutoML) gibt Weidmüller dem Nutzer eine entsprechende Software an die Hand. Damit gelingt der Einstig auch ohne den Einsatz von Data Scientisten, denn mit dem AutoML-Tool werden die Domänenexperten befähigt auf Basis ihres Applikationswissens eigenständig Machine-Learning (ML) Modelle zu erzeugen. So können Sie ihr tiefes Fachwissen über ihre Maschinen- und Anlagenprozesse mit einbringen bis am Ende des Modellbildungsprozesses der Experte das für seine Applikation am besten passende erhält.
Komplexer Modellbildungsprozess
Heute analysieren Data Scientists die Daten und erstellen ML-Modelle. Dieser Prozess ist weitestgehend manuell und explorativ. Dabei entsteht nicht nur das eigentliche Modell, sondern auch eine sogenannte ML-Pipeline, in der die Daten viele Verarbeitungsschritte durchlaufen und an deren Ende das Modell ausgeführt sowie das Ergebnis ausgegeben wird. Der Prozess der Modellbildung und der Erstellung der ML-Pipeline ist sehr komplex. Insgesamt gibt es bis zu 1040 Kombinationsmöglichkeiten um eine ML-Lösung aufzubauen. Die konkrete Ausgestaltung der ML-Pipeline ist für jeden Use Case spezifisch. Natürlich gibt es einige Software-Werkzeuge für den Data Scientist, die den grundlegenden Aufbau der Pipeline unterstützen und damit die Arbeit der Data Scientists vereinfachen. Jedoch sind die meisten Parameter für die ML-Lösung in kreativer und zugleich mühevoller Arbeit manuell zu bestimmen. Bei der Modellbildung und dem Aufbau der Pipeline diskutiert der Data Scientist kontinuierlich die in den Daten gefundenen Zusammenhänge mit den Maschinen- und Prozessexperten. Gemeinsam erfolgt eine ingenieurmäßige Interpretation der Ergebnisse, wodurch letztendlich die Parameter für das Modell sowie die Pipeline identifiziert und festgelegt werden. Das Applikationswissen der Domänenexperten trägt also entscheidend für den Erfolg einer gute ML-Lösung bei.
Die Anwendung von Machine Learning demokratisieren
Die Vision von Weidmüller ist es, die Anwendung von Machine Learning zu demokratisieren, d.h. jedem Domänenexperten in der Industrie zugänglich zu machen, damit die Anwendung von ML in der Industrie nicht durch die beschränkte Anzahl von Data Scientists gehemmt wird und das vorhandene Wissen der Fachexperten optimal genutzt wird. Dazu ist die Anwendung von ML für industrielle Applikationen soweit zu standardisieren und zu vereinfachen, dass Domänenexperten ohne Expertenwissen im Bereich Data Science eigenständig ML-Lösungen erzeugen können. Dies umfasst zudem eine weitestgehende Automatisierung der Modellbildung sowie der Generierung der ML-Pipeline, um die Erzeugung der ML-Lösung zu beschleunigen. Der Technologische Ansatz dahinter wird mit dem Term Automated Machine Learning beschrieben, wobei es nicht der Anspruch ist, den Prozess der Generierung von ML-Lösungen komplett zu automatisieren. Ganz im Gegenteil: Die Domänenexperten sollen ihr Wissen bewusst mit dem AutoML Prozess verknüpfen, um so exzellente ML-Lösungen zu schaffen.
Guided Analytics
Mit der AutoML-Software können Domänenexperten ML-Modelle erzeugen. Dabei führt die AutoML-Software den Nutzer durch den Prozess der Modellentwicklung, weshalb wir hier auch von „Guided Analytics“ sprechen. Dabei fokussiert sich der Experte auf sein Wissen zum Maschinen- und Prozessverhalten und verknüpft dieses mit den im Hintergrund ablaufenden ML-Prozessen. Das bedeutet, dass die Software bei der Übersetzung und Archivierung des vorhandenen und wertvollen Applikationswissens in eine verlässliche Machine Learning-Anwendung hilft, indem das vorhandene Wissen geschickt abgefragt und mit dem im Hintergrund arbeitenden ML-Verfahren kombiniert wird.
Domänenexperten entwickeln eigenständig Machine-Learning-Lösungen
Die AutoML-Lösung besteht im Wesentlichen aus zwei Modulen zur Modellbildung, -ausführung, und -optimierung sowie zum Management der Modelle über ihren Lebenszyklus.
Mit dem Modul zur Modellbildung kann der Domänenexperte basierende auf den Trainingsdaten und seines Applikationswissen ML-Lösungen zur Anomalieerkennung, Klassifikation und Fehlervorhersage erzeugen. Weltweit einmalig ist die Anomalieerkennung lediglich auf Basis von „Gut-Daten“, dem „unsupervised“ Training. Ein Algorithmus erlernt dabei die typischen Datenmuster eines normalen Maschinenverhaltens anhand historischer Daten. Zur Laufzeit können Abweichungen von diesen Mustern identifiziert werden. Bei den erkannten Anomalien kann es sich um Ineffizienzen, kleinere Störungen oder größere Fehlerfälle handeln. Das System ist durch diese Herangehensweise in der Lage, auch bisher vollkommen unbekannte Fehlerfälle schon bei ihrem ersten Auftreten zu erkennen. Ergebnis des Modellbildungsprozesses ist eine komplett konfigurierte ML-Pipeline inklusive des Modells.
Darüber hinaus dient der Modellbuilder zur Optimierung der ML-Modelle im Betrieb. Neue Ereignisse wie bestimmte Betriebssituationen, Anomalien oder Fehler, die während des Betriebs einer Maschine vorkommen und nicht in den Trainingsdaten enthalten waren, können den Modellen mit wenigen Klicks hinzugefügt werden, wodurch sich die Modelle über ihren Lebenszyklus kontinuierlich verbessern lassen.
Das zweite Modul der AutoML-Lösung ist die Ausführungsumgebung, die zum Betrieb der ML-Modelle in der Cloud oder in einer on Premise-Anwendung dient. Sie ist plattformunabhängig und skaliert automatisch gemäß der Anzahl der auszuführenden Modelle. Darüber hinaus stellt die Ausführungsumgebung die Modellergebnisse verständlich dar, sodass der Nutzer konkrete Handlungen z.B. zur Fehlervermeidung umsetzten kann. Da die Modelle über ihren Lebenszyklus angereichert werden und damit Modellvarianten entstehen, ist ein Modellmanagement ein weiterer Bestandteil der Ausführungsumgebung. Das Modellmanagement stellt u.a. Funktionen zur Modellversionierung, -wiederherstellung, und -Modellüberwachung bereit.
Entscheidend ist das Wissen der Applikationsexperten
Bei der automatischen Modellbildung werden zunächst auf Basis der Struktur der Trainingsdaten der Analyseaufgabe und des Applikationswissen automatisch passende ML-Verfahren ausgewählt. Dabei werden bis zu 300 Feature für jede Datenspur aus den Rohdaten erzeugt und damit ein relativ großer Lösungsraum aufgespannt. Dann werden alternative ML-Modelle mit unterschiedlichen Feature-Kombinationen trainiert und ihre Hyperparameter optimiert. Abschließend erfolgen eine Validierung der Modelle und ihre Integration in die parallel generierte ML-Pipeline. Alle diese Schritte laufen vollständig automatisch ab. Je nach Komplexität kann die Berechnung der Modelle Minuten oder Stunden dauern, wobei erste Modelle bereits nach wenigen Minuten vorliegen, so dass der Nutzer schnell eine Rückmeldung zur Güte der Modelle bekommt und entscheiden kann, ob der Modellbildungsprozess fortgesetzt oder abgebrochen werden soll.
Entscheidend für den Erfolg des Modellbildungsprozesses ist das Applikationswissen der Domänenexperten, mit dem der Trainingsdatensatz angereichert wird. Auf Basis ihres Maschinen- und Prozesswissens können sie die Daten labeln, also z.B. gewünschtes und nicht gewünschtes Verhalten der Maschine in den Daten markieren. Nach demselben Prinzip lassen sich bestimmte Prozess- oder Fertigungsschritte labeln. Ein typisches Beispiel ist das Anlaufverhalten einer Maschine. Ebenso kann der Nutzer eigene Feature erzeugen, die in den Rohdaten nicht enthalten sind aber helfen den Fertigungsprozess zu beurteilen. Der mit dem Applikationswissen angereicherte Datensatz ist die Eingangsgröße für anschließende automatische Generierung der ML-Modelle. Dabei entstehen ML-Lösungen, die mit den von Data Scientists manuell erstellten Lösungen vergleichbar sind. Am Ende des Modellbildungsprozesses wählt der Nutzer das für seine Applikation am besten passende Modell nach bestimmten Kriterien wie Modellgüte oder Ausführungszeit aus. Das favorisierte Modell kann exportiert und gespeichert oder in die Ausführungsumgebung integriert werden.
Fazit
Die Weidmüller AutoML Lösung ermöglicht es praktisch jedem Applikationsexperten in der Industrie, ML-Modelle für verschiedenste Use Cases zu erstellen und einzusetzen. Sie ist die erste Lösung, mit der ML-Modelle ohne Expertenwissen im Bereich Data Science und nur auf Basis des Domänenwissens erzeugt werden können. Im Zentrum steht der Nutzer mit seinem Applikationswissen, was letztendlich auch dazu beiträgt die Akzeptanz von ML in der Industrie zu erhöhen. Die Software ist eine Ende-zu-Ende Lösung zum Erstellen, Betreiben und Optimieren von ML-Modellen, die es bisher so für industrielle Anwendungen nicht gibt. Sie reduziert die Komplexität beim Einsatz des maschinellen Lernens und beschleunigt die Realisierung von ML-Lösungen erheblich. Damit wird ein starker Beitrag geleistet die Industrie mit ML-Anwendungen in der Breite zu durchdringen, was entscheidend ist für den ökonomischen und ökologischen Erfolg des europäischen Wirtschaftsstandorts. Nicht nur der Gewinn des Deutschem Exzellenz-Preis 2020 zeigt die einfache Anwendung des Automated Machine-Learning Tools, auch die Rückmeldungen erster Pilotanwender bei Maschinenbauern und -betreibern zeigt, dass der Auto-ML-Service in seiner Funktionsweise und in der Nutzerführung optimal auf die Bedürfnisse der Anwender zugeschnitten ist.