Innovation on steroids - Teil 1 — Mit Domain-driven Design, Event Storming und ML Design Canvas zu mehr Produktverständnis

Teil 2: Mit DDD und ML Design Canvas Use Cases für Machine Learning identifizieren

Wenn die Konkurrenz sich weiterentwickelt und Unternehmen nicht darauf reagieren, verlieren das Produkt oder sie selbst irgendwann an Bedeutung. Kodak oder Nokia sind nur zwei bekannte Beispiele. Machine Learning und KI können dabei helfen, zu einem besseren Produktverständnis zu gelangen und langfristig Wettbewerbsvorteile zu sichern.

Machine Learning und KI sind keine neuen Methoden, erleben jedoch derzeit einen Durchbruch. Zwei Gründe haben ihnen zum Aufstieg verholfen. Einerseits ist da die exponentiell wachsende Datenmenge, die man permanent erzeugt, sammelt und persistiert. Andererseits haben die Entwicklung leistungsfähiger Cloudtechniken und zunehmende Rechenleistung das Trainieren von statistischen Modellen und die Prediction performanter gemacht.

Machine Learning und KI haben neu definiert, wie Unternehmen funktionieren. Viele versuchen ihre Wettbewerbsfähigkeit zu steigern, indem sie Techniken aus diesem Umfeld einführen.

Einige der größten Unternehmen der Welt haben ihr Kerngeschäft auf der Anwendung von ML und KI für einfache Fragen wie diese aufgebaut:

Welche Webseite soll man auf der Grundlage einer kurzen Anfrage anzeigen?
Welche Anzeige sollte in einem bestimmten Kontext erscheinen?
Welches Produkt sollte dieser Käufer sehen?
Welchen Film würde diesem Benutzer gerade jetzt gefallen?
Welche Programme sollte man für die Ausführung blockieren, um eine Maschine sicher zu machen?
Was ist das für ein Objekt auf dem Bild?

Der Einsatz von ML-Methoden hat Unternehmen im Wert von mehreren Milliarden hervorgebracht O’Reilly. Laut diverser Prognosen könnten Unternehmen, die KI vollständig integrieren, ihren Umsatz bis 2030 verdoppeln.

AI-basierte Prozesse skalieren stärker als ihre traditionellen Vorgänger. Schon heute integrieren Banken „a robot factory”. Das sind sogenannte digitale Assistenten oder Algorithmen, die durch NLP und ML-Methoden die Routinearbeit von Bankangestellten automatisch erledigen können.

Die Innovationskraft von ML und KI liegt in den speziellen Problemstellungen, deren Lösung sich aus den Daten ergeben. Als leistungsfähiges Werkzeug kann ML viele praktische Probleme aus der Welt schaffen. Für solche Probleme könnte eine probabilistische (stochastische) Lösung, die sich mit Hilfe von ML implementieren lässt, der richtige Weg sein. Allerdings, ähnlich wie bei traditioneller Softwareentwicklung, müsste man den „richtigen” Nagel (Anwendungsfall oder Problem) finden, um diesen „Hammer” (ML-Algorithmen) einzusetzen.

In Sprachassistenten wie Alexa, Echo, oder Chatbots arbeitet man mit Techniken wie Spracherkennung oder Stimmungsanalyse. Deep Learning scheint hier am besten geeignet zu sein, da solche Aufgaben viele Elementen mit multidimensionalen Features aufweisen.

Eine andere Art von Aufgaben, die ML übernehmen kann, sind Multiparameteraufgaben, beispielsweise um eine Vorhersage von Aktienkursen zu erstellen, die als Grundlage für Entscheidungen im Aktienhandel dienen.

KI-Anwendungen finden sich überall und kommen täglich zum Einsatz. Etwa wenn man nach einer Website sucht oder etwas bei einem Onlinehändler kauft und dort Empfehlungen angezeigt bekommt. Hinter all dem steckt mit Sicherheit KI, ebenso wie in der Logistik, um die Einkäufe zu den Kunden zu bringen (Bestandsverwaltung, Versand, Routing usw.).

Von IT-First zu KI-First

Die Meinungen und Prognosen zu ML und KI bewegen sich auf in einer breiten Skala von Skeptizismus bis zu Begeisterung. Immer mehr Studien berichten über Erfolge und Misserfolge. Man entwickelt unaufhörlich neue Plattformen und Frameworks für Data Science. Hinter vielen solcher Tools und Frameworks stehen große Firmen und diese produzieren sie als Open-Source-Software. Pyro etwa stammt von Uber, Sagemaker von Amazon oder NLP Framework Flair von Zalando.

Interessant ist dabei, dass die Hauptausrichtung des Geschäftes dieser Firmen nicht Technik ist. Sie konzentrieren sich eher auf Transport, Retail, E-Commerce oder Mode. Initial haben solche Firmen eine „IT-First-Strategie” beschlossen, was ihnen einen klaren Wettbewerbsvorsprung eingebracht hat. Nun lässt sich eine Weiterentwicklung beobachten – der Schritt von „IT-First” zu „AI-First”.

Unternehmen nutzen ML und KI, um ihr Geschäft neu zu definieren, indem sie neue Wege zur Kundenzufriedenheit oder zur Verbesserung der Abläufe identifizieren. Eine ML-Anwendung, die das „Sizing”-Problem (das Bestellen der passenden Größe) löst, bedeutet für Einzelhändler deutlich weniger Rücksendungen und somit eine Kosteneinsparung. Viele Unternehmen, von den kleinen Start-ups bis zu den großen Konzernen, werden mit ML und KI effizienter, effektiver und profitabler.

MLOps - Von Beginn an ML-Betrieb denken

Mit der „Accelerate-Studie” von 2017 hat man wissenschaftliche Beweise gewonnen, dass erfolgreiche Unternehmen sich durch einen kulturellen Faktor auszeichnen: Sie können lernen, neue Dinge schnell und kostengünstig auszuprobieren, das Gelernte zu erfassen und zu wiederholen. Der „Build, Measure, Learn”-Zyklus oder „flywheel effect” ist zum relevanten Merkmal florierender Organisationen geworden. Um Wettbewerbsfähigkeit langfristig zu sichern, müssen Unternehmen schneller Software und Services ausliefern. Der beste Weg, um ML effektiv zu nutzen, ist DevOps zu verinnerlichen – von der Entwicklung bis zum Produkt.

DevOps bietet eine Reihe von Praktiken, um neue Ideen ausprobieren und an deren Verbesserungen zu iterieren. Für die Operationalisierung von ML-Komponenten hat sich eine neue Disziplin etabliert: MLOps. Man verwendet DevOps-Prinzipien für ML-Systeme (MLOps), um die Entwicklung (Development) und den Betrieb (Operations) zu kombinieren. Die Integration von ML-Modellen erfordert eine Erweiterung von DevOps um genau zwei Komponenten: Daten und ML-Modelle. MLOps ermöglicht alle Schritte der Entwicklung zu automatisieren und zu überwachen sowie ML-Systeme in Softwareprojekte einzubinden.

Abb.1: Der ML-Projektlebenszyklus nach CRIP-ML(Q)-Modell definiert sechs iterative Phasen für die Entwicklung von ML-Anwendungen

Business and Data Understanding: In der Anfangsphase geht es um Aufgaben zur Definition von Business Use Cases und deren Übersetzung in ML-Projekte, die Machbarkeit des Projektes, die Überprüfung der Daten und deren Qualität. Anschließend gilt es, zu entscheiden, ob das Projekt fortgesetzt werden soll. In dieser Phase ermittelt man alle Requirements für das Projekt.

Data Preparation: In dieser Phase erstellen Entwickler einen Datensatz für die nachfolgende Modellierungsphase. Die Data Preparation ist jedoch keine statische Phase, man kehrt aus späteren Phasen immer wieder zurück, wenn etwa in der Modellierungsphase oder in der Deployment-Phase fehlerhafte Daten auftauchen.

Modeling: Das Ziel der Modellierungsphase besteht darin, ein oder mehrere Modelle zu erstellen, die die in der ersten Phase spezifizierten Anforderungen erfüllen. Die Wahl der ML-Techniken hängt von der Geschäftsdomäne, dem Geschäftsproblem, Daten und den Randbedingungen des Projekts ab. Die Anforderungen und Randbedingungen, die in der ersten Phase „Business and Data Understanding” definiert wurden, dienen als Input, um die Modellauswahl zu treffen.

Evaluation: Die Phase der Evaluierung setzt sich aus drei Aufgaben zusammen: Bewertung der Performance, Robustheit und Erklärbarkeit. Bei der Evaluierung eines ML-Modells für ein Businessproblem ist es wichtig, die Korrektheit der Ergebnisse sicherzustellen, aber auch ihr Verhalten bei falschen Eingaben zu untersuchen. Ausführliche Tests reduzieren jedoch das Risiko von Fehlverhalten des Modells. Beim Testen muss man immer die stochastische Natur von Machine Learning beachten. Das heißt, 100 Prozent Testgenauigkeit lässt sich nie erreichen.

Deployment: Nachdem das ML-Modell die Evaluierungsphase erfolgreich bestanden hat, geht es daran, es ins Produktivsystem zu integrieren.

Monitoring and Maintenance: Diese Phase sichert die Qualität des ML-Modells während des Lebenszyklus. Wenn man das ML-Modell nicht wartet oder kein Monitoring durchführt, besteht das Risiko, dass die Leistung im Laufe der Zeit nachlässt. Das führt zu falschen Vorhersagen und Fehler können im System propagieren. Dieses Phänomen ist unter dem Namen „model decay” bekannt und muss durch Monitoring immer wieder beseitigt werden, indem man ein ML-Modell-Retraining ansteuert.

Dieser Artikel fokussiert sich auf die erste Phase des kompletten MLOps-Lebenszyklus: ML-Design „Business and Data Understanding”

ML-Use-Cases-Problem

Viele haben mittlerweile das Innovationspotenzial hinter ML erkannt. Mit diesem Verständnis fragt man sich, wie sich solche Techniken nutzen lassen. Oft wissen Unternehmen nicht, wie sie in diesem Zusammenhang starten sollen. Es gibt keine Anleitungen, wie man ML und KI in Unternehmen einführt. Der Gesamtprozess der Innovation umfasst Use-Case-Findung, Data-Science-Prozess bis hin zu Einführung von ML-Modellen im Betrieb. Es ist ein sehr individueller und kein trivialer Prozess.

Laut O’Reilly Studie „AI adoption in the enterprise 2020” existieren zwei Gründe, warum die Innovation mit KI nicht erfolgreich wurde. Einerseits sind es die Schwierigkeiten bei der Identifizierung geeigneter ML-Anwendungsfälle und andererseits die Firmenkultur, die Innovation ablehnt.

Ein ML-System muss ein Use Case haben, der für die Benutzer sinnvoll erscheint, um ihre Ziele zu erreichen. Die Auswahl eines Use Cases ist ein kritischer Teil des Erfolgs, aber es ist nicht leicht, ihn zu finden. Wenn man den Aufwand der Personal-, Daten- und Infrastrukturbeschaffung berücksichtigt, kann an es kostspielig und zeitaufwendig werden, an einem falschen Use Case zu arbeiten. Solche Projekte stellt man irgendwann ein, ohne dass sie irgendeinen Wert erzeugt haben.

Der erste Teil dieses Artikels soll helfen zu verstehen, welche Potenziale ML- und KI-Technik besitzen. Er trägt dazu bei, zu entscheiden, wann sich eine solche Technik einsetzen lässt. Der zweite Teil widmet sich einem konkreten Beispiel und durchläuft den ganzen Prozess der Use-Case-Findung und ML-Projektstrukturierung.

ML Use Cases: Was? Wann? Womit?

Um Use Cases identifizieren zu können, sollte man zuerst zwei Aspekte verstehen. Erstens, welche Möglichkeiten n ML und KI für den konkreten Fall bieten und wo sie an ihre Grenzen kommen. Was kann AI überhaupt? Zweitens, muss man sich im Klaren über den kompletten Workflow sein, um zu entscheiden, wo man ein ML-Task einsetzt. Um Fragen in diesem Kontext zu beantworten, lohnt sich ein Blick auf die Domain-driven Design Methoden für Knowledge Crunching.

Zu verstehen, für welchen Typ der Probleme sich ML und KI am besten eignen, entscheidet über den Erfolg eines ML-Projektes. Ähnlich wie die Auswahl eines Use Cases. An dieser Stelle begegnet man drei Aspekten bezüglich der Einführung von ML in ein Unternehmen: Was, wann und womit.

Was: Welche Probleme sind für ML und KI am besten geeignet?

ML-Methoden liefern nicht-deterministische Lösungen (Abb. 2). Sie sind datengetrieben und es ist schwer eine Reihe an Schritten zu definieren (etwa ein Algorithmus oder ein Programm), um zum gleichen Ergebnis zu kommen.

Abb.2: Programmierung vs. Maschinelles Lernen

Wenn eine regelbasierte Lösung möglich ist, dann ist das ein deutlicher Hinweis, dass ML die Komplexität steigert. Erfahrungsgemäß lassen sich folgende Problemstellungen mit ML und KI lösen. Die Liste ist lediglich eine Auswahl der bekanntesten ML-Gebiete:

Prediction: Vorhersage zukünftiger Ereignisse. Zum Beispiel das Anzeigen von Flugpreisen oder die zukünftige Auslastung eines Restaurants.

Personalisierung: Verbesserte Benutzererfahrung durch die Automatisierung von Smart Home, etwa die Thermostateeinstellung.

Recommendation: Empfehlung von personalisierten Inhalten für Benutzer. Zum Beispiel Vorschläge für Filme, Musik oder Produkte, sowie Sprachbausteine beim Textferfassen.

Natural Language Understanding: Diktiersoftware nutzt KI, damit sie für verschiedene Sprachen gut funktioniert.

OCR (Optical Character Recognition): Erkennen von Text, einschließlich handgeschriebenen Texts.

Bilderkennung: Identifizierung von Objekten. Es ist nicht möglich, jedes einzelne Gesicht durch Regeln in eine Foto-Tagging-App zu programmieren. Solche Software verwendet KI, um auf Fotos eine Person zu erkennen.

Fraud Detection: Kreditkartenbetrug entwickelt sich ständig weiter. Durch KI und ML kann man diese sich entwickelnden Muster, nachvollziehen und neue Arten von Betrug erkennen.

Conversational UI: Die Buchung eines Hotels folgt für eine große Anzahl von Benutzern einem ähnlichen Muster und lässt sich automatisieren, um den Prozess zu beschleunigen. Hier kommen oft Chatbots oder Sprachassistenten zum Einsatz.

Landing-Webpage-Generation: Die Anzeige dynamischer Inhalte ist effizienter als eine fest definierte Webpage für Produkt oder Service. Solche manuell gepflegten Inhalte zu warten, fällt schwer. Die durch ML-Methoden generierte Webpage eines Streaming-Dienstes oder einer E-Commerce-Seite zeigt neue Inhalte, die ein Benutzer sonst kaum finden würde.

In den Beispielen dienen die ML- und KI-Techniken dazu, Predictions zu generieren. Jede Prediction in diesen Beispielen führt zu einer oder mehreren Entscheidungen. Solche Predictions erhöhen die Produktivität, beispielsweise ist Textempfehlung eine Basiskomponente für das „Smart Compose”-Feature im GMail(tm)-Programm und dient einer erhöhten Benutzerzufriedenheit. Ähnliche Beispiele lassen sich in Bereichen der Dokumentenklassifizierung oder im Kontext von Chatbot-Software für einen Kundensupport finden.

Grundsätzlich befindet sich der Bereich für ML- und KI-basierte Lösungen in einem der vier Problemquadranten: Art, Größe, Zeit und Komplexität (Abb. 3). Dabei identifiziert man Eigenschaften von Problemen, die für ML- und KI-Methoden prädestiniert sind.O’Reilly:

Endlose Probleme: Einige Bereiche entwickeln sich immer weiter. Das heißt, für solche Probleme gibt es keine einzige, fixe Lösung. Dazu gehören Webseiten, Bücher oder Live-Event-Streams – jeden Tag werden mehr und mehr davon erstellt. Der Versuch, ein regelbasiertes System aufzubauen, um über Dinge zu handeln, die noch gar nicht existieren, ist schwierig.
Große Probleme: Diese Art von Problemen hat häufig viele Variablen und Bedingungen. Man bekommt es hier mit einer großen Menge an Daten zu tun. Es gibt zum Beispiel mehr Filme, als eine Person in ihrem Leben sehen könnte.
Mit der Zeit veränderbare Probleme: Ein Punkt ist offensichtlich, dass sich Dinge mit der Zeit verändern. Ein regelbasiertes System zur Vorhersage von Aktienkursen wird nach der COVID-19-Pandemie nicht mehr funktionieren. Viele Umstände haben sich mit der Zeit plötzlich verändert. Eine KI kann aus den neuen Daten lernen und sich anpassen.
Intrinsisch schwierige Probleme: Manche Probleme sind einfach zu komplex. Einige Beispiele dafür sind das Verstehen der menschlichen Sprache (NLU), Identifizieren von Objekten in Bildern oder Verstehen von menschlichen Emotionen in Bildern. In diesen Situationen sind ML- und KI-Techniken sehr erfolgreich. Allerdings ist dieser Erfolg das Ergebnis eines jahrelangen Sammelns von Trainingsdaten. Diese Art von Technik verbessert sich permanent, sobald neue Daten vorhanden sind.

Wo ML sich nicht eignet

Zu wissen, wann man ML oder KI nicht anwendet, ist oft wichtiger als anders herum. Mögliche Gründe können sein:

Die Lösung des Problems lässt falsche Vorhersagen nicht zu.
Daten sind nicht vorhanden.
Die Implementierung von ML oder KI würde einen niedrigen ROI generieren.
Die Wartung des Projekts ist nicht garantiert (keine neuen Daten, keine Entwickler).
Es ist explizit unerwünscht, ML- oder KI-Methoden einzusetzen. Firmenpolitik kann hier eine entscheidende Rolle spielen.

Selbst wenn man ML bereits im Betrieb hat, sollte man regelmäßig überprüfen, ob das ML-Modell immer noch einen Mehrwert bringt.

Es gibt zwei Ansätze, die man verfolgen kann, um ML/AI einzuführen:

Ihre Anwendungen mit ML/AI Methoden erweitern lassen, um sie engagierter und produktiver zu machen. Erstellen neuer Anwendungen, die nur mit ML/AI möglich sind, z.B. mit conversational AI Interfaces.

Die mögliche ML/AI Use Cases befinden sich in einem komplexen Raum, wo wir zwischen folgenden drei Dimensionen unterscheiden müssen (s. Abb. 4):

Dimension INDUSTRIE: Es handelt sich hier um branchenspezifische Prozesse wie Produktion, Gesundheitswesen oder E-Commerce. Diese Prozesse sind unternehmensspezifisch. Firmen haben ihre eigene Erfahrung und besitzen oft proprietäre Datensätze. Diese Prozesse, ausgerüstet mit ML/AI, haben ein starkes Potenzial, das Geschäft zu beeinflussen und die Differenzierung zu erhöhen. Allerdings durch ihre Einzigartigkeit steigt bei solchen Prozessen auch das Risiko in der ML/AI Umsetzung. Wenn man z.B. ML Modelle zu früh einsetzt, kann das am Anfang nicht die erwarteten Ergebnisse liefern, weil die Modelle noch mit den neuen Daten verbessern werden können.

Typische Beispiele für industriespezifische Use Cases findet man im Bereich Predictive Maintenance in Produktion. Man analysiert mit Regression die von den Sensoren generierten Daten, um vorherzusagen, wann die Wartung von Geräten durchgeführt werden sollte, anstatt sich an zeitbasierte Wartungspläne zu halten. Die gleiche Regression Methode lässt sich für Demand Forecasting in Manufacturing für die Optimierung in der Produktion einsetzen.

Aus dem Finanzen Bereich kennt man das Problem „Kreditentscheidung”, dass sich mit einfachen binären Klassifikationen lösen lässt. Ein anderes Beispiel finden wir im Bereich online und Mobile-Banking. Durch AI basierte Recommendation Techniken werden personalisierte Dienstleistungen wie Portfoliomanagement, Sparen auf der Grundlage der Kundendaten bereitgestellt.

Dimension FUNCTION: Das sind diejenigen Prozesse, die in jeder Industrie ähnlich sind. Dies sind bekannte Funktionen wie Personal Management, Marketing oder Vertrieb. Die Anwendungsfälle sind risikoarm und können schnell geliefert werden. In vielen Fällen lässt sich sogar eine sofort vorgefertigte ML-Lösung eines Drittanbieters oder wiederverwendbare Artefakte wie bereits trainierte ML-Modelle nutzen.

Ein typisches Beispiel aus dem Marketingbereich ist Sentiment Analysis. Mit Natural Language Processing und einfachen Klassifikationsmethoden kann man sich in Echtzeit darüber informieren, wie Kunden über das Unternehmen in Social Media sprechen, generelle Stimmungen identifizieren und Schlüsselthemen extrahieren.

Das Problem der Personalisierung im Marketing lässt sich mit Optimierungstechniken lösen. Um Kundenzufriedenheit zu verbessern, nutzt man die Optimierungstechniken bei Kundendaten, um die Marketing Inhalte wie E-Mails, UX oder Mitteilungen zu personalisieren.

Dimension ENGAGEMENT: Definiert die ML Applications Taxonomy. Hier unterscheiden wir zwischen zwei Arten von ML Anwendungen. Erstens: „More Engaging Applications” - man nutzt ML/AI, um mehr User Interaktivität einzubauen (z.B. Recommender systems). Die Metriken beziehen sich in der Regel auf User Engagement - Anzahl der aktiven Benutzer, Zeitaufwand, Aktivierung von Kunden, Leads Generation usw. Die zweite Art der ML-Anwendungen sind „More Productive Applications”. Man nutzt ML, um Produktivität im Prozess oder in einer Anwendung zu steigern. Z.B. weniger Zeit an irgendeiner Task verbringen (smart reply, spam detection). Die Metriken reflektieren die Produktivität - Zeitersparnis oder Anzahl der erledigten Tasks.

In dieser Dimension eine große Überlegung ist, ob man ML/AI Methoden zur Automatisierung einer Aufgabe (task automation) oder als Unterstützung für Nutzer (user augmenting), die diese Aufgabe erledigen, einsetzen sollten.

Die Auswahl eines ML/AI Use Cases muss dementsprechend aus verschiedenen Blickwinkeln betrachtet werden. Die folgende Checkliste soll dabei unterstützen:

Wie relevant ist die Anwendung für das Business? Welches „business value” haben wir definiert?
Wird die Einführung von ML/AI das Unternehmen auf dem Markt differenzieren?
Haben wir die volle Kontrolle über die Anwendung oder gibt es externe Systeme, die von den anderen betrieben werden?
Was sind die erwarteten Auswirkungen der Infusion von ML/AI? Das heißt, welche Metrik des Engagements/der Produktivität ist relevant?
Wie viel Aufwand und Zeit wird erforderlich sein, um ein ML-Modell zu entwickeln? Hat man eine Möglichkeit, auf vorab trainierte Modelle zuzugreifen? Falls nicht, verfügt man über die Daten und das Fachwissen, um die ML-Modelle zu trainieren und in Produktion zu nehmen?
Wird die ML-Anwendung von ML Lifecycle (flywheel effect) profitieren? Z.B. neue Daten, die zu einem besseren ML-Modell führen, mehr Kunden anziehen und durch deren Aktivität mehr Daten erzeugen?
Wann soll das ML-Modell life geschaltet werden und auf ungesehenen Daten Inferenz (Prediction) ausführen?

Abb.5: Die Übersetzung vom Business Problem ins ML Problem geht über die Definition einer Heuristik.

In Anbetracht des Aufwands, den ML Development nach sich zieht: Wenn wir ein Problem ohne ML/AI Technologien lösen können, dann sollten wir dies auch tun. Oft können einfache Heuristiken ausreichend sein (s. Abb. 5).

Wann: Transition zum maschinellen Lernen

Die „AI Readiness” wird definiert als die Bereitschaft, die ML/AI in einem Unternehmen einzuführen. Diese Bereitschaft fällt in eine der im Google Cloud’s AI Adoptoption Framework vorgeschlagenen drei Phasen: Tactical, Strategic und Transformational.

TACTICAL Phase ist die sogenannte Anfangsphase, wo man sich erst mit einfachen und nicht kritischen AI Use-Cases beschäftigt. Das ist eine explorative Phase, um sich mit AI Technologien auseinanderzusetzen und deren Potenzial zu verstehen. Die Machine Learning Systeme werden als Prototypen entwickelt. Man verwendet oft Cloud Services von den üblichen Cloud Anbietern. Z.B. kann man existierende Modelle benutzen, um Objekte auf den Bildern zu erkennen oder ein API von einem OCR-Modell, um die PDF-Dokumente in Text umzuwandeln. Diese Phase ist sehr gut geeignet, um die Dateninfrastruktur und ein ML-Team aufzubauen.

Am Anfang ist es normalerweise schwer zu sagen, ob ein nützliches ML Modell trainiert werden kann. Dabei ist es oft hilfreich, ML Modellentwicklung als ein Experiment durchzuführen. Folgende sieben Schritte, auch als wissenschaftliche Methode bekannt, sollten dabei den Prozess veranschaulichen:

Schritt	Beispiel
Zielsetzung	Wir möchten den Umsatz an einem bestimmten Tag vorhersagen
Hypothese aufstellen	Wetter und Tag der Woche könnten sehr informativ sein.
Daten sammeln	Sammeln von historischen Daten über den Umsatz und Wetter
Hypothese testen	ML Modell mit den historischen Daten trainieren und die Ergebnisse mit den Testdaten auswerten.
Analyse	Sind diese Ergebnisse besser als von einer Baseline oder einem System, das gerade im Einsatz ist?
Entscheidung	Wir sollten das trainierte ML Modell nehmen bzw. nicht nehmen. Gründe auflisten.
Hypothese verfeinern	Weitere nützliche Features für ML Modell Training auflisten, wie z.B. geographische Lage oder Jahreszeit.

STRATEGIC Phase zeichnet sich dadurch aus, dass AI Use Cases an den Geschäftszielen und -prioritäten ausgerichtet sind. ML wird als ein wichtiger Teil in der Operationalisierung des Unternehmens gesehen. Dementsprechend sind die AI Use Cases wesentlich komplexer. Das Unternehmen verfügt über die Infrastruktur, ein spezialisiertes Team und Daten. In dieser Phase wird über die Automatisierung und Skalierung von Data Preparation und dem Trainieren von ML Modellen nachgedacht bzw. damit experimentiert.

TRANSFORMATIONAL Phase ist das fortgeschrittene Stadium der Einführung von ML/AI um die Innovation im Unternehmen voranzutreiben. Die Firmen in diesem Stadium bezeichnen sich als AI-First. Die ML/AI Technologien spielen eine zentrale Rolle in verschiedenen Funktionen und Ebenen, um „business value” zu liefern. Solche Firmen verfügen über eine fortgeschrittene Infrastruktur für eine komplett automatisierte Operationalisierung von Machine Learning Modellen. Oft bauen sie sogar eine eigene ML Platform, um end-to-end ML Workflows auf der Organisationsebene zu ermöglichen (z.B. TFX bei Google oder Michelangelo bei Uber). Diese ML Infrastruktur ist dementsprechend eine Basis, um schnell mit weiteren ML Lösungen zu experimentieren. Machine Learning Technologie wird ein Schlüssel für die Differenzierbarkeit des Unternehmens.

Diese drei Phasen zeigen, dass die Einführung von ML/AI Technologien immer von einfachen zu komplexen Use Cases erfolgt. Man baut diesen innovativen Kern langsam und Schritt für Schritt auf. Mit jeder Phase steigt die Erfahrung mit AI Technologien. Außerdem werden Tools und Praktiken, um ML Modelle zu operationalisieren, immer fortgeschrittener. Dadurch, dass Machine Learning Projekte sich von der traditionellen Software Entwicklung unterscheiden, braucht das Unternehmen eine gewisse Zeit, um die Praktiken der Machine Learning Operationalisierung zu verinnerlichen. D.h die Skills für die ML Modell Entwicklung, Testing, Deployment und Monitoring sollten graduiert aufgebaut werden. Mit mehr Erfahrung und Erfolg bei kleineren Use-Cases wächst auch die Zuversicht, komplexere Probleme anzugehen. Demzufolge ist es empfehlenswert, mit einem einfachen Use Case anzufangen – selbst wenn ein größeres Projekt mehr „business value” bringt.[1]

Womit: ML/AI Methoden

Der dritte Aspekt der Einführung von ML in einem Unternehmen ist die Frage Womit: Welche ML/AI Methoden existieren? Um mit ML/AI Innovationen voranzutreiben, brauchen wir erst mal einen ML Überblick und müssen verstehen, wie ML funktioniert. Wir wollen klären, welche ML Algorithmen existieren und wie sie in die Businessprozesse passen.

Es gibt verschiedene Typen von Machine Learning Problemen. Jeder Typ unterscheidet sich von den anderen in der Art wie die Prediction aussieht. D.h. das Ergebnis des Modells ist für uns interessant, wenn wir ein Businessproblem mit ML Algorithmen lösen wollen.

Grundsätzlich unterscheidet man zwischen zwei Typen von ML Algorithmen: Supervised und Unsupervised Machine Learning. In Wirklichkeit gibt es mehr. Erfahrungsgemäß kommen diese zwei aber am häufigsten zum Einsatz und diese beiden Kategorien von ML sind ein guter Startpunkt. In der folgenden Tabelle werden die wichtigsten ML Methoden vorgestellt und mit Beispielen veranschaulicht:

ML Methode	Beschreibung der Prediction	Beispiel
Classification	Ein Element zu einer bestimmten Klasse zuordnen	Kategorien erkennen, Objekte auf dem Bild zu einer Klasse zuweisen (Auto, Person, Baum, etc.)
Regression	Einen numerischen Wert vorhersagen	Produktpreis dynamisch generieren
Clustering	Ähnliche Elemente gruppieren	Anomaly/Fraud detection, relevante Dokumente, News gruppieren
Association Rule Learning	Zusammenhängende Elemente identifizieren	Market basket analysis, Kunden und Services Analyse (Welche Services anzubieten)
Structure Learning	Die komplexe Struktur identifizieren	Einen Satz als ‘structured tree’ parsen. (NLP)
Ranking	Elemente positionieren, bzw. nach einer Kriteria anordnen	Suchergebnisse oder Empfehlungen anordnen

Wir haben bereits erwähnt, dass Machine Learning Methoden eine Prediction für ein Ereignis produzieren. Diese Prediction ist eine Grundlage für die Entscheidungen, die in einer automatisierten Task liegen. Demzufolge soll die Auswahl einer ML Methode genau aus diesen Sichtpunkten erfolgen:

Welche Entscheidungen (Decisions) müssen wir in unserem System vornehmen, um eine Aufgabe zu erledigen?
Welche Predictions von ML Algorithmen werden dafür gebraucht?

Man versucht vom Ergebnis zu Inputs, also rückwärts zu denken. Diese Art zu denken werden wir in kommenden Teilen dieses Artikels immer wieder sehen.

Eine wichtige Eigenschaft von Predictions ist, dass es messbar sein soll. Zum Beispiel, wenn wir herausfinden wollen, ob ein User ein Video auf YouTube mag oder nicht. Wir können die Frage re-framen und fragen, ob dieser User das Video mit anderen geteilt hat. Video-Shares können wir messen. D.h. ML Modelle können ausrechnen, mit welcher Wahrscheinlichkeit ein User dieses Video teilen wird. Diese Methode heißt „Proxy Labels” und sollte in Betracht gezogen werden, um eine messbare Prediction zu implementieren.

Entscheidungen (Decisions) können als Regeln definiert werden, die auf ML Predictions ausgeführt werden. Man sollte sicherstellen, dass die ML Predictions für eine relevante Entscheidung eingesetzt werden. Zum Beispiel sollte das Ergebnis von einem ML Modell, dass die Klicks für YouTube-Videos berechnet, dazu dienen, um diese Videos entsprechend aufzulisten. Der Unterschied zwischen Decisions and Predictions ist nicht immer eindeutig. Beispielsweise möchten wir Benachrichtigungen über neue YouTube-Videos nur an Nutzer unserer App senden, die wahrscheinlich darauf klicken werden. Um solche Benachrichtigungen zu identifizieren, haben wir ein ML Modell zur Vorhersage, ob ein User auf eine App-Benachrichtigung klickt, trainiert. Man beachte, dass dieses Modell nur die Wahrscheinlichkeit eines Klicks ausrechnet. Die Schritte und der Pseudo Code könnten wie folgt aussehen:

Schritt	Pseudo Code
Prediction durch das ML Modell	click_probability = predict_click(user)
Entscheidung (Decision)	if click_probability > 0.1 then send_notification(user)

Die ML Algorithmen selbst machen keine Entscheidungen, sie sind lediglich dafür da, um die Predictions, also die Grundlage für Decisions, zu produzieren. Die Entscheidung wird immer im Code programmiert.

Fazit

Der Erfolg der Einführung von ML/AI Technologien in einem Unternehmen hängt von dem grundlegenden Verständnis der Business Prozesse sowie vom Verständnis, an welcher Stelle und für welche Entscheidungen ML/AI Algorithmen implementiert werden sollen, ab.

Quellen, Links und Interessantes

Evans, Eric: Domain-driven design. Addison Wisley. 2003
Plöd, Michael: Hands-on Domain-driven Design - by example. Leanpub. 2019
Appugliese, Carlo; Roberts, William S.; Paco Nathan: Agile AI. O’Reilly Media, Inc., 2020
Kerth, Norman L.: Project retrospectives: A Handbook for Team Reviews. Addison-Wesley Professional, 2013
Visengeriyeva,L.; Kammer, A.: MLOps. Continuous Delivery Praktiken für Machine Learning. Java Magazin 7/2020 ISSN:print1619–795X
A curated list of references for MLOps
CRISP-ML(Q)
The Flywheel Effect
The Machine Learning Canvas
Brandolini, Alberto: EventStorming in COVID-19 times
Machine Learning in Artificial Intelligence: Towards a Common Understanding
People+AI Guidebook

Krunic, Veljko: Succeeding with AI. Manning Publications, 2020 ↩︎