+49 69 173201230
team@deutscheinterim.com
https://www.linkedin.com/company/deutsche-interim-ag/

Wie kann ich KI-Anwendungsfälle identifizieren?

KI-Anwendungen können ein Wettbewerbsvorteil sein. Aber deren Implementierung scheitert oft an einem fehlenden Anwendungsfall – und das kostet Zeit und Geld.

Wie identifiziert man KI-Anwendungsfälle?

Der Einsatz künstlicher Intelligenz kann Wachstum generieren, doch KI-Projekte ähneln allzu oft dem berühmten Hammer, bei dessen Gebrauch plötzlich alles zu einem Nagel wird: Allzu oft wird nämlich im Vorfeld nur unzureichend geklärt, ob der Einsatz in diesem Fall überhaupt sinnvoll ist – manchmal nicht einmal, ob eine ausreichende Datengrundlage gegeben ist.

Um die KI-Anwendungsfälle zu identifizieren, die zu profitablen Use Cases führen, braucht es also

  • ein Verständnis für die eigenen Daten,

aber auch

  • die Einbeziehung möglichst vieler Unternehmensbereiche sowie
  • eine iterative Arbeitsweise mit kleinen Sprints.

Demnach kommt es darauf an, die nachfolgend aufgeführten Schritte in möglichst kurzen Iterationen mit möglichst frühen Rückmeldungen zu durchlaufen.

1. Identifizieren Sie Datenquellen

Der erste Schritt besteht in der Identifizierung der richtigen Daten für die vorgesehene KI-Anwendung. Sind doch Daten die Grundlage von wertstiftenden Use Cases in allen Bereichen der Künstlichen Intelligenz.

Aber Unternehmen sind sich oft nicht bewusst, welche Daten sie haben. In vielen Fällen ist nicht einmal ein Datenverzeichnis vorhanden. In solchen Fällen ist das Vorhaben einer Identifizierung der richtigen Daten eine gute Gelegenheit, mit dem Aufbau eines umfassenden Datenverzeichnis zu beginnen.

Bei der Identifizierung der Datenquellen sind zum einen interne Quellen zu nutzen, die im Unternehmen liegen.

Dabei sollte man nicht damit rechnen, dass diese internen Quellen sich entlang der einzelnen Abteilungen und Unternehmensteilen identifizieren lassen. Denn Daten zu einem bestimmten Bereich liegen oft in den verschiedensten Systemen verteilt. So fallen Kundendaten zunächst in den Verantwortungsbereich des Vertrieblers. Seine erste Anlaufstelle ist das CRM. Doch daneben wird es weitere Quellen geben, die nicht in der Obhut des Vertrieblers liegen.

Bei der Identifizierung der Datenquellen sollten zum anderen auch externen Quellen berücksichtigt werden, die sich der Kontrolle des Unternehmens entziehen.

Dazu gehören soziale Netzwerke wie LinkedIn oder Twitter. Denn die vorhandenen Kundendaten mit den Aktivitäten der Kunden auf LinkedIn oder Twitter zu ergänzen, kann die Kundendatenbasis mit wertvollen Einblicken erweitern.

Eine weitere potenzielle Quelle externer Daten können auch Sensor- oder Trackingdaten aus dem sog. Internet of Things sein. Solche Daten geben oft wertvolle Hinweise zu Abläufen in Prozessen, aber im Rahmen der sog. Predicted Maintenance auch zum Zustand wartungsintensiver Teile in der Produktion.

Übrigens kann bei diesem ersten Schritt mit schlanken Lösungen wie Power BI auch schon eine erste Voranalyse der Daten erfolgen, um eine Indikation bzgl. der Qualität und Vollständigkeit der Daten sowie möglicher Varianzen zu bekommen.

2. Priorisieren Sie Ihre Daten

KI-Anwendungen lohnen sich nur, wenn die Datenbasis Muster mit diesen beiden Merkmalen enthält:

  1. Die Muster kann man für Klassifizierungen oder Vorhersagen nutzen, aber
  2. sie lassen sich mit Fachwissen allein nicht identifizieren.

Um das Potenzial seiner Daten wertstiftend zu nutzen, muss man daher Daten mit diesen Merkmalen identifizieren und entsprechend priorisieren.

Dieser Schritt ist grundlegend: Die Identifizierung und Priorisierung reduziert das Risiko, unnötig Aufwand in die Datenkonsolidierung, Datenaufbereitung, Datenanreicherung und das Training des Modells zu stecken – und erhöht so die Erfolgswahrscheinlichkeit der nächsten Schritte.

3. Bestimmen Sie Use Cases

Mit der Identifizierung relevanter Datenquellen, dem Anlegen eines Datenverzeichnisses und der Priorisierung von Daten sind die Grundlagen für KI-Anwendungen geschaffen.

Jetzt kann man sich möglichen Use Cases zuwenden.

Das sollte zusammen mit den Experten aus den jeweiligen Fachbereichen im Unternehmen geschehen.
Denn im Austausch mit den Fachexperten entstehen oft neue Ideen für Use Cases, die man noch nicht im Blick hatte.

Vor allem aber wissen Experten aus den Fachbereichen genau, was für Schlüsse aus ihren Daten gezogen werden könnten. Und das sind Informationen, mit denen man seine Pläne für KI-Anwendungen konkretisieren, ergänzen und nicht zuletzt validieren kann.

4. Bereinigen Sie die Daten und reichern Sie diese an

Auch wenn man nun die Daten hat, deren automatisierte Analyse sich lohnt: Die Daten liegen in der Regel erst in einer Rohform vor, die man zur weiteren Bearbeitung noch bereinigen und ggf. um bestimmte Tags anreichern muss.

Dabei starten wir mit einem möglichst kleinen Datenausschnitt. „Klein“ meint hier nicht das Volumen der Daten, sondern die Dimensionen der Attribute: Je weniger Attribute für den ersten Schritt benötigt werden, umso weniger aufwändig ist die Bereinigung und Anreicherung der verschiedenen Datenattribute.

Weitere Attribute können dann in späteren Schritten sukzessive ergänzt werden.

Dieses Vorgehen hat zwei Vorteile:

  1. Es minimiert den Aufwand, der für die Datenbereinigung zu betreiben ist – und damit letztlich auch die Risiken. Könnte es sich doch später immer noch herausstellen, dass die Daten nicht den erhofften Wert haben.
  2. Die Wirkung der Attribute auf das Ergebnis lässt sich durch das iterative Vorgehen viel besser einschätzen.

Sind die Daten unstrukturiert, muss man diese vor der weiteren Verarbeitung mit Tags anreichern.

Paradigmatisch dafür ist für Menschen geschriebener Text. Hilfreich sind dann Methoden aus dem Feld der Natural Language Processing (NLP). Hier nehmen Open Source Lösungen wie z.B. SpaCy bereits einen großen Teil der Arbeit ab, indem sie in sog. Prozess-Pipelines einen Text bereinigen, segmentieren und mit Tags anreichern.

5. Bereiten Sie die Daten für eine maschinelle Analyse auf

Auch bereinigte und ggf. mit Tags angereicherte Daten müssen für die maschinelle Analyse – etwa durch neuronale Netze – meist noch optimiert werden.

Bilddaten werden z.B. nicht einfach 1:1 in ein KI-Modell gekippt. Sie werden vorher so aufbereitet, dass das Modell bestimmte Merkmale besser erkennen kann. Damit wird etwa die Herausforderung adressiert, dass Objekte an unterschiedlicher Position in einem Bild auftauchen können. Hier muss verhindert werden, dass die Position des Objektes Einfluss auf das Ergebnis hat.

Für die Aufbereitung haben sich je nach Anwendungsfeld – Bildbearbeitung, Spracherkennung oder etwas anderem – unterschiedliche Vorgehensweisen etabliert.

Bei Unternehmensdaten heißt das insbesondere: herauszufinden, welche Aspekte für den Anwendungsfall relevant sind und diese für die Mustererkennung vorzubereiten.

Oft kann es notwendig sein, in einem ersten Schritt ein sog. Dictionary mit unternehmensspezifischen Begriffen und/ oder Bedeutungen zu erstellen. Diese Begriffswelt kann man dann heranziehen, um ein vorgefertigtes, meist auf freien Quellen wie Texten aus dem Web basierendes NLP-Modell zu spezialisieren.

6. Erstellen Sie ein passendes Modell

Kern einer KI-Anwendung ist ein auf den jeweiligen Anwendungsfall zugeschnittenes Modell. Dieses Modell enthält die Muster, die für Klassifizierungen oder Vorhersagen genutzt werden.

Die Implementierung einer KI-Anwendung unterscheidet sich daher von der klassischen Programmierung: Statt Geschäftsregeln in Algorithmen umzusetzen, werden passende Modelle erstellt.

Der erste Schritt dabei ist die Wahl einer geeigneten Architektur für das Modell. Genauso wie sich die Architektur für ein Bahnhofsgebäude von einem Opernhaus unterscheidet, so unterscheiden sich auch die Architekturen von KI-Modellen je nach Anwendungsgebiet. Ein Modell für die Bilderkennung braucht eine andere Architektur als das für die Spracherkennung.

Der zweite Schritt besteht darin, das Modell optimal zu konfigurieren und zu trainieren. Da es dabei einen hohen Anteil von Trial and Error-Schleifen gibt, ist es wichtig, den Entwicklungsprozess möglichst schlank zu gestalten. Als eine Technologie für die Entwicklung von KI-Anwendungen wird oft die Programmiersprache Python mit ihren gut dokumentierten Bibliotheken im Bereich Datenverarbeitung, Statistik, neuronale Netze und Visualisierung genutzt.

Aber sobald ein Modell erfolgreich trainiert wurde, kann es in nahezu jeder beliebigen Technologie integriert werden.

7. Optimieren Sie das KI-Modell mit Expertenwissen

Falls die Leistung des trainierten KI-Modell den Anforderungen noch nicht entspricht, kann man es mit dem Fachwissen von Experten weiter optimieren.

Das geschieht häufig nach dem Prinzip des bestärkenden Lernens. Die Korrektheit einer Klassifizierung oder Vorhersage wird positiv bzw. negativ bewertet und das Modell entsprechend angepasst. Sind Experten involviert, sieht das folgendermaßen aus:

  1. Das System erstellt probeweise Klassifizierungen oder Vorhersagen.
  2. Fachexperten bewerten deren Korrektheit.
  3. Das Modell wird anhand des direkten Feedbacks angepasst.
  4. Dieses Prozedere wird wiederholt, bis das System die Anforderungen erfüllt.

8. Nutzen Sie Erfahrungen aus dem produktiven Betrieb

Die Optimierung ist mit der produktiven Einführung noch nicht vorbei: Zieht man Erfahrungen aus dem produktiven Betrieb heran, lässt sich das KI-System auch nach seiner Einführung noch weiter optimieren.

So kann man die Daten iterativ um weitere relevante Attribute ergänzen und anhand der bestehenden produktiven Daten automatisiert prüfen, ob diese Ergänzung das System verbessert. Auf diese Weise kommt man mit jeder Iteration einem optimalen Modell näher.

Fazit: Ohne Daten ist alles nichts

Für wertstiftende KI-Anwendungen ist ein Verständnis für die eigenen Daten essenziell.

Dazu muss man

  • in mehreren Durchgängen und
  • mit der Unterstützung von Experten aus möglichst vielen Unternehmensbereichen
  • relevante Daten identifizieren, aufbereiten und ergänzen.

Wer KI-Projekte als Marathonläufe angeht, läuft Gefahr, unterwegs aus der Puste zu kommen.
Aussichtsreicher ist es, solche Projekte als Staffellauf mit kleinen Sprints zu planen: Ein iterativer Ansatz führt schneller zu neuen Erkenntnissen und hat eine erfahrungsgemäß höhere Erfolgsquote.

So werden KI-Anwendungen zu einem Wettbewerbsvorteil.