Ursprünglich veröffentlicht am 29. Oktober 2021.
Verfasst von: Anja Kaup (PR und Marketing Managerin) – anja.kaup@infocient.de
Mit Data Science, Machine Learning und künstlicher Intelligenz ergeben sich für analytische Landschaften in Unternehmen neue Chancen. Während mit Hilfe von Business Intelligence (BI) überwiegend historische und auch Echtzeitdaten ausgewertet werden, ermöglicht Data Science mit prädikativen Methoden auch die Vorhersage von Kennzahlen.
Die Kombination von BI und Data Science bietet Unternehmen neue Entwicklungschancen und effizientere Entscheidungs- und Steuerungssysteme und damit eine verbesserte Wettbewerbsfähigkeit. Die Frage ist, wie die Möglichkeiten von Data Science eingesetzt werden können und wann es sinnvoll ist. Denn die Voraussetzungen dafür sind nicht trivial.
Ziel des Buches
Das Buch zielt darauf ab, Praktikern eine umfassende Einführung in die Möglichkeiten der Nutzung von Data Science und die Herausforderungen zu geben. Dafür ist das Buch in einen Grundlagen – und einen praxisnahen Anwendungsteil geteilt.
Bei den Grundlagen geht es um grundlegende Methoden der Data Science, Feature Selection, notwendige Architekturen bis hin zu Herausforderungen durch Data Privacy und ethische Aspekte. Fallstudien heben im zweiten Teil Aspekte hervor, die bei der Implementierung in Unternehmen im Zusammenspiel mit BI-Systemen zu beachten sind.
Zielgruppen des Buches
Das Buch richtet sich an Leserinnen und Leser aus Studium und Praxis, die bereits Erfahrung mit analytischen Systemen haben – dazu gehören BI- und Analytics-Manager, -Projektleiter und Daten- und Informationsverantwortliche in Unternehmen.
Aufbau des Buches
Das Buch ist in 18 Kapitel gegliedert, ab Kapitel 12 geht es um Fallstudien.
Kapitel 1, Einleitung, betrachtet die Entwicklung der Managementinformationssysteme hin zu Business Analytics und das Vorgehen in Data Science Projekten.
Kapitel 2, (Advanced) Analytics is the new BI?, fragt, ob Analytics das neue BI sei und warum sich Data Science aktuell so rasant verbreitet. Die BI-Welt ändert sich so schnell, weil sie mit Advanced Analytics fusioniert, in deren Mittelpunkt Data Science steht. Unternehmen sollten bei der Einführung von Data Science auf die Erfahrungen bei der Einführung von BI zurückgreifen und eine ganzheitliche Architektur aufbauen.
Kapitel 3, Data Science und künstliche Intelligenz – der Schlüssel zum Erfolg?, zeigt an einem konkreten Beispiel, welche Rahmenbedingungen notwendig sind, damit der Einsatz von Data Science und KI erfolgreich sein kann. Selbst ein zunächst kostengünstiger Anwendungsfall kann schnell eine große Investition bedeuten, da geschulte Mitarbeiter und qualitativ hochwertige Datenbasen und neue Technologien erforderlich sind.
Kapitel 4, Konzeption und Entwicklung von Data-driven Products/Datenprodukten, geht ein auf Aspekte der Ideenfindung, Value Proposition Design, Zielgrößen, technische Anforderungen und auf die Messung mit Hilfe von Feedbackschleifen.
Kapitel 5, Grundlegende Methoden der Data Science, stellt die Methoden vor, die in den ersten Phasen von Data Understanding, Data Preparation, Modeling bis hin zu Evaluation zum Einsatz kommen. Es geht um überwachte und unüberwachte Lernverfahren; Clustering, und Reinforcement Learning. Empfohlen wird, mehrere Methoden auf eine Problemstellung anzuwenden und die Güte zu vergleichen.
Kapitel 6, Feature Selection, geht darauf ein, wie bei der stark zunehmenden Menge an Daten die wichtigen Features auszuwählen und weniger wichtige zu entfernen sind. Am Fallbeispiel der Überlebenswahrscheinlichkeit der Passagiere der Titanic werden die wichtigsten Merkmale errechnet.
Kapitel 7, Deep Learning, führt in die Grundlagen neuronaler Netzwerke ein und erklärt anhand von Deep Convolutional Neural Networks bei der Objekterkennung in Bildern, wie Deep Learning funktioniert.
Kapitel 8, Von einer BI-Landschaft zum Data & Analytics-Ökosystem, beschreibt, welche Datenarchitektur erforderlich ist, um künftig Data Science und Artificial-Intelligence basierte Anwendungsfälle abbilden zu können.
Kapitel 9, Self-Service und Governance im Data-Science Umfeld: der emanzipierte Anwender, hebt hervor, dass Self-Service-Szenarien in Unternehmen wichtig sind, um eine analytische Sichtweise zu verankern.
Kapitel 10, Data Privacy, diskutiert die rechtlichen und technischen Rahmenbedingungen von Data Privacy bei der Integration von KI in betriebliche Prozesse.
In Kapitel 11, Gespräch zur digitalen Ethik, gehen Dr. Matthias Haun, Professor für Kognitive Kybernetik und Philosophie der Kognitionswissenschaften an der Hochschule Offenburg und Pfarrer Dr. Gernot Meier darauf ein, welche Fragestellungen sich in der digitalen Ethik stellen.
Mit Kapitel 12, Customer Churn mit Keras/TensorFlow und H20, beginnt der Praxisteil. Die erste Fallstudie zeigt, wie mit Methoden der Data Science Vorhersagen zum Churn oder Abwanderungsverhalten von Kunden getroffen werden können.
Kapitel 13, Wirtschaftlichkeitsbetrachtung bei der Auswahl und Entwicklung von Data Science, beschreibt eine Fallstudie aus dem Lebensmitteleinzelhandel.
Kapitel 14, Analytics im Online-Handel, beschreibt, wie Zalando die Grundlagen für Analytics, BI und Data Science zum unternehmensweiten Einsatz geschaffen hat und welche Herausforderungen zu meistern waren.
Kapitel 15, Predictive Maintenance, erläutert die verschiedenen Strategien der Instandhaltung und Nutzung von Produktionsdaten, mit Verfahren der Statistik und des maschinellen Lernens für eine vorausschauende Instandhaltung.
Kapitel 16, Scrum in Data-Science-Projekten, beschreibt, wie Volkswagen Financial Servicers AG Scrum in Data-Science-Projekten erfolgreich eingesetzt haben.
Kapitel 17, Der Analytics-Beitrag zu einer Added-Value-Strategie am Beispiel eines Kundenkartenunternehmens, erläutert, wie durch die Konzeption datenbasierter Serviceangebote Mehrwert geschaffen werden konnte.
Kapitel 18, Künstliche Intelligenz bei der Zurich Versicherung – Anwendungen und Beispiele, zeigt die Herausforderungen des Unternehmens und wie KI im Wertschöpfungsprozess heute in einigen Anwendungsfällen eingesetzt wird.
Besonderheiten des Buches
- Das Buch ist klar gegliedert und logisch aufgebaut. Jedes Kapitel wird von einer Zusammenfassung abgeschlossen.
- Die Sprache ist relativ leicht zu verstehen – allerdings sind Analytics-Vorkenntnisse erforderlich.
Fazit
Das Buch ist eine gute Kombination aus Grundlagen, Fallstudien und konkreten Handlungsempfehlungen.
Gerade im Praxisteil werden viele typische Beispiele genannt, von der Vorhersage der Kundenabwanderungsgefahr, Betrugserkennung im Kfz-Bereich für Versicherungen, Verbesserung der Kundeninteraktion, vorausschauende Instandhaltung bis hin zur Platzierung von weiteren Empfehlungen beim Online-Einkauf sowie Empfehlungen zur Zusammenarbeit von Data Scientists mit Produktionsteams.
Interessant ist für BI-Experten Kapitel 8 – Von einer BI-Landschaft zum Data & Analytics-Ökosystem. Gerade in Unternehmen mit digitalem Kundenkontakt spielen die von Data Scientists entworfenen Modelle und Regeln eine entscheidende Rolle, um den Verkaufsprozess zu verbessern. Dafür sind allerdings Architekturen mit hoher Agilität erforderlich. Bei häufig sich ändernden modellgestützten Anwendungen ist eine industrialisierte Data Science sinnvoll. Zentrale Repositories und eine möglichst automatische Verarbeitung sind dafür Voraussetzung.
Es bleibt die grundlegende Erkenntnis, dass ein großer Aufwand erforderlich ist, um Data Science-Projekte einzuführen und dass diese Projekte mehr beinhalten, als das Entwickeln von Machine-Learning-Modellen. Das Buch ist allerdings gefüllt mit Hinweisen auf Erfolgsfaktoren, wenn man sich das Ziel gesetzt hat, in diese Richtung zu gehen.
Data Science: Grundlagen, Architekturen und Anwendungen. Autor: Uwe Haneke, Stephan Trahasch, Michael Zimmer, Carsten Felden (Hrsg.): dpunkt.verlag GmbH, 2. Auflage 2021, 392 Seiten