Was ist Data Science (im Automotive-Sektor)?
Daten. Wir brauchen Daten. Viele Daten. Wir wollen Daten darüber, welche Autos auf den Straßen unterwegs sind, möglichst im Detail. Wer fährt diese Autos, und welche Dienste könnten dem Nutzer gefallen? Wie alt sind diese? Und das ist noch der einfache Teil. Wir wollen auch Daten über Verkehrseinflüsse, am besten virtuell simuliert, um Tests für das autonome Fahren vorzunehmen. Woher bekommen wir diese Daten überhaupt, schließlich brauchen wir Millionen und Abermillionen von Daten, um verlässliche Modelle zu erstellen. Und wenn wir all diese Daten haben – was fangen wir damit an? Wie werten wir Daten aus, wie strukturieren wir diese, wie trainieren wir Modelle damit? Was hat Künstliche Intelligenz damit zu tun, was NLP, was Big Data?
Beginnen wir mit der Definition genereller Data Science, wie die Wikipedia sie vorgibt: „Data Science ist ein interdisziplinäres Wissenschaftsfeld, welches wissenschaftlich fundierte Methoden, Prozesse, Algorithmen und Systeme zur Extraktion von Erkenntnissen, Mustern und Schlüssen sowohl aus strukturieren als auch unstrukturierten Daten ermöglicht.“ Das klingt doch schon mal gut, damit können wir arbeiten: Data Science ist also nicht nur die eine Sache – vielmehr handelt es sich um verschiedenste Forschungsfelder zusammenfasst. Mathematik ist überall die Basis, wir rechnen in der Data Science jede Menge, oder noch besser, lassen rechnen. Informationstechnologie, Signalverarbeitung (besonders wichtig im Automotive Sektor), Machine Learning, statistisches Lernen, Programmierung, Mustererkennung (ebenfalls von exponierter Wichtigkeit), Prognostik, Datenlagerung. Da kommt ganz schön was zusammen, und jeder Zweig ist wichtig und muss miteinander interagieren, um effizient zu sein.
Data Science im Automotive – Was sind die Besonderheiten?
Im Automotive-Bereich fließen viele dieser Felder direkt zusammen – ob im Bereich der Predictive Maintenance, der Datensammlung zum Testen autonomer Fahrfunktionen (beispielsweise auch zur Erstellung von Modellen in einer Game Engine wie Unity), Deep Learning zur Weiterverarbeitung von Text- und Bildinformationen, Künstliche Intelligenz, die Entscheidungen treffen soll (das berühmte Brems-Assistenz-Problem: Wie setze ich die Prioritäten, wenn ausgewählt werden muss, welches von zwei Hindernissen umfahren werden kann?), Mustersuche, Forecasting. Auch im generell breit aufgestellten Sektor der Cloud IT ist Data Science wichtigster Impulstechniker, da cloudifizierte Daten eben genau das weiterhin sind: Daten. Daten, die gesammelt, aufbereitet, genutzt und versandt werden wollen.
Insgesamt bleibt zu sagen, dass Data Science, ähnlich wie K.I., ein wenig scharf umrissenes Tätigkeitsfeld ist, dass dennoch von elementarer Wichtigkeit ist und ohne die eine digitale Transformation, die vielerorts als Buzzword genutzt wird, gar nicht möglich wäre.
Da dieser Artikel im Besonderen darauf eingehen soll, was Data Science, zu Deutsch mithin, wenngleich selten, „Datenwissenschaft“ genannt, halten wir den allgemeinen Teil zu Data Science im Automotive-Bereich kurz und gehen direkt zu konkreten Beispielen vor, die von der Cognizant Mobility entwickelt wurden, um die Vielfalt und Leistungsfähigkeit von Data Science in der Industrie aufzuzeigen.
Data Science bei Cognizant Mobility
Besondere Erwähnung für ein praktisches Anwendungsbeispiel dürfte sicherlich unser Ticketvoranalyse-System „HEIDI“ sein. Im Rahmen der E-/E-Integration bei aktuellen Fahrzeugen entstehen jährlich zehntausende Fehlertickets, für die eine Voranalyse Bearbeitungskosten und – dauer wesentlich senken kann. Hierfür wurden von den Data Scientists der Cognizant Mobility rund um Dr. Daniel Isemann (Team Lead Data Science & AI) Machine-Learning-Modelle entwickelt, die Ticketanalysten unterstützen. Details hierzu findet ihr im Whitepaper zum Thema „Künstliche Intelligenz“, dem ersten in einer ganzen Serie. Um keine Whitepaper, News, Infos und Trends der Branche mehr zu verpassen, empfehlen wir euch an dieser Stelle, unseren kostenfreien, aber mit Infos vollgepackten Newsletter zu abonnieren – keine Sorge, der erscheint nur einmal pro Monat, wir spammen euch also garantiert nicht zu.
Ein ebenfalls interessanter Ansatz, um mit einer Vielzahl von Daten umzugehen, ist unser ganz praktisches Beispiel des „Identity Storage“. Bei diesem werden Fahrzeug-, Vertrags- und Händlerdaten zentral gespeichert und zur Verfügung gestellt. Für dieses BMW-System stellt die Cognizant Mobility mit dem Team von Vera Yordanova das entsprechende Backend in einem 24/7 laufenden Live-System zur Verfügung.
Über den Automotive-Sektor hinaus finden Lösungen der Cognizant Mobility sogar Einzug in den medizinischen Bereich. Hier bestand die Aufgabe darin, bestimmte Zustände zu erkennen – eine Disziplin, die in der Automobilbranche seit jeher besteht: Fährt, oder fährt nicht, um das einfachste Beispiel zu nennen. Mittels des BOSS-Verfahrens (Bag-Of-SFA-Symbols) gelang es, eine Signal-Zeitreihe in ein Sprachverarbeitungsproblem zu übersetzen und mit dem „One-Nearest-Neighbour“, einen Algorithmus zu finden, der die Aufgabenstellung des Kunden lösen konnte.
Aus diesen Projekten lässt sich schon jetzt die enorme Vielfalt erkennen, die Data Science zu bieten hat, und in keinem davon ging es um das Thema des autonomen Fahrens. Das ändert sich bald, denn in unserem Artikel über das Testen autonomer Fahrfunktionen findet ihr auch dazu jede Menge Informationen. Spannend ist jedoch allemal, dass Data Science natürlich auch die Unterhaltungsbranche beflügelt hat: Auch Computer und deren Spieleindustrie sind konsequenterweise Produkte der Data Science. Aus eben jenem Bereich stammt die Unity Game Engine, die üblicherweise dazu verwendet wird, komplexe, hochauflösende Grafikmodelle zu entwerfen, die für Spiele verwendet werden – unter anderem auch für 1:1 Kopie real existierender Städte, in denen Spieler sich mit ihren Spielcharakteren und deren Fahrzeugen austoben können. Die hierfür verwendete Datenmenge, der simulierte Verkehr, die Passanten – all das existiert seit Jahren in der Entertainment-Branche und findet nun auch praktische Anwendung beim Testen autonomer Fahrfunktionen. Mittels real erhobener Daten, beispielsweise mittels an Kreuzungen taktisch geschickt aufgestellter Kameras, die den Verkehr für bestimmte Zeiträume beobachten, lassen sich hochkomplexe Verkehrssimulationen erstellen, in denen mit entsprechenden Parametern ausgestattete, virtuelle Testfahrzeuge Unmengen von Daten erlernen können, ehe sie auf tatsächlichen Straßen fahren. Die Weiterentwicklung vieler Funktionen dieses Zukunftszweigs wären ohne Data Science und die Bereitstellung sowie Auswertung hochkomplexer und in einschüchternder Menge vorliegender Daten gar nicht möglich.
Data Science – Das Fazit
Die eine Definition für Datenwissenschaft gibt es nicht, sofern einem nicht die eingangs erwähnte Zusammenfassung der Wikipedia genügen mag. Als interdisziplinäre Wissenschaft erstreckt sie sich auf zahlreiche Teilbereiche und befasst sich mit der wahren Währung, in der wir heute alle zahlen, mit der wir alle arbeiten, der wir alle ausgesetzt sind: Daten. Daten sind pures Wissen, praktischer Nutzen und Formel für die Zukunftsgleichung. Die effiziente Verarbeitung dieser Daten in Modellen, in Projekten, in Entwicklungen und Innovationen, die ein sauberes, mobiles, sicheres Morgen ermöglichen sollen, ist gewissermaßen das Rückgrat der digitalen Transformation und kann in seiner elementaren Wichtigkeit auch in oder vielleicht sogar gerade, speziell, unbedingt in der Automobilbranche nicht genug betont werden.
Die Spezialisten der Cognizant Mobility stehen euch dabei für Fragen zum Thema oder auch zu Beratungen für eure Projekte, für mögliche Kooperationen und gemeinsame Entwicklungen, für das gemeinsame Stück des Weges, den Erfahrungsaustausch, jederzeit bereit – kontaktiert uns einfach über unser Kontaktformular oder auch unseren LinkedIn Account und lasst uns mit der Wissenschaft, die heute entwickelt, was morgen auf den Straßen unterwegs ist, Innovation vorantreiben.