„Was ist eigentlich eine K.I.?“
Technisch betrachten wissen wir das: Ein LLM, ein Sprachmodell, künstlich erschaffene Pseudo-Intelligenz, angereichert mit Trainingsdaten. Wir reden über Machine Learning, über Prompt Engineering, Algorithmen und Clouds. Aber was ist eine K.I. wirklich? Ist sie nicht vielmehr eine „extended Life Version“, eine ganz neue Spezies? Schließlich stieg Michael Knight in der Serie nicht in den Trans-M, Modellnummer 2.000, mit der Onboard-A.I. KITT – er stieg in KITT, KITT war sein Kumpel. Tony Stark redet nicht mit einer Assistenz-Software für Flugbahnen und Statusberechnungen – er spricht mit JARVIS ("Just Another Rather Very Intelligent System") oder FRIDAY und flirtet regelrecht mit dem ausgefuchsten Sprachmodell. Und auch abseits der Science Fiction auf der Leinwand setzt sich das fort: Wir aktivieren nicht die K.I. auf dem iPhone, sondern Siri, wir fordern Alexa auf, etwas zu bestellen, und neue Smart Cockpits können einfach vom User benannt werden. „Hallo Helmut“ ist keine Vision, sondern ein neuer Alltags-Helmut, der uns im mobilen Straßen- und Datenverkehr unterstützt, und ein bisschen Angst haben wir gar nicht mal vor namenlosen Rechnern, sondern vor „Skynet“. Diese Liste ließe sich, dieser Tage gefühlt beinahe beliebig, fortsetzen. „VERA“ (nicht der offizielle Name) reiht sich nahtlos ein in eine virtuelle Begleitumgebung, an Bord von autonomen Fahrzeugen, im ÖPNV und vielleicht auch im persönlichen Fahrzeug des Endnutzers. Ist also der Name Programm, und die Programmierung der Name? Werden K.I.s zum persönlichen und allgegenwärtigen Alltagshelfer, der von Predictive Maintenance (Straßentemperatur erkennen -> Reifenwechsel vorhersagen -> Termin in der Werkstatt proaktiv buchen im Abgleich mit dem geteilten Kalender?) bis zum Hochzeitstag alle Finessen der zwischenmenschlichen Interaktion beherrscht? Erkennt sie, wenn es uns schlecht geht, wir müde sind, oder aktiv werden sollten? Gibt die K.I. während der Autofahrt Dating-Tipps?
Sicher ist, dass der „Very Enhanced Road Assistant“ einen neuen Schritt geht in einer beispiellosen Entwicklung generativer K.I. in Fahrzeugen und darüber hinaus. Dieser Artikel beschreibt, was der „Very Enhanced Road Asisstant“ genau ist und kann, bietet Interviews und technische Hintergründe: Viel Spaß!
Marc
Marketing Professional
13.10.23
Ca. 16 min
Very Enhanced Road Assistance: Passagiere wirklich abholen
Die Einführung autonomer Fahrzeuge auf den globalem Automobilmarkt ist, da besteht Einigkeit, ein enormer Schritt in der Entwicklung der Mobilität von morgen. Sie bedeutet auch grundsätzlich mehr als nur technologischen Fortschritt; Sie ist tendenziell geeignet, ein neues Kapitel im öffentlichen Nahverkehr einzuleiten. Die Einführung verspricht ein Szenario, in dem autonome Fahrzeuge keine bloße Neuheit sind, sondern das Rückgrat des städtischen Nahverkehrs bilden. Damit so ein Szenario realistisch werden kann, ist nahtloser und inklusiver Transport unabdinglich. Er muss die Leute aber auch buchstäblich und sprichwörtlich „abholen“: physisch, aber auch im Kontext der Brückenbildung zu Menschen im Alltag, für die Berührungsängste mit hochtechnologischen Neuerungen bestehen können. Der allgegenwärtige Aufstieg generativer K.I. in beinahe sämtlichen Bereichen ist hierfür ein Beispiel – stellt zugleich aber auch einen Teil der Lösung dar.
Cognizant Mobility stellt in diesem Zusammenhang – erstmalig auf der IAA Mobility 2023 – das neueste K.I. System vor, den „Very Enhanced Road Assistant“. Dieses System zeigt, wie die Zukunft der Fahrbegleitung im öffentlichen Nahverkehr, insbesondere in autonomen Fahrzeugen, aussehen könnte. Das KI-System kann persönlich und individuell mit Fahrgästen interagieren, Fahrinformationen liefern und soll in Zukunft sogar medizinische Notsituationen erkennen können.
Auch hier lässt sich die – berechtigte – Frage stellen: „Aber was ist denn nun wirklich neu? Generative K.I.s gibt es mehr denn je im Netz!“ Die Antwort ist dabei fast schon überraschend einfach: Die Multimodalität des Very Enhanced Road Assistant ist ebenso Neuheit wie der Assistant selbst. Der multimodale Ansatz bringt zusammen, was bislang oft nicht unbedingt zusammengehörte: Der Road Assistant ist kein reines Chatfenster mit Kamera – das System kann Passagiere sehen, Gesichtsausdrücke erkennen und darauf reagieren. Es kann Sprache wahrnehmen und Kommandos und Fragen interpretieren, kann Tickets scannen und ist lernfähig, um optimal und immer persönlicher mit Fahrgästen interagieren zu können. Diese Verbindung einzelner Dienste zu einem Gesamterlebnis für Fahrgäste ist beinahe ebenso zur Novität berechtigt wie der finale Very Enhanced Road Assistant selbst – wir gehen im folgenden Absatz noch einmal im Detail hierauf ein.
Very Enhanced Road Assistant: Nachhaltigkeit und Smart Cities
Die gesamte Weiterentwicklung virtueller Assistenzen basierend auf generativer K.I. hebt die Benutzererfahrung auf eine neue Ebene, die integrativ wirkt und motiviert. Schließlich ist es vor allem die angenehme Nutzererfahrung, die zur Nutzung öffentlicher Verkehrsmittel anspornt – und diese bringt weitreichende Vorteile mit, wenn sie erst den Individualverkehr reduziert: So können innerstädtisch Parkflächen nachhaltiger und gesellschaftlich sinnvoller genutzt werden, Straßen können reduziert und Infrastrukturen entschlackt werden. Sicherlich – kein Verdienst der K.I.-basierten Fahrbegleitung, aber ein wichtiger Baustein auf dem Weg in eine moderne und nachhaltige Mobilität.
Dass auch aus Branchensicht viele Vorteile in einer virtuellen Fahrgastbegleitung liegen, unterstützt die Perspektive von Dr. Daniel Isemann (Head of Data Science and AI), laut der die K.I. nicht ausschließlich im öffentlichen Nahverkehr sinnvoll eingesetzt, sondern grundsätzlich in Fahrzeugen jeglicher Art als smarte Fahrassistenz verfügbar gemacht werden wird.
Head of Business Development Michael Pollner stellt dabei ein Potenzial vor, das heute noch wie Science Fiction klingen mag, aber schon im historischen „Morgen“ Realität annehmen könnte: So können, nein, werden sich K.I.-basierte Assistenzsysteme in naher Zukunft zu der ersten und wichtigsten Schnittstelle zum Menschen bzw. dem User entwickeln. Die K.I. und dessen Avatar werden dabei zum Fahrzeug selbst, man denke an „Knight Rider“ und seinen bei Jung und Alt beliebten „K.I.T.T.“ (stand für „Knight Industries Two Thousand“ als Modellbezeichnung). Die K.I. im Fahrzeug stellt sich immer mehr auf die persönlichen Bedürfnisse jedes einzelnen Users ein, liest buchstäblich die Wünsche von den Lippen, bucht Parkplätze, Kinotickets und erinnert an den Hochzeitstag inklusive Geschenkvorschlägen – ausgewählt nach dem jeweiligen Geschmack. Sie übernimmt auch die Reservierung für den Winterreifen-Wechsel, da dieser im Jahr zuvor genauso vorgenommen wurde und der Prozess somit nutzerfreundlich automatisiert werden kann.
„Wir werden in gewisser Weise persönliche Beziehungen zwischen Menschen und deren A.I. Systemen erleben, da diese den gesamten Lifetime-Kontext für eine immer tiefere Bindung und Anpassung nutzen werden“, ergänzt Pollner. Dass hierbei Daten mit dem Einverständnis der Nutzer erhoben werden, um ein kundenfreundliches Gesamterlebnis zu bieten, wird nicht nur die Erfahrung im Individual-Verkehr auf ein neues Level hieven. Ein System wie der Very Enhanced Road Assistant bietet die naheliegende Möglichkeit, als virtueller Lebensassistent zu fungieren und nicht nur das Fahrzeug zu optimieren, sondern der persönliche Concierge für alle Lebenslagen zu werden. Gepaart mit dem IoT, der Industrie 4.0, Smart Cities und autonomen Fahrzeugen sind die Möglichkeiten von nahezu, man mag den kurzen Ausflug in prosaische Gefilde verzeihen, atemberaubender Vielfalt.
Vor allem natürlich für die Industrie von elementarer Bedeutung sind die vielen potenziellen Use Cases von Sales bis After Sales. Immerhin werden, wie zuvor schon angedeutet, unter zuvor vereinbarten Bedingungen Informationen ausgetauscht, die zum Kundenwohl und der Verbesserung kundennaher Dienstleistungen von Interesse sein können. Heute im autonomen ÖPNV, morgen im individuellen Fahrzeug und übermorgen auf dem Smartphone immer und überall dabei? Eine Chance, Kunden nicht länger Produkte zu verkaufen, sondern Erlebnisse. Man muss kein Marketing-Experte sein oder Studien lesen, um zu realisieren, dass eine positive und nachhaltige Erfahrung treibender ist als jedes Verkaufsversprechen.
Very Enhanced Road Assistant: Win-Win für den Fahrgast
Das dem Very Enhanced Road Assistant zugrundeliegende Large Language Model (LLM) ist ein technologisches Highlight, das einer K.I. die Fähigkeit gibt, menschliche Sprachen in hoher Qualität zu interpretieren und zu produzieren. Cognizant Mobility hat hierfür Technologien geschaffen, die die Verbindung von Speech-to-Text, 3D-Avataren, Sprachmodellen/LLMs, Vektor-Konvertern für die Aufbereitung von webbasierten Informationen sowie spezialisierten Datenbanken für rasche Informationsbeschaffung erlauben. Dies ist eine nicht zu unterschätzende Herausforderung im Entwicklungsprozess: Was von Außenstehenden oft nicht auf den ersten Blick wahrgenommen wird ist der Umstand, dass es hier keine Plug & Play Lösungen gab. Alle Lösungen mussten angepasst werden, Schnittstellen teils „from the scratch“ entwickelt, Sprachmodelle getestet, ausgewählt und trainiert werden (wir empfehlen hierzu auch unsere Artikelreihe über Machine Learning). Die Auswahl, welche Datenbank im Backend für die bestehenden und kommenden Ansprüche geeignet ist oder die Integration von Vektor-Konvertern, um eine Verarbeitung von Infos aus dem Netz zu ermöglichen, musste erforscht und umgesetzt werden, um eine belastbare generative K.I. zu erschaffen, die als Fahrbegleitung dienen – und überzeugen – kann.
Vor allem das Schlüsselwort der „Information“ ist einer der spezifisch zu beachtenden Punkte bei der Entwicklung der K.I., da die Antworten der Fahrbegleitung belastbar sein müssen und keinesfalls zu den bei generativer K.I. häufig zu beobachtenden „Halluzinationen“ führen darf; sprich, zu Informationen, die die K.I. basierend auf Wahrscheinlichkeit als korrekt erachtet, die letztlich aber falsch sind. Der Very Enhanced Road Assistant greift hierfür auf ein speziell von Cognizant Mobility entwickeltes Verfahren zurück, bei dem nicht die Wahrscheinlichkeit der Korrektheit des nächsten Wortes Basis für die Antwort ist, sondern Faktenbezug. Die zugrunde liegenden Datenbanken werden von Cognizant Mobility speziell für den gewünschten Use Case optimiert und gepflegt, was die Wahrscheinlich extrem erhöht, eine korrekte Antwort mit Faktenbezug zu erhalten. So können Nutzer sicher sein, korrekte und zielführende Antworten zu erhalten. Dieses Verfahren zur Anreicherung des Sprachmodells mit passenden Daten ist ein USP des Road Assistant und von Cognizant Mobility.
Generative K.I. im Fahrzeug: Was wahr ist, muss wahr bleiben
Eben diese Erfahrung im Umgang mit Sprachmodellen und Trainingsdaten, dank hoher Expertise im Bereich Machine Learning, Data Science und Connectivity, ist von besonderer Wichtigkeit auch für die Weiterentwicklung der virtuellen Fahrbegleitung. Anbieter, die den Road Assistant in ihrem eigenen Fahrzeug einsetzen möchten, haben gegebenenfalls unterschiedliche Wünsche an die K.I. – so soll diese möglicherweise Empfehlungen für Stadterkundungen mit maximaler Verlässlichkeit abgeben, und beim Buchen von Tickets, Flügen oder Unterkünften dürfen ebenfalls keine Fehler geschehen. Je nach Use Case muss das System spezialisiert und mit entsprechenden Daten trainiert werden, um in jedem gewünschten Bereich faktenbasierte Antworten ohne maschinelles Halluzinieren zu erteilen – und somit überhaupt erst für das positive Nutzerverhalten zu sorgen. Die modernste Entwicklung ist vergebliche Mühe, sollten Nutzer durch unscharfe oder gar falsche Antworten einer K.I. verunsichert worden sein. Das zugrundeliegende Sprachmodell (LLM – Large Language Model) entsprechend zu modifizieren und so einen vielseitigen und flexiblen Anwendungsbereich zu garantieren, ist eine der Besonderheiten, für die der Very Enhanced Road Assistant von Beginn an entwickelt wurde. Um die Belastbarkeit der Antworten der K.I. für den Einsatz im Fahrzeug zu erhöhen, verwendet der Very Enhanced Road Assistant das sogenannte „Prompt Engineering“. Gemeinsam mit einer gepflegten Vektordatenbank sorgt dieses Prompt Engineering, also der Aufbau der Eingabe und die Auswertung der erhaltenen Daten, dafür, dem Sprachmodell der K.I. dabei zu helfen, den Nutzer-Kontext zu berücksichtigen und Falschaussagen größtenteils zu umgehen.
Außerhalb des sprachlichen Bereichs kann der Very Enhanced Road Assistant durch weitere Kanäle mit Reisenden kommunizieren: Dank mehrerer Kameras kann das System Passagiere aktiv ansprechen und relevante Informationen scannen, um den Kontext einer Reise in Gesprächen besser zu berücksichtigen. Diese fortschrittliche KI-Kapazität wurde durch die Integration von Audio-, Video- und Scanning-Techniken verstärkt, wodurch die KI zukünftig in der Position sein wird, ihre Antworten basierend auch auf der nonverbalen Kommunikation der Nutzer zu modifizieren. Hierfür spielte erneut die von der Basis an selbstentwickelte Konnektivität der einzelnen Module (Kameras, Sensoren, Text-to-Speech etc.) eine wichtige, teils gar elementare Rolle.
Können also all diese Neuerungen dafür sorgen, dass Fahrgäste die erste Berührungsangst vor der autonom fahrenden Welt verlieren? Die Last-Mile-Lösung in der Last-Mile-Lösung, eine Innovations-Matroschka? Kann Vertrauen digitalisiert werden und kann eine Fahrbegleitung dabei helfen, das Bedürfnis nach individueller Fahrzeug-Kontrolle zu reduzieren, um einen höheren Nutzerkomfort zu erfahren?
Sicher scheint, dass die Evolution des Transports, einer wirklich neuen Mobilität, fernab von reinen Antriebstechnologie-Wechseln oder kaum ablösbarem Individualverkehr, mit dem „Very Enhanced Road Assistant etwas greifbarer gemacht wird. Schließlich ist „Transport“ letztlich eine Bezeichnung für die rein technische Überwindung einer zwischen Start und Ziel liegenden Strecke. Wenn wir von Menschen sprechen, reden wir immer von einer Erfahrung, einem greifbaren Erlebnis, von Erinnerungen, kurzum: Von einer Reise. Und die hat gerade erst begonnen.