Die Weltmeisterschaft 2022 findet in Katar statt – nach dem wenig überraschenden Vorrunden-Aus ohne die deutsche Mannschaft - und spaltet die Gemüter: Sportliches Weltereignis steht einem Politikum gegenüber – meist eine ungünstige Kombination. Unbestritten ist indes, dass die korrekte Vorhersage fußballerischer Kombination auf und neben dem Platz ein Thema ist, dass vom Profi-Trainer bis zum Wettbüro viele Menschen beschäftigt. Ein Ansatz, um Ergebnisse und Leistungen im Vorfeld einzugrenzen und bis zur Vorhersage eines Ergebnisses zu gehen, ist „Deep Soccer“, der Machine Learning Soccer Predictor von Dr. Miguel Gonzalez, der bei Cognizant Mobility im Fachbereich Data Science tätig ist. Wir haben uns mit ihm unterhalten und stellen euch heute in essenzieller Kürze vor, was genau „Deep Soccer“ ist, wie ihr das Tool nutzen könnt und wieso ihr trotzdem lieber noch kein Geld darauf wettet.
Marc
Marketing Professional
2.12.22
Ca. 9 min
Was genau ist Deep Soccer, der Machine Learning Predictor für Fußballergebnisse?
Grundsätzlich handelt es sich bei Deep Soccer um eine Künstliche Intelligenz, die sowohl Spielergebnisse als auch Spielerperformances vorhersagt und dabei auf Mechanismen des industriellen Machine Learning verwendet. Wir empfehlen euch für einen genaueren Einblick in diese spannende Materie unsere Artikel zu den Themen Clustering und Klassifizierung, ohne die das Trainieren eines Modells nicht möglich wäre.
Während Deep Soccer zu Beginn das Projekt eines enthusiastischen Data Science Fans war, namentlich Dr. Miguel Gonzalez, der einfach Sport, Machine Learning und ergebnisorientierte Data Science kombinieren wollte, ist es zu einem konkreten Projekt angewachsen, für dass sich auch die vereinte Journaille vermehrt zu interessieren beginnt. Wer des Spanischen mächtig ist (oder die Übersetzungsfunktion seines Browsers verwenden möchte, kann sich einen der Artikel unter diesem Link ansehen. Festzuhalten bleibt dennoch, dass es sich um ein privates Projekt handelt und nicht um eine Arbeit aus dem Umfeld der Mobility Rockstars oder von Cognizant Mobility.
Was kann Deep Soccer also nun?
Das auf künstlicher Intelligenz basierende Tools sagt zwei Dinge hervor: Einerseits die Ergebnisse eines Fußballspiels, wobei die Liga, oder wie in diesem Fall die WM, gezielt gewählt werden kann. Nach Eingabe der Partie spuckt das Tool eine Vielzahl von Werten aus: Die voraussichtliche Anzahl der Tore pro Halbzeit, wie viele Fouls, Ecken und Karten könnte es geben und einige Metriken mehr.
Dieser Teil macht natürlich besonders Spaß, und gerade während der Weltmeisterschaft ist es nicht ohne Reiz, seine eigenen Tipps mit denen der K.I. abzugleichen. Dass es sich bei den Vorhersagen natürlich um Prognosen handelt, nicht um belastbare Predictions, versteht sich von selbst – nicht zuletzt hat beispielsweise das deutsche Team trotz einer vorhergesehenen Wahrscheinlichkeit auf den Sieg von rund 50 Prozent dennoch Federn gegen die passionierten Inselbewohner Japans gelassen. Man muss aus seinen Chancen auch was machen, versteht sich von selbst. Dass es Deutschland gegen Costa Rica schaffen würde, sagte der Predictor indes voraus: Er tippte korrekt auf einen Sieg der deutschen Nationalmannschaft, auch wenn diese trotz des Sieges erneut in einer WM-Vorrunde scheiterte und das restliche Turnier von der Tribüne aus verfolgen muss.
Deep Soccer: Mehr als nur ein Spiel
Die Headline nimmt es vorweg: Deep Soccer kann mehr als „nur“ Spiele vorhersagen. Ein wichtiger Baustein des Tools – der indes noch nicht online abrufbar ist – ist die Vorhersage der Spielerperformances. Wer sich also dafür interessiert, wie ein Christiano Ronaldo sich trotz fortgeschrittenen Alters (und fortgeschrittener Attitüde) in einem Spiel gegen den FC Bayern schlagen würde, kann auch dies mit Deep Soccer checken lassen. Wie viele Tore so ein Ronaldo dann schießen könnte, wie viele Fouls begeht er, wie oft schießt er mit dem linken Fuß oder dem rechten? Wie viele Schüsse Richtung Tor hat er abgefeuert, wie viele Ecken führt er aus? Diese Werte lassen sich aufgrund verschiedener Datensätze – dazu gleich mehr – mit einiger Präzision vorhersagen und bieten zwar Raum für Interpretation, können aber durchaus Anhaltspunkte für beispielsweise Trainer sein, ihre Strategie aufzubauen; was auch erklärtes Ziel des Machine Learning Football Predictors ist.
Wer auch diesen Teil des Tools einmal in Aktion sehen möchte, kann sich das direkt von Dr. Miguel Gonzalez selbst erklären lassen, und zwar in diesem YouTube Video. Ist auf Spanisch, aber einfach Untertitel einschalten und ab dafür.
Deep Soccer Machine Learning Football Predictor: Und woher kommen die Daten?
Wenn es um Data Science geht, dann, klar, geht es vor allem um: Daten. Um ein Modell für eine künstliche Intelligenz zu trainieren, benötigt es Trainingsdaten. Die allerdings sind, gerade im Bereich Fußball, durchaus einfach zu bekommen. Datenbanken wie Kaggle bieten vielerlei Datensätze an, auf vielen Websites finden sich historische Daten über Fußballspiele und -spieler, die Daten der FIFA sind öffentlich, und selbst Spiele wie FIFA*23 bieten umfangreiche Datensätze, mit denen sich eine K.I. trainieren lässt.
Die eigentliche Schwierigkeit besteht noch dazu nicht im Erhalt der Daten, sondern in deren Mischung in einer einzigen Datenbank. Frei nach dem Pareto-Prinzip macht dieser in der finalen Ausführung weniger relevante Aspekt nahezu 80 Prozent des Aufwands auf – denn nur mit sauberen Daten lassen sich saubere Ergebnisse prognostizieren.
Im nächsten Schritt müssen diese Daten also verifiziert und verbessert werden, Stichwort „Data Highness“. Fehler wollen bereinigt und die Daten ordentlich aufbereitet werden.
Das auf Python als Haupttechnologie beruhende Deep Soccer Tool beschäftigt im Weiteren Algorithmen, um mit diesen Daten umzugehen und das Modell zu trainieren. Im Bereich des industriellen Machine Learning legt man üblicherweise verschiedene Algorithmen an, um zu prüfen, welcher am besten funktioniert, und insbesondere bei überschaubaren Datensätzen eignet sich nicht jeder Algorithmus. Random Forest als Weiterentwicklung der bekannten Decision Trees bot sich für die Spielerperformances an und ist in der Lage, die vielfältigen Entscheidungen, die zu einer Prognose führen, zu berücksichtigen.
Um das Modell für die Spielergebnisse zu trainieren, war Neural Networks der erste Ansatz – Deep Learning benötigt üblicherweise aber durchaus viele Daten, weshalb sich Linear Regression hier als funktionaler Lösungsansatz durchsetzte und nun dafür sorgt, dass Deep Soccer viele spannende Ergebnisse ausgeben kann.
Für die Grafiken nutzt Dr. Gonzalez Javascript, und ohne Auszeichnungssprachen wie HTML und CSS geht es nun mal nicht im Webdesign, versteht sich.
Deep Soccer – Kann ich darauf wetten? Und meine eigenen Ergebnisse und Daten mit dem Tool kombinieren?
Natürlich: Diese Zwischenüberschrift weckt Begehrlichkeiten. Kann man dank Künstlicher Intelligenz nun etwa die Partien und Performances von Mannschaften und Spielern vorhersagen und sich die Brieftasche im Wettbüro vergolden lassen? Nein, natürlich nicht. Es handelt sich noch immer um errechnete Prognosen. Diese basieren durchaus auf verlässlichen Werten, und die Vorhersagen werden sich vor allem bei kontinuierlicher Weiterentwicklung des Projekts präzisieren und somit auch als Basis für beispielsweise Trainer, Manager und Teams verwenden, so zumindest die Hoffnung von Dr. Miguel Gonzalez.
Die gute Nachricht ist natürlich, dass Deep Soccer mit einer API, also einer Schnittstelle gebaut wurde. Es lassen sich also nicht nur einzelne Ergebnisse manuell auf der Seite abrufen: In wenigen Minuten lassen sich theoretisch tausende von Ergebnissen vorhersagen. Ein neuer Datensatz, der weiterverwendet werden kann.
Wer sich dafür interessiert, besucht die Website deepsoccer.com, wendet sich bei Fragen an admin@deep-soccer.com, nutzt unser Kontaktformular oder kontaktiert uns auf LinkedIn.