Ich möchte euch heute von diesem Projekt erzählen, welches ich für diesen Beitrag durchgeführt habe. Ich bin ein begeisterter Fussballfan und habe eine Leidenschaft für Daten. Deshalb wollte ich die Potenziale von Fussballspielern einmal selbst mithilfe von Machine Learning analysieren. Als Anfänger in Python, Data Engineering und Machine Learning habe ich mir Unterstützung geholt, unter anderem durch meine Weiterbildungen CAS Data Engineering & Applied Data Science, sowie CAS Machine Learning. Aber was mir wirklich geholfen hat, war meine Neugier und der Einsatz von KI. Vielleicht motiviert euch dieser Beitrag, eigene Ideen anzugehen – selbst ohne grosse Vorkenntnisse.
DISCLAIMER: Dieses Projekt dient nur als Beispiel! Es gibt sicherlich noch Fehler im Python Code und es ist auch nicht praxisorientiert. Ich habe es so umgesetzt, wie ich es für richtig empfunden habe. Der Blogbeitrag wurde von mir selbst geschrieben, jedoch mit der Hilfe von ChatGPT „harmonisiert“.
1. Erstellung synthetischer Spieldaten
Da echte Daten nicht verfügbar waren, habe ich synthetische Daten für 40 Spieler über vier Jahre (2020-2024) erstellt. Diese Daten umfassten Alter, Gewicht, gespielte Spiele, Schlafstunden und Trainingsdauer. Ein wichtiger Teil war das Performance Rating, das von Erfahrung, Fitness und Verletzungen beeinflusst wurde. Das half mir zu verstehen, welche Art von Daten nötig sind und welche Faktoren die Leistung beeinflussen. Die KI unterstützte mich dabei, Ideen in Code umzusetzen. Dadurch konnte ich den Prozess nachvollziehen und lernen, wie man Python gezielter verwendet.
2. Datenbereinigung und -vorbereitung
Nach der Datengenerierung folgte die Datenbereinigung. Ich füllte fehlende Werte auf, wandelte Spielerpositionen in Dummy-Variablen um und filterte Ausreisser heraus. Dabei wurde mir klar, wie wichtig saubere Daten für Machine Learning sind – ohne gute Daten bringt der beste Algorithmus nichts!
3. Explorative Datenanalyse (EDA)
Bei der explorativen Datenanalyse (EDA) habe ich grundlegende Statistiken berechnet und Visualisierungen erstellt. Besonders interessant war die Korrelationsmatrix, um Zusammenhänge zu erkennen. Die EDA half mir, wichtige Merkmale zu identifizieren und zu verstehen, welche Faktoren die Leistung am meisten beeinflussen.
Mit Tools wie Pandas und Matplotlib zu arbeiten, war für mich neu, aber sehr spannend.
4. Modellierung mit einem neuronalen Netzwerk
Ich verwendete ein neuronales Netzwerk (MLP-Regressor), um das Potenzial der Spieler vorherzusagen. Die Daten wurden in Trainings- und Testdaten aufgeteilt und mit dem StandardScaler skaliert. Das Modell wurde trainiert und mit Mean Squared Error (MSE) bewertet. Mithilfe der Permutation Importance ermittelte ich die wichtigsten Einflussfaktoren.
Es war spannend zu sehen, wie das Modell Muster erkannte und Vorhersagen traf. Machine Learning ist nicht nur für Experten – sobald man die Grundlagen versteht, kann man spannende Dinge umsetzen.
5. Visualisierung mit einem interaktiven Dashboard
Ich entwickelte ein interaktives Dashboard mit Dash und Plotly. Es bietet:
- Top 10 Spieler nach Potenzial
- Potenzialentwicklung im Zeitverlauf
- Verletzungswahrscheinlichkeit Heatmap
- Spielervergleich
- Individuelles Diagramm
Die Erstellung des Dashboards war ein Highlight, weil es die Ergebnisse greifbarer gemacht hat. Ohne Vorkenntnisse habe ich gelernt, wie man ein funktionales Dashboard baut. Da ich selbst einen Mac nutze und daher PowerBI nicht verwenden konnte, habe ich nach Alternativen gesucht. Das die Plotly Bibliothek auch Dashboards erstellen kann, war mir bis dahin nicht bewusst.
DEMO
Bekanntlich sagen Bilder / Videos mehr als tausend Worte. Daher habe ich in einem sehr kurzen Video, die oben genannten Schritte in meinen Python Notebooks und zum Schluss noch das Dashboard aufgezeigt.
Link zum Video: Fussballspieler Potenzialanalyse
Fazit
Auch kleinere Fussballclubs können in der heutigen Zeit, ihre Spieler einfacher analysieren. Tracker liefern nützliche Daten, und mit KI können diese einfach ausgewertet werden. Jeder Club kann mit einfachen Mitteln ein Dashboard erstellen und die Spielerleistungen stets im Blick behalten – effizient und kostengünstig.
Für dieses Projekt nutzte ich KI-Unterstützung, vor allem ChatGPT von OpenAI, zur Fehlerbehebung und Code-Optimierung. Trotz der Hilfe braucht man ein gewisses Grundverständnis, um KI sinnvoll zu nutzen. Auch als Anfänger kann man mit KI erste Schritte in Programmieren und Machine Learning angehen.
Das Projekt war für mich sehr interessant. Die Kombination aus synthetischen Daten, einem neuronalen Netzwerk und einem interaktiven Dashboard hat mir persönlich viel Spass gemacht. Ich konnte einige Zusammenhänge neu erkennen, welche ich davor nicht kannte. Ich hoffe, dieser Beitrag motiviert euch, eigene Ideen umzusetzen und die Möglichkeiten von KI zu nutzen.