Ein Lehrgang in Big Data und man ist Data Scientist? Weit gefehlt!

Das CAS Big Data Analytics der Hochschule Luzern trifft genau den Nerv der Zeit. Dies zeigt sich anhand der ausgebuchten Kurse. Doch kann man sich danach als Data Scientist bewerben? Nein! In dem Lehrgang wird  jedoch einen breiten  Überblick in die Welt der „grossen Daten“  vermittelt und bietet somit einen optimalen Einstieg.

Link zum CAS Big Data Analytics Hochschule Luzern:
https://www.hslu.ch/de-ch/informatik/weiterbildung/data-intelligence-and-big-data/cas-big-data-analytics/

Alles und Jeder ist heute irgendwie mit dem Internet verbunden und generiert immer mehr Daten. Dies wird sich in der Zeit von autonomen Fahrzeugen, Kundenkarten, Social Media und dem Internet der Dinge auch nicht so schnell ändern. Doch was soll mit diesen Daten gemacht werden, damit daraus auch etwas Nutzenstiftendes entsteht? Hier kommt der Data Scientist ins Spiel. Er verarbeitet, sortiert und visualisiert die Daten so, dass daraus Rückschlüsse auf Verhalten, Motive oder Verkaufszahlen gemacht werden können. Doch wie wird man Data Scientist und lernt mit den Daten umzugehen? Hier setzt das CAS Big Data an. In einem kompakten Lehrgang werden den Teilnehmenden grundlegende Kenntnisse zur Verarbeitung von Daten mitgegeben.

Überblick verschaffen, Tools kennenlernen, Vorgehen beibringen

Wer sich neu mit dem Thema Big Data Analytics befasst, kann sich in der enormen Anzahl von Programmen, Werkzeugen, Technologien und Anbietern schnell verloren fühlen. Ohne Grundkenntnisse verliert man schnell den Überblick. Darum werden im Kurs zuerst die Grundlagen der Technologien behandelt.

Quelle: Hochschule Luzern / Trivadis AG

Man lernt, warum Cloudtechnologien die Verarbeitung von enormen Datenmassen erst möglich gemacht haben. Auch erlernt man, welche Tools wo eingesetzt werden können und wie es möglich ist, sich in ein paar Minuten in einem Server irgendwo auf der Welt einzumieten. Mit dem Wissen, welche Werkzeuge wo benutzt werden, kann es mit dem Bearbeiten der verschiedenen Daten losgehen. Sind die Daten so aufbereitet, dass man mit ihnen arbeiten kann, erlernt man, wie diese mit verschiedenen Methoden visualisiert werden, um die Daten besser zu verstehen. Die Visualisierungen ermöglichen die gewünschten Analysen zu erstellen oder Muster aus den Daten zu erkennen.

CRISP Methode. Quelle: https://sudar.me

Diese einzelnen Techniken fügen sich dann nach und nach zu einer ganzen Big Data Plattform zusammen, mit welcher verschiedene Arten von Daten aus verschiedenen Quellen verarbeitet werden können.

Grundvoraussetzungen

Die am Anfang vermittelten Kenntnisse sind die Grundlagen, um sich mit dem Aufsetzen einer Big Data Plattform zu befassen. Jedoch kann im CAS verständlicherweise nicht jede Einzelheit angeschaut werden. Themengebiete wie die grundlegenden Mathematik, Statistik oder Algorithmen werden in diesem Kurs beispielsweise nicht angeschaut. Zudem muss jeder individuelle Anwendungsfall isoliert angeschaut werden und die dafür benötigten Tools müssen neu evaluiert werden. Dabei liefert der Kurs ein gut gefüllter Rucksack mit dem Rüstzeug, um beim Entwurf und Auswahl der Tools mitzureden.

Self Study, vor und nach dem Lehrgang

Nach dem CAS ist vor dem CAS. Der gewonnene Überblick, der im Unterricht vermittelt wird, hilft sich im Big Data „Jungle“ zurecht zu finden. Wenn man sich aber tiefer mit einer Thematik vertraut machen will, bleibt einem nicht anders übrig, als sich die Skills selber beizubringen. Wer nicht schon mit den verwendeten Programmiersprachen wie Python, R, SQL oder Scala vertraut ist, muss diese zuerst lernen. Ein gute Möglichkeit dazu sind Online-Lernplattformen. Für eine kleine Gebühr bekommt man Zugriff auf ein komplettes Paket mit Videoanleitung, Codebeispielen, Software, weiterführende Links und Support. Die Kurse sind so aufgebaut, dass man die Theorie danach gleich in der Praxis ausprobiert. Dabei wird man Schritt für Schritt durch die Codebeispiele geführt und man erhält ein besseres Verständnis für die Thematik.

Udemy Online Kurs
Quelle: Printscreen Udemy

Udemy Kurse (Machine Learning):
https://www.udemy.com/course/r-data-science-machine-learning/
Udemy Kurs (Python):
https://www.udemy.com/course/python-for-data-science-and-machine-learning-bootcamp/
Udemy Kurs (R-Studio):
https://www.udemy.com/course/r-data-science-machine-learning/

Fazit

Das CAS Big Data Analysis gibt dem Besucher des Kurses einen guten Einblick in die Themengebiete und die komplexen Architekturen, die für die Arbeit mit Big Data benötigt werden. Für den Kurs sind keine spezifischen Vorkenntnisse nötig, eine gewisses technisches Verständnis und das beherrschen von den Basistechniken von Programmiertools und Programmiersprachen ist aber sicherlich hilfreich. Eine gewisse Neugierde und wenig Berührungsängste mit Technologie und Analytik ist zudem von Vorteil. In der schnelllebigen Welt der Datenverarbeitung hat man aber nie ausgelernt und muss immer am Ball bleiben. Dazu am besten die gängigen Newsportale konsultieren, z.B auf KDnuggets.

Beitrag teilen

Schreibe einen Kommentar