Willst du deine Analysefähigkeiten oder dein neues BI-Tool testen und hast keine interessanten Daten zur Hand? Analysiere doch einfach die Schweiz. Opendata.swiss bietet dir die Möglichkeit.
Frei verfügbare Datensets
Das Analysieren und Manipulieren von Datensätzen macht mehr Spass, wenn es dabei auch Interessantes zu entdecken gibt.
Die Patientendaten aus der Firma sind jedoch definitiv nicht zum Testen deines neuen BI-Tools gedacht und die Beispieldatensätze, die du in der Vorlesung erhalten hast, willst du auch nicht nochmal ansehen.
Was gibt es denn sonst noch an frei zugänglichen und zugleich spannenden Datensets?
Mein Tipp dazu wäre https://opendata.swiss. Seitdem der Bundesrat 2018 eine Open Government Data Strategie verabschiedet hat, sind dort immer mehr Daten der Bundesverwaltung, aber auch von Kantonen oder Privaten, die im Auftrag des Bundes arbeiten, öffentlich zugänglich. In der Zwischenzeit stehen schon fast 7000 Datensätze auf der Plattform bereit.
Was für Datensätze gibt es?
Interessiert es dich, wie viele Stipendien in den letzten Jahren an die Studierenden vergeben worden sind? Oder bist du eher darüber besorgt, ob es in deinem Wohnkanton mehr Verkehrsunfälle gab als bei den Nachbarn?
Willst du vielleicht die Entwicklung des Nutztierbestandes in der Landwirtschaft in der nächsten Pausendiskussion zum Thema machen? Oder musst du auch einfach unbedingt wissen, an welchem Bahnhof in der Schweiz es die meisten Aschenbecher gibt?
All diese Fragen und noch viele mehr, kannst du mit den öffentlichen Datensets auf opendata.swiss beantworten. Ich selbst habe beispielsweise die Daten über sämtliche Energieerzeugungsanlagen in der Schweiz und das Solarpotenzial des Gebäudeparks schon in mehreren Projekten, auch bei meiner Arbeit, verwendet.
Auf opendata.swiss sind die Datensätze in 24 Hauptkategorien wie beispielsweise Gesundheit, Tourismus oder Industrie aufgeteilt. Über eine Suchfunktion lassen sich die Datensätze auch direkt finden, wenn Daten zu einem konkreten Thema gesucht sind.
Um ein bisschen „gluschtig“ auf die Daten zu machen, gibt es auch einige Showcases auf der Webseite verlinkt.
Wie liegen die Daten vor?
Wie kannst du die Daten nun konkret nutzen? Opendata.swiss hat dafür natürlich ein Handbuch bereitgestellt. Für einen ersten Test lassen sich die meisten Datensätze einfach als Datei laden. Dabei gibt es je nach Datensatz von json- über xml- bis zum Excel-File die ganze Bandbreite zum Download. Es ist also für jedes Bedürfnis etwas zu finden.
Für viele statistische Themen gibt es zudem vorbereitete Datenwürfel. Über ein Webtool lässt sich aus diesen die gewünschte Auswertung als interaktive Tabelle selbst zusammenklicken und anschliessend zur Weiterverarbeitung exportieren.
Für diejenigen, denen das zu einfach ist, oder die längerfristig mit den Datensätzen arbeiten möchten, gibt es auch eine API mit der beispielsweise über den Browser oder die Kommandozeile mit einem entsprechenden Tool (curl) die Daten gezielt abgefragt werden können.
Wer etwas weiter zurück in der Datengeschichte gehen will, hat es nicht so komfortabel. Bei Interesse können aber auch die alten statistischen Jahrbücher der Schweiz als Scan angeschaut werden.
Vielleicht ist für dich auch etwas von Interesse mit dabei und du kannst dein Testprojekt nun mit interessanten Daten füllen. Und wer weiss – im besten Fall lassen sich sogar in deiner nächsten beruflichen Aufgabe die bereits vorliegenden Daten mit diesen frei verfügbaren Informationen verknüpfen und neue Erkenntnisse gewinnen. Falls du die Daten kommerziell nutzen willst, empfielt sich vorher jedoch ein Blick auf die exakten Nutzungsbedinungen der Datensätze.