Datenbearbeitung ist die Phase eines Projekts, in der Daten in ein gewünschtes Format umgewandelt und für die Analyse vorbereitet werden.
Welche Eigenschaften müssen die Datenformate haben, um langfristig nutzbar zu sein?
Je nach Phase im Datenlebenszyklus variieren die Anforderungen an die Formate.
Datenbearbeitung
In dieser Phase sind Formate erforderlich, die eine einfache und effiziente Bearbeitung ermöglichen. Oft kommen dabei bearbeitbare, aber teilweise proprietäre Formate zum Einsatz, da sie spezifische Funktionen und Werkzeuge bieten, die die Arbeit erleichtern. Beispiele hierfür sind Formate wie Microsoft Excel (.xlsx) oder bestimmte Datenbankformate.
Nachnutzung
Für die Wiederverwendung von Daten, beispielsweise durch andere Forscher:innen oder in zukünftigen Projekten, sind bearbeitbare Formate erforderlich, die jedoch, um die langfristige Lesbarkeit zu garantieren, möglichst nicht proprietär sein sollen. Offene Formate wie CSV (.csv) oder OpenDocument (.ods) ermöglichen eine grössere Interoperabilität und Unabhängigkeit von spezifischer Software, was die langfristige Nutzbarkeit und Austauschbarkeit der Daten verbessert.
Archivierung
Bei der Langzeitarchivierung ist es besonders wichtig, Formate zu wählen, die für die dauerhafte Speicherung geeignet sind. Diese Formate sollten möglichst nicht proprietär sein, um sicherzustellen, dass die Daten auch in Zukunft unabhängig von bestimmten Softwareanbietern zugänglich bleiben. Geeignete Formate für die Langzeitarchivierung sind beispielsweise PDF/A, XML oder TIFF, die speziell für die langfristige Nutzung konzipiert sind.
Es kann sinnvoll sein, Daten in mehreren Formaten zu speichern und zu veröffentlichen.
Welche Datenformate sind zu empfehlen?
Dateiformate, die sich gut zur Bearbeitung von Daten eignen, sind nicht unbedingt für die langfristige Archivierung geeignet.
Medientyp | Bearbeiten & Speichern | Archivieren |
Text | MS Word
Open/Libre Office MS Power Point |
PDF A/1-b |
Tabelle | Excel | CSV |
Bild | Jpeg
Png GIF |
TIFF
PDF A/1-b |
Audio/Video-Material | Windows Player | MPEG-4_AVC
WAV |
Archivtaugliche Dateiformate (ETH Fachstelle digitaler Datenerhalt) https://documentation.library.ethz.ch/display/DD/Archivtaugliche+Dateiformate
Katalog archivischer Dateiformate (KOST): kost-ceco | Dateiformate (KaD) | Katalog archivischer Dateiformate