Daten
Last updated on 2025-08-25 | Edit this page
Estimated time: 40 minutes
Overview
Questions
- Was sind Daten in den Geisteswissenschaften?
- Was sind die Unterschiede zwischen verschiedenen Arten von Daten?
Objectives
Nach Abschluss dieser Lerneinheit sollten die Teilnehmenden in der Lage sein
- zwischen analogen Daten, digitalisierten Daten und genuin digitalen (born-digital) Daten unterscheiden,
- verstehen, wie Daten in der geisteswissenschaftlichen Forschung kategorisiert, erhoben und genutzt werden,
- die Auswirkungen verschiedener Datentypen auf unterschiedliche Forschungsmethoden und Forschungsergebnisse untersuchen.
Datentypen
Analoge Daten: Analoge Daten entstehen in physischen, nicht-digitalen Formaten wie handschriftliche Dokumente, Fotografien oder materielle Objekte.
Digitalisierte Daten: Digitalisierte Daten sind ehemals analoge Informationen, die durch Verfahren wie Scannen, Transkribieren oder Kodieren in digitale Formate überführt wurden. Diese Transformation erweitert nicht nur die Zugänglichkeit, sondern ermöglicht auch die Anwendung digitaler Analysemethoden. Ein differenziertes Verständnis digitalisierter Daten ist zentral, um nachvollziehen zu können, wie analoge Ressourcen für digitale Nutzungskontexte aufbereitet und angepasst werden.
Born-Digital Daten (Genuin digitale Daten): Genuin digitale Daten entstehen direkt in digitalen Umgebungen und existieren ausschließlich in diesen Formaten. Dazu zählen etwa Datenbanken, digitale Texte, audiovisuelle Medien oder computergenerierte Inhalte, die nie in physischer Form vorlagen. Diese Datenform steht exemplarisch für eine digital geprägte Forschungspraxis, in der Daten in Echtzeit erzeugt, verarbeitet und verbreitet werden – und die damit neue Möglichkeiten, aber auch neue Anforderungen für die geisteswissenschaftliche Arbeit schafft.
Übung
Analog vs. Digital – Was sehen wir eigentlich?
Diese Übung lädt dazu ein, die Unterschiede zwischen analogen und digitalen Daten am Beispiel eines Objekts des kulturellen Erbes zu erkunden. Im Mittelpunkt steht die Frage, was geschieht, wenn physische Kunstwerke durch digitale Medien zugänglich gemacht werden. Dazu verwenden wir beispielhaft Daten aus der Sammlung des Metropolitan Museum of Modern Art.
Leitfrage
Mit welcher Art von Daten arbeiten wir, wenn wir mit digitalisierten Kulturobjekten interagieren? Und was passiert mit den Eigenschaften analoger Objekte, wenn sie in digitale Repräsentationen überführt werden?
Schritt 1: Beobachtung
Wähle ein digitales Bild eines Objekts aus der Online-Sammlung des Metropolitan Museum of Modern Art (oder eines anderen digitalen Museumsportals). Reflektiere anschließend über die folgenden Fragen: Was für ein Objekt ist das im Original? Was genau siehst du auf dem Bildschirm – und was bedeutet es, das Objekt als digitale Repräsentation zu sehen? Was geht im Vergleich zur direkten Erfahrung mit dem Original möglicherweise verloren?
Schritt 2: Diskussion
Fragen: Wenn das Original ein analoges (physisches) Kunstwerk ist und wir es auf einem Bildschirm betrachten – mit welcher Art von Daten arbeiten wir dann eigentlich? Was geschieht mit der Materialität des Objekts, wenn es digitalisiert wird? Wie beeinflusst die digitale Repräsentation unser Verständnis oder unsere Interpretation? Was gewinnen wir durch diese Transformation – und was geht dabei verloren?
Schritt 3: Reflektion
Überlege dir: Welche Eigenschaften eines Objekts lassen sich nur schwer oder gar nicht digital erfassen? Welche digitalen Formate (z. B. hochauflösende Bilder, 3D-Modelle, Metadaten) versuchen, diese Einschränkungen auszugleichen? Wo begegnest du in deinem eigenen Fachgebiet der Transformation vom Analogen zum Digitalen? Und wie beeinflusst sie deine Forschung oder Interpretation?
Wir betrachten das Gemälde auf einem Computerbildschirm. Alles, was wir sehen, wird digital angezeigt. Obwohl das ursprüngliche Objekt analog ist, erfolgt unsere Interaktion ausschließlich digital. Das Gemälde wurde digitalisiert – also in Daten umgewandelt (z. B. Pixel, Metadaten), die von Computern gespeichert, verarbeitet, angezeigt, geteilt, durchsucht und bearbeitet werden können. Wir interagieren nicht mit dem analogen Objekt selbst, sondern mit seiner digitalen Repräsentation.
Diese Transformation ermöglicht einen breiteren Zugang, bringt aber auch Einschränkungen mit sich: Aspekte wie Maßstab, Materialität oder tatsächliche Farbwirkung können verloren gehen – wir erleben lediglich eine digitale Annäherung. Das Verständnis dieser Transformation ist zentral für den Umgang mit Daten in den Digital Humanities und entscheidend für die Frage, wie unser Wissen über Kultur durch das digitale Medium geprägt wird.
Mit analogen Daten meinen wir die physischen Artefakte im Museum. Die Sammlung des Museums umfasst zahlreiche materielle Objekte wie Skulpturen, Gemälde und andere Artefakte, die ausschließlich in ihrer ursprünglichen, nicht-digitalen Form existieren. So enthält zum Beispiel die Sammlung altägyptischer Kunst im Metropolitan Museum etwa 30.000 Objekte – wie hier zu sehen ist.
Mit digitalisierten Daten meinen wir zum Beispiel digitalisierte Lichtbilder von Objekten. Hochauflösende Fotografien von Kunstwerken und Artefakten – etwa Gemälden, Skulpturen oder archäologischen Fundstücken – wurden digitalisiert, um sie für Forschung und Öffentlichkeit zugänglich zu machen. Diese Bilder sind über die Online-Datenbank der Museumssammlung abrufbar.
Born-digital Daten sind unter anderem born-digital photographs or videos, sowie digitale Aufzeichnungen und Datenbanken der Museumssammlungen, einschließlich Metadaten und detaillierter Beschreibungen von Kunstwerken. Die Archive des Museums enthalten ebenfalls born-digital Materialien wie Ausstellungsdokumentationen, kuratorische und administrative Unterlagen, die digital erstellt und gescheichrt wurden.
Möglichkeiten und Herausforderungen, die mit den einzelnen Datentypen verbunden sind, sowie deren Wirkungen innerhalb des größeren Forschungssystems.:
Diese Datentypen werden auf unterschiedliche Weise genutzt und prägen sowie unterstützen jeweils spezifische Forschungspraktiken.
Analoge Daten, vorhanden in Magazinen, Archiven oder physischen Sammlungen, bilden die Grundlage für historische und materialbezogene Studien und ermöglichen eine unmittelbare Auseinandersetzung mit den Originalquellen. Ihre haptischen und kontextuellen Eigenschaften sind für das Verständnis von Provenienz und Authentizität von unschätzbarem Wert. Allerdings sind diese Daten häufig nur eingeschränkt zugänglich.
Digitalisierte Daten verändern die Zugänglichkeit einer physischen Quellen grundlegend und ermöglichen den ortsunabhängigen Zugriff über digitale Plattformen und Repositorien. Dieser Wandel demokratisiert die Forschung, indem er geografische Barrieren überwindet und vergleichende Studien erleichtert. Darüber hinaus beinhaltet die Digitalisierung häufig Metadaten und Suchfunktionen, die die Auffindbarkeit und Nutzbarkeit analoger Quellen erheblich verbessern. Die Digitalisierung wirft jedoch Bedenken hinsichtlich der Datenintegrität, eines möglichen Verlusts von Kontext sowie einer bevorzugten Behandlung bestimmter Sammlungen gegenüber anderen auf.
Born-digital data ist, im Gegensatz dazu, vornherein dynamisch angelegt und für die Integration in digitale Umgebungen konzipiert. Sie fördert kollaborative und interdisziplinäre Forschung, da sie in Echtzeit geteilt, aktualisiert und analysiert werden kann. Ihre rechnergestützten Potenziale – etwa für maschinelles Lernen oder Datenvisualisierung – eröffnen neue Wege insbesondere in den Digital Humanities, der Data Science oder der Netzwerkanalyse. Gleichzeitig bringt sie Herausforderungen mit sich: etwa hinsichtlich der Langzeitarchivierung, des Datenschutzes oder der Ephemerität digitaler Formate.
Zudem interagieren diese Datentypen häufig in hybriden Forschungsabläufen. So können beispielsweise digitalisierte analoge Daten durch rechnergestützte Analysen gemeinsam mit born-digital-Daten angereichert werden, wodurch neue Erkenntnisebenen entstehen. Ebenso kann born-digitales Material Anlass geben, analoge Quellen neu zu untersuchen – ein zyklischer Prozess der Entdeckung und Neubewertung. Dieses Zusammenspiel verdeutlicht die sich wandelnde Landschaft der Wissensproduktion, in der verschiedene Datentypen zusammenwirken, um komplexe Forschungsfragen zu adressieren.
Outcome
Wie unterstützen institutionelle Infrastrukturen wie Bibliotheken, Archive und Datenzentren diese Prozesse und wie meistern sie die Herausforderung, Bewahrung, Zugang und Innovation in Einklang zu bringen?
- Analoge Daten werden in Magazinen, Archiven oder physischen Sammlungen aufbewahrt.
- Digitalisierte Daten sind eine Umwandlung analoger Daten in digitale Form.
- Born-digital data haben keine analoge Representation.