Digitalisierung
1. Begriff und Einordnung
Unter D. im engeren Sinne versteht man die Umwandlung von herkömmlichen nicht-digitalen Medien und Informationseinheiten sowie von kontinuierlichen (analogen) Signalen in diskrete (digitale) Objekte. Im weiteren Sinne wird die zunehmend allgegenwärtige Nutzung von vernetzter Computertechnologie (Vernetzung) zur Unterstützung von Prozessen im privaten wie gesellschaftlichen Leben, in Wirtschaft, Industrie, Verwaltung und Wissenschaft ebenfalls als D. aufgefasst (Digitale Revolution). D. im engeren Sinne geht einher mit dem Aufkommen der EDV (Informatik) seit den 1940er Jahren. Maßgeblichen Impetus für die seit den 1990er Jahren stark steigende Bedeutung der D. geben die Entwicklung und Verbreitung moderner Informations- und Kommunikationstechnologien sowie das Internet.
2. Zweck und Funktion
Gegenstand der D. ist die i. d. R. zweckgebundene Erzeugung eines digitalen Abbildes (Digitalisat) einer nicht-digitalen Vorlage. Daten und Information, die genuin in digitalen Medien entstehen, also von vornherein digital sind, werden als born digital bezeichnet und fallen nur im weiteren Sinne in den Bereich der D.
Diese kann unterschiedliche Funktionen erfüllen. Als sein Surrogat ersetzt ein Digitalisat im weiteren Verlauf seines Lebenszyklus das Original: von seiner Anlage, über Zugänglichmachung und Verbreitung, der weiteren Verarbeitung, Kontextualisierung und Annotation, Speicherung bis hin zur Archivierung. Dabei können Digitalisate auf Grund ihrer Immaterialität beliebig oft und verlustfrei sowie i. d. R.verhältnismäßig kostengünstig kopiert und platzsparend gespeichert werden. Dies erlaubt ihre potentiell globale und schnelle Verfügbarkeit und Verbreitung (Viralität), woraus sich neue Formen der Prozessgestaltung in Wirtschaft (Netzwirtschaft), Industrie und Verwaltung (E-Government) herleiten lassen, die mehr Effizienz und höhereTransparenz versprechen.
Computergestützt lassen sich durch D. erzeugte Daten schneller und in erheblich größerem Umfang verarbeiten und auswerten (Big Data) als Informationen auf herkömmlichen Medien. Dies führt zur Entwicklung neuer Methoden auch in der Wissenschaft (u. a. Digital Humanities). Im Bereich der Kulturgüter kann durch D. das Original geschont werden bzw. als Surrogat überhaupt erst der Öffentlichkeit zugänglich gemacht werden.
3. Technik
Bei der D. handelt es sich um einen technischen und intellektuellen Transformationsprozess. Technisch kommen im Kern sogenannte Analog-Digital-Wandler zum Einsatz, die mittels physikalischer Sensoren die Vorlage abtasten und die gewonnenen Daten in einer geeigneten Form speichern. Dabei besitzt das analoge Signal, z. B. gesprochene Sprache, als Input der D. unendlich viele Werte in beliebig feiner Abstufung; es ist zeit- und wertekontinuierlich. Das digitale Signal als Output der D. ist hingegen zeit- und wertediskret, d. h. es stehen nur endlich viele, definierte Werte zur Verfügung. Zur Diskretisierung des analogen Signals wird dessen Messbereich daher in eine bestimmte Anzahl aneinander grenzender Intervalle (Wertebereiche) unterteilt und jedem dieser Intervalle ein diskreter Zahlwert (Code) zugewiesen, der den tatsächlichen Werten in diesem Intervall nahekommt (Quantisierung). Die Anzahl der zur Verfügung stehenden Codes wird Auflösung der D. genannt und i. d. R. in Bits gemessen: je mehr Bits zur Ausdifferenzierung der Werte zur Verfügung stehen, desto höher die Auflösung. Die Größe der Intervalle, in denen das analoge Signal pro Zeit- oder Streckeneinheit gemessen (abgetastet) wird, ist die Abtast- oder Samplingrate. Durch die immanente Reduktion unendlich vieler analoger auf eine begrenzte Zahl diskreter Werte bedeutet D. immer einen Verlust an Information im Vergleich zur Vorlage. Auflösung und Abtastrate sind damit Maße für die Qualität der D.
Intellektuell ist die D. insofern, als dass die Entscheidung über D.s-Parameter entscheidend für die nachhaltige Nutzung ihrer Produkte ist. Je nach Beschaffenheit des zu digitalisierenden Objekts, Zweck der D. sowie vorhandenen personellen wie zeitlichen Ressourcen spielen die Wahl des D.s-Geräts, Umgebung und Ausleuchtung der Vorlage, Wahl des Ausschnittes und oben genannte Qualitätsmaße eine Rolle. Essentiell ist darüber hinaus die Erschließung der Digitalisate mittels Metadaten. Deskriptive Metadaten werden vorrangig zum späteren Auffinden eines bestimmten Objektes herangezogen, strukturelle Metadaten, um das Objekt in seinem Aufbau zu erfassen, technische, um seine Qualität zu beurteilen und administrative, um z. B. Nutzungsrechte zu dokumentieren. Hierfür werden verschiedene nationale und internationale Standards angeboten, die sicherstellen sollen, dass Digitalisate auch lange nach ihrer Erzeugung auffindbar und nutzbar bleiben. Hierzu zählen auch standardisierte Kodierungssysteme für die Speicherung der Digitalisate, z. B. in Bilddateien. Die Art und Weise der D. ist abhängig vom Medium, das die zu digitalisierende Information trägt. Für Information in Bildern bzw. in Textform (Dokumente) wird i. d. R. eine zweidimensionale Bild-D. vorgenommen. Diese erfolgt mittels Digitalkameras oder Scansystemen verschiedener Ausprägungen. Bei Massen-D.en werden zudem Scan-Roboter verwendet, die im überwachten automatischen Betrieb hohe Durchlaufzahlen erreichen.
Die D. von dreidimensionalen Objekten gestaltet sich insgesamt aufwendiger. Je nach Anwendungszweck setzt man verschiedene bildgebende Verfahren wie Photogrammetrie, Laser-Scan oder Computertomographie ein, die i. d. R. einen verhältnismäßig hohen Aufwand an Nachbereitung der gemessen Daten erfordern. Für D. in der Medizin und weiteren industriellen wie wissenschaftlichen Anwendungen kommen zudem spezialisierte Messsysteme zum Einsatz. Eine Besonderheit stellt die D. von Dokumenten als ein häufig zweistufiger Prozess dar: nach der reinen Bilddigitalisierung des Informationsträgers erfolgt die Transkription der in den Dokumenten enthaltenen Texte als maschinenlesbare Zeichencodes. Für automatische Transkriptionen kommen Verfahren der Optical Character Recognition (OCR) zum Einsatz, die entweder generisch für einen breitgefächerten Einsatz oder für spezielle Dokumentarten und Schrifttypen entwickelt und vermarktet werden. Moderne OCR-Software kennt dabei die gängigen (Druck-)Schriftarten und kann zudem bei unbekannten und stark abweichenden Schriftarten ihre Datenbank durch Training entsprechend erweitern und somit die für wissenschaftliche Zwecke als zuverlässig anerkannte Buchstabengenauigkeit von 99,95% durchaus erreichen. Ältere Drucke und Vorlagen mit schlechter Qualität stellen für die automatische Texterkennung jedoch weiterhin häufig eine Herausforderung dar; für Handschriften steckt sie noch in den Kinderschuhen.
4. Digitalisierung und kulturelles Gedächtnis
Eine herausragende Bedeutung stellt die D. für die Institutionen des kulturellen Gedächtnisses – Bibliotheken, Archive und Museen (Museum) – dar. D. in diesen Bereichen dient v. a. dazu, Literatur, Archivalien und Artefakte weiträumig, zeit- und ortsungebunden sowie schrankenlos zugänglich zu machen, sie für die wissenschaftliche Nutzung aufzubereiten und durch Bereitstellung eines Surrogats das Original im Bestand zu schützen. Im Kontext der Institutionen kulturellen Gedächtnisses spricht man hierbei auch von Retro-D., die als Wahrnehmung des Auftrags zur Informationsversorgung, zum Bestandserhalt und zur Wissensvermittlung verstanden wird. In Deutschland besitzt sie im Handlungsfeld „Bildung, Forschung, Wissenschaft, Kultur und Medien“ als Bestandteil der Digitalen Agenda der Bundesregierung hohe gesellschaftliche Bedeutung.
Die Spannbreite der Retro-D. ist groß und reicht von der Massen-D. ganzer Bestände bis hin zur Einzel-D. von ausgewählten Objekten mit besonderer kultureller Bedeutung, die mit spezialisierter Technik und besonderer Sorgfalt digitalisiert werden. Digitalisate zu Kulturgut werden dabei teilweise in überregionale und übergreifende Datenbanken eingespeist, von denen u. a. die Deutsche Digitale Bibliothek (DDB) sowie die virtuelle Bibliothek Europeana zu nennen sind.
Mit der D. bewegen sich die Institutionen kulturellen Gedächtnisses in einem Spannungsfeld: dem zu erwartenden Nutzen und den wachsenden Anforderungen der modernen Informationsgesellschaft (Wissensgesellschaft) stehen hohe Kosten der D. und teils noch ungeklärte technische sowie organisatorische Fragen ihrer Nachhaltigkeit gegenüber.
Die steigende Verfügbarkeit von Digitalisaten des kulturellen Gedächtnisses bewirkt auch substantielle Veränderungen im Bereich der Geistes- und Kulturwissenschaften (Geisteswissenschaften, Kulturwissenschaft), die zusammen mit dem Aufbau digitaler Forschungsinfrastrukturen (E-Science) sowie der verstärkten Nutzung computergestützter, der Informatik entnommener oder entlehnter Verfahren bis hin zur sogenannten Künstlichen Intelligenz zum Erkenntnisgewinn in diesen Disziplinen unter der Bezeichnung Digital Humanities zusammengefasst werden. Einfluss hat die D. auch auf die Publikationskultur der Wissenschaften (Wissenschaft), für die zunehmend Formen freier Verfügbarkeit über das Internet gefordert und umgesetzt werden (Open Access).
5. Langzeitsicherung und rechtliche Fragen
Neben dem potentiell hohen Nutzen, der sich v. a. aus der schnellen Verfügbarkeit digitaler Daten und der Möglichkeiten ihrer computergestützten oder automatischen Verarbeitung herleitet, wirft die D. eine Reihe von Fragen und Problemfeldern auf. So betrifft die Frage der Nachhaltigkeit der D. die langfristige Sicherstellung der Lesbarkeit der Speichermedien, die Decodierung der kleinsten Informationseinheiten (Bitstreams) zu Zeichen und logischen Datenstrukturen, ihre Interpretation zu denselben semantischen Inhalten wie zum Zeitpunkt ihrer Erzeugung sowie die Schnittstelle zum menschlichen Nutzer (Transhumanismus) einschließlich der Auffindbarkeit verteilter digitaler Information in großen Beständen (Retrieval). Derzeit unterliegen diese Bereiche schnellen Zyklen technologischen Wandels, was insb. im Kontext von Kulturgut zur als Paradox formulierten Kritik führt, dieses kulturelle Langzeitgedächtnis auf Grundlage von im Vergleich zu herkömmlichen Medien wie dem Buch oder der Akte kurzlebigen Technologien aufzubauen.
Dieser Kritik wird die Konzeption der elektronischen Langzeitarchivierung entgegengesetzt, die sich inzwischen sehr ausdifferenziert entwickelt hat, aber langfristig zu planende technische wie organisatorische Maßnahmen erfordert und somit regelmäßige Folgekosten verursacht. Diese stellen gerade kleine und mittelgroße Organisationen vor Herausforderungen, zumal Fördermittel häufig nur für die D. an sich zur Verfügung stehen, nicht aber für deren nachhaltigen Bestand. Der weitere Auf- und Ausbau digitaler Infastrukturen, die sich an zentralen Stellen um die Sicherstellung der Belange eines digitalen Langzeitgedächtnisses kümmern, erscheint daher unumgänglich.
Weitere Problemfelder im Kontext der maschinellen Langzeitsicherung umfassen die Sicherstellung der Integrität digitaler Daten, d. h. ihrer Korrektheit und Unveränderbarkeit im Laufe ihres Lebenszyklus, sowie ihrer Authentizität, d. h. der Garantie der Echheit ihres Ursprungs. Dies entspricht klassischen archivischen Aufgaben (Archive), die aber durch die Möglichkeiten der verhältnismäßig einfachen Manipulierbarkeit digitaler Daten um eine technische Dimension erweitert werden. Insgesamt kommen im Rahmen der zunehmenden D. Fragen des Datenschutzes und der Datensicherheit eine höhere Bedeutung zu als bei herkömmlichen Medien.
Ein zentrales juristisches Handlungsfeld stellen das Urheber- und das Verwertungsrecht dar (Urheberrecht). Hier entstehen v. a. durch Massen-D. immer wieder rechtliche Grauzonen. Auf Grund der Immaterialität digitaler Daten bzw. der damit verbundenen Loslösung intellektueller Inhalte von einem Trägermedium wie dem Buch, auf das sich die traditonelle Gesetzgebung gründet, kommt es zu Streitfällen. Auf den Druck der zunehmenden Durchdringung der D. in immer weitere gesellschaftliche Bereiche und die Anforderungen der Informationsgesellschaft (Wissensgesellschaft) reagiert die Gesetzgebung zögerlich und bemüht sich um zeitgemäße, Sicherheit gebende Rechtsgrundlagen für den Umgang mit digitalen Daten.
Literatur
M. Rehbein: Digitalisierung, in: F. Jannidis/H. Kohle/M. Rehbein (Hg.): Digital Humanities, 2017, 179–198 • M. Rehbein: Was sind Digital Humanities?, in: Akademie Aktuell 56/1 (2016), 13–17 • Deutsche Forschungsgemeinschaft: DFG-Praxisregeln. „Digitalisierung“ (2013) • H. Neuroth u. a.: nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung. Version 2.3, 2010 • M. Hammond/C. Davies: Understanding the costs of digitisation: detail report (2009) • M. Terras: Digital images for the information professional, 2008 • M. Osten: Digitalisierung und kulturelles Gedächtnis, in: APuZ 5–6 (2006), 3–8 • M. Thaller: Alte Archive – Neue Technologien: Einleitende Bemerkungen, in: T. Aigner/K. Winter (Hg.): Alte Archive – Neue Technologien, 2006, 9–27 • National Information Standards Organization: Understanding metadata, 2004.
Empfohlene Zitierweise
M. Rehbein: Digitalisierung, Version 08.06.2022, 09:10 Uhr, in: Staatslexikon8 online, URL: https://www.staatslexikon-online.de/Lexikon/Digitalisierung (abgerufen: 07.12.2024)