Nachweis von Digitalisaten und Einbindung von Daten
Digitale Sammlungen
Die Begriffe "Digitalisierungsprojekt" und "digitale Sammlung" werden in zvdd gleichbedeutend verwendet. Digitalisierungsprojekte führen in der Regel zur Bildung von digitalen Sammlungen. Dabei können mehrere Projekte zu einer Sammlung führen, wie auch in einem Projekt mehrere Sammlungen entstehen können. Da die sachliche oder Materialhomogenität der Digitalisate ein wichtiger Hebel im Konzept von zvdd ist, wird hier durchgehend das Konzept der "digitalen Sammlung" verfolgt. Manchmal führen Digitalisierungsprojekte zur tiefen Erschließung nur eines umfangreichen Werkes (z.B. in der Lexikondigitalisierung oder der Zeitungsdigitalisierung); um hier Missverständnissen vorzubeugen und eine "schiefe Verwendung" des umgangssprachlichen Sammlungsbegriffes zu vermeiden wird in diesen Fällen gleichbedeutend von "Projekten" gesprochen.
Digitalisate, die nicht aus einem inhaltlich bestimmten oder an einem Bestand orientierten Digitalisierungsprojekt entstanden sind, werden in künstlich gebildeten Sammlungen zusammengefasst ("Varia", "Digitization on Demand", "Sicherungsverfilmung", "Digitalisate der Institution N.N." etc.). Hier ergeben sich u.U. keine vererbbaren Erschließungsinformationen, das Konzept der Sammlung erfüllt aber einen weiteren Zweck, der ihm auch in allen anderen Fällen zukommt: Die Gliederung nach Sammlungen erlaubt ein systematisches Vorgehen bei der Einarbeitung der verschiedenen vorhandenen Digitalisate. Diese können institutionsweise gesammelt werden und weisen dann in der Regel auch das gleiche Ausgangs-Format und gleiche Eigenheiten hinsichtlich der Formatverwendung auf. Dadurch lassen sich jeweils sammlungsspezifische Übersetzungsregeln bei der Einbindung in den zvdd-Datenbestand formulieren. Dieser Vorteil einer sammlungsorientierten Datenübernahme gilt auch für künstlich gebildete Sammlungen!
Einen einzigen "Restfall" bilden dann nur noch die verstreuten Einzeldigitalisate - diese müssen tatsächlich manuell zusammengetragen werden und können dann eine Sammlung verstreuter Einzeldigitalisate bilden.
Digitalisierte Ausgaben
Was sind "Ausgaben" (= Werke, "Titel")?
Digitale Sammlungen nach dem Sammelauftrag von zvdd enthalten bibliographische Einheiten: Monographien, Serien, Periodika, Zeitungen, Kleinschrifttum etc. Deren Ausgaben wurden auch bisher schon in elektronischen Katalogen erschlossen und nachgewiesen. Im zvdd werden neben den selbständig erschienenen auch die unselbständig erschienenen Werke nachgewiesen, also Werke, die in übergeordneten bibliographischen Einheiten enthalten sind - wie dies z.B. bei Aufsätzen in wissenschaftlichen Zeitschriften der Fall ist.
Die Unterscheidung zwischen "Werken" und "Sammlungen" ist einigermaßen problemlos, weil man hier der bibliothekarischen Tradition folgen kann. Inzwischen werden zwar manchmal auch ganze "digitale Sammlungen" in traditionellen Nachweisinstrumenten (Katalogen, OPACS) als "eine Ausgabe" nachgewiesen. Zvdd weist solche Katalogisate eher der Sammlungsebene zu und übernimmt entsprechende Datensätze auf der Ausgabeebene nur, wenn es sonst keine eigenständigen Nachweise zu den digitalisierten Titeln gibt.
Zur Katalogisierung von Digitalisaten
Digitalisate müssen katalogisiert werden!
Bei Digitalisaten handelt es sich um Sekundärausgaben, also um Publikationen, die zwar auf gedruckten Vorlagen beruhen, aber doch eigene Veröffentlichungen sind.
Entstehen Digitalisate außerhalb einer Bibliothek (z.B. in Forschungseinrichtungen oder durch private Initiativen), dann ist anzustreben, dass eine "betreuende Bibliothek" (z.B. die Universitätsbibliothek eines Universitätsinstituts) für den bibliographischen Nachweis sorgt. Ist dies nicht möglich, dann sollten wenigstens im Rahmen des Digitalisierungsprojektes selbst gleichmäßige und qualitätvolle Metadaten gesammelt und verfügbar gemacht werden.
Mindestangaben:
Bei der Katalogisierung müssen gewisse Mindestangaben gemacht werden, die eine sinnvolle Beschreibung es Werkes geben und eine eindeutige Identifizierung der Vorlage erlauben. Zusätzlich sollten einige Angaben zu der Sekundärform (dem Digitalisat) vorhanden sein. Zu den "Pflichtfeldern" müssen wenigstens gehören:
- Verfasser / Urheber
- Titel
- Erscheinungsort, Herausgeber, Erscheinungsjahr
- Bei unselbständigen Werken: Quelle des Werks (übergeordnetes selbständiges Werk)
- URN / URL zur digitalen Publikation
Neben diesen eigentlich selbstverständlichen Angaben sollen nach Möglichkeit auch folgende "Soll-Felder" vorhanden sei
- Urheber der Digitalisierung, Jahr der Digitalisierung, Vorlage der Digitalisierung, technische Parameter
- Digitalisierungszusammenhang ("Digitale Sammlung", Digitalisierungsprojekt; z.B. als "Gesamttitel der Sekundärausgabe")
- Dokumenttyp
- Lokale Signatur des digitalisierten Exemplars
- Notation der Dewey-Dezimal-Klassifikation
Abrufkennzeichen
Zvdd empfiehlt die Angabe eines Gesamttitels oder Reihentitels für digitalisierte Objekte. Dieser entspricht der üblicherweise gemeinsamen Publikation und Darstellung der Digitalisate im WWW und bildet den Sammlungs- oder Projektzusammenhang ab. Zusätzlich empfiehlt zvdd die Einfügung eines speziellen Abrufzeichens für Retrodigitalisate in den Katalogaufnahmen. In der Bestimmung von Materialarten wird derzeit in der Regel nur angegeben, dass es sich bei einem Objekt z.B. um eine "elektronische Ressource im Fernzugriff" (i.e. Internetpublikation) handelt. Dadurch ist keine Unterscheidung zwischen born-digital-Publikationen und Veröffentlichungen auf der Basis von Retrodigitalisierung möglich. In Anlehnung an die Praxis bei der Zeitschriftendatenbank (ZDB) empfiehlt zvdd deshalb die zusätzliche Vergabe eines Abrufzeichens "ldd" (Layoutgetreu digitalisierter Druck).
Strukturdaten
Was sind Strukturdaten?
Strukturdaten sind Erschließungsdaten unterhalb der Werk-Titel-Ebene und oberhalb der Volltextebene. Sie beschreiben Einheiten, denen nur ein eingeschränkter bzw. kein Werkcharakter zukommt. Hierbei handelt es sich oft z.B. um Kapitel aus Monographien, um Lexikonartikel oder um Teile von Zeitschriften,. Strukturdaten entstehen in Digitalisierungsprojekten, wenn Inhaltsverzeichnisse erschlossen werden, wenn charakteristische Gliederungselemente aufgenommen werden, um einen gezielten Einsprung in umfangreichere Werke zu ermöglichen, oder wenn Volltextdaten weiter ausgezeichnet werden, um Textstrukturen zu identifizieren. Strukturdaten liegen in den lokalen Projekten in verschiedenen Formen und Formaten vor z.B. in TEI oder METS.
Strukturdaten in zvdd
Zvdd hat ein Format definiert, mit dem die Strukturdaten an zentraler Stelle zusammengeführt werden können. Dabei geht es nicht um die Nachbildung der erschlossenen Strukturen selbst und auch nicht um die Zusammenführung aller Auszeichnungselemente aus digitalen Volltexten. Es handelt sich vielmehr um ein möglichst einfaches Indexierungsformat, mit dem die Suche nach typisierten Erschließungseinheiten und die punktgenaue Weiterleitung auf diese Ressourcen möglich werden. Das zvdd-Format für Strukturdaten ist deshalb auch kein Format für die Digitalisierung, sondern für die Zusammenführung von Digitalisierungsergebnissen. Dazu werden folgende Informationen übernommen bzw. erfasst:
- Übergeordnetes Werk (in dem die Strukturdaten enthalten sind)
- Ggf. übergeordnete Einheit auf Strukturdatenebene
- Erschließungsinformation (z.B. das Lemma eines Lexikonartikels oder der Wortlaut einer Kapitelüberschrift)
- Typ der Struktureinheit gemäß einer verallgemeinernden zvdd-Typologie
- Typ der Struktureinheit gemäß der lokalen Typologie des Digitalisierungsprojektes
- Link zum Objekt (zur erschlossenen bibliografischen Einheit)
Die Strukturdatentypologie basiert auf der Analyse mehrerer Projekte, versucht aber dem Anspruch gerecht zu werden, auch Daten aus zukünftigen Projekten in geeigneter Form abbilden zu können.
Die gleichzeitige Nutzung von bibliographischen Daten und Strukturdaten für Suche und Anzeige gehört nicht zum Standardangebot von Bibliotheks- und Verbundkatalogen. Für den Umgang mit digitalen Dokumenten bieten die Strukturdaten aber erheblich Vorteile, nicht nur wegen der Möglichkeiten zur spezialisierten Suche, sondern auch für die Navigation insbesondere in längeren Digitalisaten. Der gezielte Aufruf von Lexikonartikeln, Abbildungen, Gedichtanfängen, Karten, Notenbeispielen usw. ist erheblich attraktiver als das bisweilen mühsame Durchblättern am Bildschirm.
Elektronische Volltexte
Zu den Erschließungsinformationen in der Digitalisierung gehören auch die elektronischen Volltexte. Dabei kann es sich einerseits um das Ergebnis unbearbeiteter automatischer Zeichenerkennung (so genannte "schmutzige OCR-Volltexte") und andererseits um korrigierte (automatische oder manuelle) Transkriptionen handeln, die u.U. noch weiter ausgezeichnet sind. Perspektivisch sollen auch diese Volltexte in die Suche in zvdd integriert werden. Die technische Umsetzung ist allerdings nicht Teil der ersten und zweiten Projektphase.







