|
![]() |
||||||||||||||||||||||
|
|||||||||||||||||||||||
|
Dokumentation
Hintergründe. Die Digitalisierung von Druckwerken.In den Jahren seit ca. 1996 sind in großem Umfang gedruckte Werke digitalisiert und über das Internet frei zugänglich gemacht worden. Diese Digitalisate sind zum großen Teil aus Projekten entstanden, die mit öffentlichen Mitteln (z.B. der DFG) gefördert wurden und bei denen an Bibliotheken und anderen wissenschaftlichen oder privaten Einrichtungen vor allem Spezialbestände besser erschlossen und leichter zugänglich gemacht werden sollten. Die Vielzahl vereinzelter Angebote, die dabei entstanden sind, stellen zum großen Teil wertvolle Ressourcen dar, die leider nicht in dem Maße bekannt sind und benutzt werden, wie es ihrer Qualität entsprechen würde. Hinzu kommt, dass etliche Digitalisierungsprojekte mit dem Auslaufen der Förderung nicht mehr aktiv gepflegt und in die öffentliche Wahrnehmung eingebracht werden können. Es besteht deshalb der dringende Bedarf nach einem zentralen Verzeichnis, das nicht nur die zahlreichen Digitalisierungsprojekte besser sichtbar macht, sondern auch die digitalisierten Werke und weitere Erschließungsinformationen an einer Stelle nachweist. Diese sollen unter einer Oberfläche durchsuchbar gemacht werden, um Benutzer dann zu den eigentlichen Digitalisaten weiterzuleiten. Diese verbleiben im Normalfall bei den Institutionen, von denen sie digitalisiert worden sind und angeboten werden. Mit dem Beginn der "Flächen-" oder "Massendigitalisierung" wächst außerdem die Gefahr der "Doppeldigitalisierung" von Ausgaben. Die mehrfache Digitalisierung wäre eine Ressourcenvergeudung und kann nur vermieden werden, wenn an zentraler Stelle leicht ermittelt werden kann, ob ein Werk bereits andernorts digitalisiert worden ist. Bei der Integration zahlreicher verschiedener, teilweise experimenteller Digitalisierungsprojekte ergibt sich die Gelegenheit, die gewonnenen Informationen zu homogenisieren, qualitative Mindeststandards zu etablieren und diese zu allgemeinen Empfehlungen auch für die weitere Digitalisierung auszubauen. Das Zentrale Verzeichnis digitalisierter Drucke hat deshalb nicht nur eine sammelnde und sichtende Funktion, sondern verfolgt auch die Entwicklung geeigneter inhaltlicher und technischer Formate und kann dadurch ggf. standardisierende Wirkungen für die laufende und zukünftige Digitalisierung entfalten. ProjektpartnerDas Zentrale Verzeichnis Digitalisierter Drucke ist ein Kooperationsprojekt zwischen der "Arbeitsgemeinschaft Sammlung Deutscher Drucke" (AG SDD), der "Verbundzentrale des Gemeinsamen Bibliotheksverbundes" (VZG) und dem "Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen" (hbz). Während die AG SDD als Zusammenschluss von sechs großen deutschen Bibliotheken für die inhaltlichen Belange zuständig ist, kümmern sich die Verbundzentralen vor allem um die technische Realisierung des Projekts. Was weist zvdd nach? Was ist verfügbar? Was soll noch verfügbar gemacht werden?ProjektphasenGrundsätzlich weist zvdd in einer ersten Projektphase (2005-2007) digitalisierte Druckwerke nach, die in Deutschland digitalisiert worden sind und über das Internet allgemein und frei zugänglich sind. Dabei handelt es sich zu einem großen Teil um wissenschaftliche Erschließungsprojekte aus den Jahren 1996-2006, die mit Mitteln der DFG gefördert worden sind. Zugleich werden aber auch andere digitale Sammlungen berücksichtigt, soweit dies mit den zur Verfügung stehenden Mitteln möglich ist. In der ersten Projektphase werden Digitalisate auf der Ebene der Sammlungen bzw. Digitalisierungsprojekte und auf der Ebene der Werke (bzw. Ausgaben) nachgewiesen. In der zweiten Phase sollen dann auch Strukturdaten, später auch Volltextdaten durchsuchbar gemacht werden. In einer zweiten Projektphase (2007-2008) sollen auch Projekte aus Österreich und der Schweiz berücksichtigt werden. Außerdem sollen dann auch verstärkt digitale Sammlungen nachgewiesen werden, die nicht aus einem unmittelbar wissenschaftlichen Kontext oder mit Hilfe von DFG-Fördermitteln entstanden sind. In der weiteren Perspektive ist zu entscheiden, ob und in welchem Maße nicht frei zugängliche Digitalisate in zvdd nachgewiesen werden sollten. In einem ersten Schritt könnten zugangsbeschränkte Ressourcen gemeinsam mit den Inhalten der Nationallizenzen angeboten und durchsuchbar gemacht werden. In einem weiteren Schritt könnte dann ein gemeinsame Oberfläche geschaffen werden, in der der Benutzer selbst auswählen kann, ob in beiden Bereichen (frei / unfrei) oder nur einem Teilbereich gesucht werden soll. Schließlich ist ebenfalls zu überlegen, ob und in welcher Form digitale Sammlungen aus dem weiteren internationalen Bereich integriert werden sollten. MaterialhomogenitätZvdd weist grundsätzlich alle Werke nach, die jemals gedruckt worden sind und nun vollständig digitalisiert und bibliografisch erschlossen vorliegen und frei zugänglich sind. Zvdd weist dementsprechend z.B. keine Handschriften, keine Archivalien, keine musealen Objekte, keine Fotografien oder andere nicht-gedruckte Objekte des kulturellen Erbes nach. Zvdd weist auch keine Texte nach, die "digital born" sind und ausschließlich in elektronischer Form existieren. Für alle diese Objekte gibt es andere Portale oder wird es in Zukunft andere Portale geben. Aus dem gleichen Grund verzichtet zvdd zunächst auch auf den Nachweis von "Inkunabeln", also Druckwerken aus der Zeit vor 1500. Für diese besteht bereits die verteilte digitale Inkunabelbibliothek (vdIb). Eine Beschränkung auf eine klar definierte Materialart ermöglicht erst die homogenisierende Zusammenführung von Ressourcen, die unter zahlreichen verschiedenen Konzepten erstellt und mit unterschiedlichsten Standards beschrieben worden sind. Materialhomogenität ist darüber hinaus eine wichtige Voraussetzung für eine klare Perspektive der Benutzer hinsichtlich der Inhalte des Portals und seiner Nutzungsmöglichkeiten. Schließlich unterstützt die restriktive Definition des Gegenstandes eine weitere modulare Architektur der Portalbildung im Bereich des Kulturerbes. Hier können die Inhalte von zvdd dann einerseits leichter in größere Zusammenhänge (BAM-Portale, International übergreifende Portale) eingebunden werden und andererseits für spezialisierte Portale (wie die Virtuellen Fachbibliotheken) bereits erschlossene Teilbestände zur Verfügung gestellt werden. Die Homogenität des Materials bezieht sich auf die nachgewiesenen Sammlungen bzw. Projekte. Sollten in einem Projekt zur Digitalisierung z.B. alter Drucke vereinzelt Inkunabeln enthalten sein, so werden diese in der Regel nicht aussortiert. Das gleiche gilt auch für andere eingestreute nicht-zvdd-Materialien. Stand der DateneinbindungDie Menge der aktuell bereits in zvdd nachgewiesenen Werke wird direkt bei den Suchoberflächen angegeben. Ebenso ihre Verteilung auf einzelne Dewey-Gruppen oder Dokumenttypen. Damit soll das "black-box-Problem" digitaler Bibliotheken gemildert werden. Einen ersten Überblick über die Inhalte von zvdd gibt darüber hinaus die Liste der Sammlungen. Es handelt sich dabei um eine Aufstellung der "unter derzeitigem Fokus perspektivisch einzubindenden Sammlungen". In der Regel ist die Aufnahme einer Sammlung auf die Liste bereits mit der Anlage eines Datensatzes zur Sammlungsbeschreibung verbunden. Zusätzlich gibt die Aufstellung Auskunft über den Status der Einbindung in das Portal: Vor jeder Sammlung steht ein viergliedriges Farbfeld, die Felder stehen der Reihenfolge nach für (1.) Sammlungsbeschreibung, (2.) Titeldaten, (3.) Strukturdaten, (4.) Volltextdaten. Die Farben bedeuten: Grün für "bereits vorhanden bzw. eingebunden", rot für "noch nicht eingebunden" und grau für "nicht anwendbar" (wenn eine Sammlung z.B. nicht über Strukturdaten verfügt, die man einbinden könnte). HerkunftsnachweisZvdd führt Metadaten in einer zentralen Datenbank zusammen. Sie dienen aber nur der Hinführung auf digitale Publikationen in den verschiedenen Einrichtungen. Die Metadaten selbst enthalten immer die Information, von welcher Institution sie kommen. Auch in der Anzeige von Suchtreffern soll die Institution, die ein Digitalisat erstellt hat und anbietet unmittelbar sichtbar sein. Die Oberfläche des hbz praktiziert hier ein "branding" der angezeigten Datensätzen mit Logos der betreffenden Institutionen. In der Darstellung bei der VZG sollen die betreffenden Institutionen durch eine namentliche Nennung kenntlich gemacht werden. Informationsarchitektur in zvddGrundaufgabeGrundaufgabe des zvdd ist es, möglichst alle Digitalisierungsprojekte nachzuweisen und alle dort entstandenen Erschließungsinformationen zusammenzuführen und gemeinsam benutzbar zu machen. Auf die eigentlichen digitalen Angebote, die in zvdd selbst nicht integriert sind, wird dann weitergeleitet. Diese Aufgabe wird dadurch gelöst, dass eine zentrale Datenbank aufgebaut wird, die Metadaten zu digitalisierten Druckwerken auf verschiedenen konzeptionellen Ebenen enthält. Vier InformationsschichtenDie in zvdd versammelten Erschließungsdaten lassen sich konzeptionell als Informationen zu vier Schichten beschreiben:
Vererbung von Informationen auf nachfolgende SchichtenDie verschiedenen Informationsschichten bilden eine Hierarchie, bei der übergeordnete Schichten die Einheiten darunter liegender Schichten enthalten. Die Erschließungsinformationen der allgemeineren Schicht lassen sich deshalb bei hinreichender Material- oder Sachhomogenität nach unten "vererben". Oft sind den einzelnen Einheiten keine expliziten Erschließungsinformationen beigefügt, weil sie aus Sicht eines Digitalisierungsprojekts trivial sind. In einem Portalkonzept gilt aber die Regel: "was lokal trivial (redundant) ist, kann global eine wichtige Erschließungsinformation sein!". Widmet sich ein Digitalisierungsprojekt z.B. juristischen Dissertationen des 19. Jahrhunderts, so wäre es aus Projektsicht überflüssig, alle einzelnen Einheiten mit der Information zu versehen, dass es sich (a) um Dissertationen aus (b) dem Bereich des Rechts handelt. Bei der Zusammenführung mit anderen Materialien in einem übergreifenden Portal ist es aber wichtig, diese Informationen nachzutragen. Die Erschließung auf der Sammlungsebene kann deshalb zu einer besseren Erschließung auf der Ausgabenebene führen. Gleiches gilt dann auch für die Ebene der Strukturdaten und der Volltextdaten. Technische Architektur in zvddZentrale Datenbank. Die Suche nach digitalisierten Druckwerken wird in zvdd nicht über eine verteilte Abfrage der einzelnen Digitalisierungsprojekten ermöglicht, sondern durch einen zentralen Datenpool. Dies ist notwendig, weil viele Digitalisierungsprojekte nicht dauerhaft betreut werden können und die Zugänglichkeit ihrer Daten damit für die Zukunft nicht in jedem Fall gesichert ist. Außerdem erlaubt nur die Zusammenführung in einer zentralen Ressource eine Homogenisierung und qualitative Verbesserung der Daten, die Grundlage für die ernsthafte wissenschaftliche Nutzung der Digitalisate ist. Mapping in ein zentrales Datenformat. Datensätze
zu den digitalen Sammlungen bzw. Digitalisierungsprojekten werden
von zvdd zentral angelegt. Datensätze zu digitalisierten
Ausgaben können aber in den unterschiedlichsten Formaten vorliegen.
Diese müssen in ein zentrales Format konvertiert werden. Übersetzungen
finden dabei teilweise bei den Datenlieferanten statt, wenn selbstständig
oder in Zusammenarbeit mit zvdd Exportformate generiert werden,
sie finden teilweise bei der AG SDD statt, die bibliographische Daten sammelt
und aufbereitet an die Verbundzentralen weitergibt und sie finden
vor allem bei
den Verbundzentralen hbz und VZG statt, die die Daten schließlich
in ihre Datenbanken einspeisen und anschließend wieder über
Schnittstellen nach außen zur Verfügung stellen. Verteilte Datenbanken. Die Einspielung der Titeldaten erfolgt zunächst in eine von zwei Datenbanken bei der VZG bzw. dem hbz. Für die Konzeption und die Gesamtarchitektur des Projektes spielen die technischen Details keine Rolle, sie seien hier nur der Vollständigkeit halber erwähnt: Bei der VZG-Datenbank handelt es sich um ein PICA-System, das Datensätze in einem lokalen PICA-Format verwaltet, bei der hbz-Datenbank um eine CDS Invenio-Installation, die auf MARC-Datensätze zurückgreift. Synchroner Datenpool. Beide Datenbanken enthalten die gleichen Inhalte und bilden dadurch einen einzigen gemeinsamen Datenpool ab. Die Synchronizität der Inhalte wird sichergestellt, indem die Datensätze über die OAI-Schnittstelle des jeweils anderen technischen Partners abgerufen und ggf. aktualisiert werden. Mehrfache Oberflächen. Die beiden Verbundzentralen bieten jeweils eine eigene Benutzeroberfläche an. Dadurch soll das gewohnte "look & feel" der Oberflächen der beiden Verbünde bewahrt werden und den jeweiligen Nutzern die Handhabung der Oberflächen erleichtert werden. Offene Schnittstellen. Die Daten aus dem zvdd-Datenpool stehen über OAI-Schnittstellen und andere Schnittstellen allgemein zur Verfügung und können dadurch leicht in anderen Zusammenhängen nachgenutzt werden. Nachweis von Digitalisaten. Einbindung von DatenDigitale SammlungenKonzept und BegriffDie Begriffe "Digitalisierungsprojekt" und "digitale Sammlung" werden in zvdd gleichbedeutend verwendet. Digitalisierungsprojekte führen in der Regel zur Bildung von digitalen Sammlungen. Dabei können mehrere Projekte zu einer Sammlung führen, wie auch in einem Projekt mehrere Sammlungen entstehen können. Da die sachliche oder Materialhomogenität der Digitalisate ein wichtiger Hebel im Konzept von zvdd ist, wird hier durchgehend das Konzept der "digitalen Sammlung" verfolgt. Manchmal führen Digitalisierungsprojekte zur tiefen Erschließung nur eines umfangreichen Werkes (z.B. in der Lexikondigitalisierung oder der Zeitungsdigitalisierung); um hier Missverständnissen vorzubeugen und eine "schiefe Verwendung" des alltagssprachlichen Sammlungsbegriffes zu vermeiden wird in diesen Fällen gleichbedeutend von "Projekten" gesprochen. Digitalisate, die nicht aus einem inhaltlich bestimmten oder an einem Bestand orientierten Digitalisierungsprojekt entstanden sind, werden in künstlich gebildeten Sammlungen zusammengefasst ("Varia", "Digitization on Demand", "Sicherungsverfilmung", "Digitalisate der Institution N.N." etc.). Hier ergeben sich u.U. keine vererbbaren Erschließungsinformationen, das Konzept der Sammlung erfüllt aber einen weiteren Zweck, der ihm auch in allen anderen Fällen zukommt: Die Gliederung nach Sammlungen erlaubt ein systematisches Vorgehen bei der Einarbeitung der verschiedenen vorhandenen Digitalisate. Diese können institutionsweise gesammelt werden und weisen dann in der Regel auch das gleiche Ausgangs-Format und gleiche Eigenheiten hinsichtlich der Formatverwendung auf. Dadurch lassen sich jeweils sammlungsspezifische Übersetzungsregeln bei der Einbindung in den zvdd-Datenbestand formulieren. Dieser Vorteil einer sammlungsorientierten Datenübernahme gilt auch für künstlich gebildete Sammlungen! Einen einzigen "Restfall" bilden dann nur noch die verstreuten Einzeldigitalisate - diese müssen tatsächlich manuell zusammengetragen werden und können dann eine Sammlung "Verstreute Einzeldigitalisate" bilden. Datensätze für Digitale Sammlungen"Digitalisierungsprojekte" bzw. "digitale Sammlungen" werden durch gesonderte Datensätze beschrieben, die sich möglichst nah an den Standard "Dublin Core Collection Description" (siehe die entsprechende "Working Group") anlehnen. Dessen Anwendung wird im "Dublin Core Collection Description Application Profile" (DC CD AP) beschrieben. Während der Entwicklungsphase von zvdd befand sich das DC CD AP noch im Entwurfsstadium und wurde kontinuierlich überarbeitet und verändert. Auch wenn inhaltlich eine sehr ähnliche Ausrichtung zwischen DC CD und zvdd-Sammlungsbeschreibungen besteht, sind doch einige Unterschiede zu beachten, die dazu führen, dass zvdd-Sammlungsbeschreibungen nicht ganz nach DC CD angelegt werden:
Es besteht aus den genannten Gründen ein zvdd-internes Modell und Anwendungsprofil, das das DC CD AP modifiziert und erweitert. Dieses "zvdd DC CD AP" steht derzeit in einer vorläufigen und unterformalisierten Fassung zur Verfügung [Fehlt derzeit noch: Link]. Während das inhaltliche Modell sich in der bisherigen Projektarbeit stabilisiert hat und allenfalls noch minimal verändert werden wird, ist die endgültige Formalisierung gemäß den Regeln für Dublin Core Application Profiles erst dann sinnvoll vorzunehmen, wenn das DC CD AP den Status einer "recommendation" erreicht hat. Zu beachten ist hier auch, dass die interne Verwendung der Sammlungsbeschreibungen von der formalen Nähe zu Dublin Core unabhängig ist. Diese wird erst dann wichtig, wenn zvdd-Sammlungsbeschreibungen exportiert und in weitere Zusammenhänge eingebunden werden sollen. Anlage und Pflege von Sammlungsbeschreibungen nach zvdd DC CD APIn der ersten Projektphase wurden und werden die Sammlungsbeschreibungen von der AG SDD angelegt und in Kommunikation mit den digitalisierenden Institutionen vervollständigt und aktualisiert. Neumeldungen und Änderungen sollten deshalb an die entsprechenden Projektmitarbeiter erfolgen. Mittelfristig soll ein Umstieg auf eine webbasierte Datenbank mit interaktiver Eingabemaske erfolgen, so dass die Institutionen Sammlungsbeschreibungen bzw. Projektbeschreibungen selbst anlegen und pflegen können. Derzeit wird geprüft, ob eine Nachnutzung des "Vascoda CLD Tools" möglich ist. Nacherschließung von SammlungenDurch die AG SDD erfolgt eine Nacherschließung auf Sammlungsebene, die Sammlungen besser auffindbar und benutzbar machen sollen und teilweise auch die Erschließung auf der Ebene der Titeldaten verbessern kann (siehe Informationsarchitektur, Vererbung). Die Nacherschließung umfasst:
Eine Erschließung bis zur dritten Dewey-Stelle mag auf den ersten Blick allzu grob erscheinen. Hier ist aber zu bedenken, dass größere Sammlungen verschiedenartiger Objekte selten genauer bestimmt werden können und dass bereits eine solche Grobeinteilung (die immerhin 1000 Klassen umfasst) für eine erste Orientierung auf der Sammlungsebene und eine filternde Suche auf der Werkebene genutzt werden kann. Die Erschließung nach dcterms:spatial bzw. dc:temporal bezieht sicht auf die Inhalte der in einer Sammlung digitalisierten Werke. Beispiele: eine Sammlung mit Werken zu Sibirien (dcterms:spatial = Sibirien, Asien); eine Sammlung mit Texten zur mittelalterlichen Geschichte (dc:temporal = 500-1500). Grundgliederung nach hauptsächlichen DokumenttypenSammlungen werden in zvdd auch nach den "vorherrschenden Dokumenttypen" beschrieben. Es können einer Sammlung mehrere Begriffe zugewiesen werden. Die Information ist deshalb folgendermaßen zu lesen: "Sammlung X enthält zu einem substanziellen Teil Dokumente vom Typ Y". Dies ist bei der Benutzung des Portals zu beachten! Wird nach oder in Sammlungen mit einem bestimmten Dokumenttyp gesucht, dann kann nicht davon ausgegangen werden, dass tatsächlich nur dieser Dokumenttyp enthalten sein wird. Die auf Einfachheit und Übersichtlichkeit ausgerichtete Grundsystematik der Dokumenttypen umfasst derzeit:
[Fehlt derzeit noch: Die Elemente der Sammlungsbeschreibung im Einzelnen]Digitalisierte AusgabenWas sind "Ausgaben" (= Werke, "Titel")?Digitale Sammlungen nach dem Sammelauftrag von zvdd enthalten bibliografische Einheiten: Monographien, Serien, Periodika, Zeitungen, Kleinschrifttum etc. Deren Ausgaben wurden auch bisher schon in elektronischen Katalogen erschlossen und nachgewiesen. Zvdd übernimmt in der Regel bestehende oder (für die digitale Fassung modifizierte) Titel-Katalogisate. Zvdd weist aber "Werke" grundsätzlich nach. Diese umfassen neben den "selbständig erschienenen" auch die "unselbständig erschienenen", also Werke, die in übergeordneten bibliografischen Einheiten enthalten sind - wie dies z.B. bei Aufsätzen in wissenschaftlichen Zeitschriften der Fall ist. Die Unterscheidung zwischen "Werken" und "Sammlungen" ist einigermaßen problemlos, weil man hier der bibliothekarischen Tradition folgen kann. Inzwischen werden zwar manchmal auch ganze "digitale Sammlungen" in traditionellen Nachweisinstrumenten (Katalogen, OPACS) als "eine Ausgabe" nachgewiesen. Zvdd weist solche Katalogisate eher der Sammlungsebene zu und übernimmt entsprechende Datensätze auf der Ausgabeebene nur, wenn es sonst keine eigenständigen Nachweise zu den digitalisierten Titeln gibt. Im Gegensatz zu den selbstständigen Werken ist die Definition "unselbständiger Werke" durchaus problematisch. Die digitalisierenden Institutionen operationalisieren hier ganz unterschiedliche Vorstellungen. Die Frage ist, ob grundsätzlich jeder unabhängig für sich stehende Teil einer selbstständigen Publikation ein unselbstständiges Werk ist, oder ob nur solche Teile als unselbstständige Werke anzusehen sind, die (1.) eine gewisse intellektuelle Schaffenshöhe erreichen, (2.) einen bestimmten Urheber haben und für die (3.) ein zitierbarer Titel angegeben werden kann. In der "Katalogisierung nach den RAK-WB", hg. von Klaus Haller und Hans Probst, München 62003, S. 14 heißt es dazu nur: "Als Einzelwerk wird eine in sich abgeschlossene geistige Schöpfung bezeichnet, die [...] selbständig oder als Bestandteil einer Sammlung bzw. eines Sammelwerkes unselbständig erschienen ist. Auch einzelne Artikel, Aufsätze, Briefe und dergleichen gelten als Einzelwerke." Im Bereich der unselbstständigen Werke ist zvdd zu einer vereinheitlichenden Verarbeitung bestehender Erschließungsinformationen gezwungen. Hier wird ein eher enger Begriff unselbstständiger Werke verfolgt. Inhaltsverzeichnisse, Titelblätter, Register, Kurznachrichten und ähnliche bibliografische Einheiten sollen nicht als unselbstständige Werke nachgewiesen werden, sondern können allenfalls auf der Ebene der Strukturdaten aufgenommen werden. Zur Katalogisierung von DigitalisatenDigitalisate sollten katalogisiert werden! Bei Digitalisaten handelt es sich um "Sekundärformen"; Publikationen, die zwar auf Vorlagen beruhen, aber doch eigene Veröffentlichungen sind. So wie bisher auch Nachdrucke, Faksimiles oder Mikrofiche-Ausgaben katalogisiert wurden, so sollten auch digitale Ausgaben katalogisiert werden. So wie digitale Ausgaben von Verlagen katalogisiert werden, so sollten auch digitale Ausgaben von Bibliotheken oder anderen Einrichtungen katalogisiert werden. So wie kostenpflichtige Digitalisate katalogisiert werden, so sollten auch kostenfrei zugängliche Digitalisate katalogisiert werden. So wie born-digital Publikationen (z.B. elektronische Dissertationen) katalogisiert werden, so sollten auch retrodigitalisierte Werke katalogisiert werden. Entstehen Digitalisate außerhalb einer Bibliothek (z.B. in Forschungseinrichtungen oder durch private Initiativen), dann ist anzustreben, dass eine "betreuende Bibliothek" (z.B. die Universitätsbibliothek eines Universitätsinstituts) für den bibliografischen Nachweis sorgt. Ist dies nicht möglich, dann sollten wenigstens im Rahmen des Digitalisierungsprojektes selbst gleichmäßige und qualitätvolle Metadaten gesammelt und verfügbar gemacht werden. Mindestqualitäten! Bei der Katalogisierung sollten gewisse Mindestangaben gemacht werden, die eine sinnvolle Beschreibung es Werkes geben und eine eindeutige Identifizierung der Vorlage erlauben. Zusätzlich sollten einige Angaben zu der Sekundärform (dem Digitalisat) vorhanden sein. Zu den "Pflichtfeldern" sollten wenigstens gehören:
Neben diesen eigentlich selbstverständlichen Angaben sollten nach Möglichkeit auch folgende "Soll-Felder" vorhanden sein:
Projektintern besteht ein erweiterter Pflichtfelder-Katalog, da hier zu Portalzwecken (technische Steuerung, Homogenisierung, Qualitätssicherung) weitere Informationen vorhanden sein müssen. Innerhalb des Prozesses der Datenkonversion werden die vorhandenen Datensätze deshalb weiter angereichert; Erschließungsinformationen, die sammlungsweit gleich sind (siehe oben: Vererbung) können an dieser Stelle ebenfalls nachgetragen werden und müssen so nicht unbedingt in den von den beitragenden Institutionen abgegebenen Daten enthalten sein. Abrufkennzeichen. Zvdd empfiehlt die Angabe eines Gesamttitels oder Reihentitels für digitalisierte Objekte. Dieser entspricht der üblicherweise gemeinsamen Publikation und Darstellung der Digitalisate im WWW und bildet den Sammlungs- oder Projektzusammenhang ab. Zusätzlich empfiehlt zvdd die Einfügung eines speziellen Abrufzeichens für Retrodigitalisate in den Katalogaufnahmen. In der Bestimmung von Materialarten wird derzeit in der Regel nur angegeben, dass es sich bei einem Objekt z.B. um eine "elektronische Ressource im Fernzugriff" (i.e. Internetpublikation) handelt. Dadurch ist keine Unterscheidung zwischen born-digital-Publikationen und Veröffentlichungen auf der Basis von Retrodigitalisierung möglich. In Anlehnung an die Praxis bei der Zeitschriftendatenbank (ZDB) empfiehlt zvdd deshalb die zusätzliche Vergabe eines Abrufzeichens "ldd" (Layoutgetreu digitalisierter Druck); dieses sollte bei der Darstellung in MAB2 in Feld 078e stehen. Bibliographisches Format in zvddDer Austausch von Daten innerhalb von zvdd geschieht auf der Basis eines minimal verkürzten MAB2-Formats (MAB = Maschinelles Austauschformat für Bibliotheken). Eine summarische Aufstellung steht ebenso zur Verfügung wie einige kommentierte Beispieldatensätze in zvdd-MAB. Übermittlung von bibliographischen Daten an zvddOAI-Schnittstellen. Zvdd bevorzugt die Übernahme von Daten über das OAI-PMH-Protokoll. Idealer Weise werden hier Daten in zvdd-MABxml bereit gestellt (Beispiele). Ein Import kann aber auch aus "normalen" MAB-Daten erfolgen. Ist die Generierung dieses Formats nicht möglich, so können die Datensätze auch in anderen bibliografischen Formaten wie MARC oder lokalen PICA-Dialekten übernommen werden. OAI-PMH sieht zunächst nur Dublin Core (DC) als empfohlenes Format vor. Grundsätzlich ist auch eine Übernahme über DC möglich. Es sollte dann aber sichergestellt werden, dass möglichst alle verfügbaren Ausgangsdaten in DC ausgedrückt werden und die oben angesprochene Mindestqualität erreicht wird. Datenabzüge aus OPACs. In vielen Fällen liegen bibliographische Daten zu Digitalisaten bereits in OPACs vor, ohne dass sie über eine OAI-Schnittstelle erreichbar wären. In diesen Fällen können die Daten einfach über eine filternde Auswahl übernommen werden, wenn die Zuordnung von Ausgaben zu "digitalen Sammlungen" gegeben ist oder rekonstruiert werden kann. Zvdd empfiehlt bei der Katalogisierung die Angabe eines "Gesamttitels der Sekundärform" bzw. eines Reihentitels, der dem Digitalisierungsprojekt oder der "digitalen Sammlung" entspricht. Über ein solches Kennzeichen ist dann der Abruf und die anschließende Anreicherung der bibliographischen Daten mit weiteren Informationen leicht möglich. Wird das Konzept der "digitalen Sammlung" bzw. der digitalen Gesamttitel nicht unterstützt, so kann trotzdem versucht werden, Kriterien für die Identifikation und den Abruf von bibliographischen Daten zu finden. Solche Kriterien können z.B. URN-/URL-Teilstrings in Verbindung mit Erscheinungsjahren sein. Datenübermittlung per e-mail. Titeldaten (bibliographische Daten) können auch per e-mail an zvdd übermittelt werden. Dabei gilt die gleiche Format-Präferenz-Folge wie bei den anderen Formen der Datenübernahme: (1.) zvdd-MAB2, (2.) MAB2, (3.) andere bibliografische Formate, (4.) jede andere Form gleichmäßig strukturierter Daten (z.B. lokale Datenbankformate). Falls gewünscht, kann zvdd bei der Erstellung von lokalen Exportformaten unterstützend tätig werden. StrukturdatenWas sind Strukturdaten? Strukturdaten sind Erschließungsdaten unterhalb der Werk-Titel-Ebene und oberhalb der Volltextebene. Sie beschreiben bibliografische Einheiten, denen kein "Werkcharakter" zukommt. Hierbei handelt es sich oft z.B. um Kapitel aus Monographien, um Lexikonartikel oder um Teile von Zeitschriften, die nicht das intellektuelle Werk eines bestimmten Urhebers sind. Strukturdaten entstehen in Digitalisierungsprojekten, wenn Inhaltsverzeichnisse erschlossen werden, wenn charakteristische Gliederungselemente aufgenommen werden um einen gezielten Einsprung in umfangreichere Werke zu ermöglichen oder wenn Volltextdaten weiter ausgezeichnet werden, um Textstrukturen zu identifizieren. Strukturdaten liegen in den lokalen Projekten in verschiedenen Formen und Formaten vor und stehen dann zur Verfügung z.B. als: eBind, TEI, METS oder als lokales Exportformat (z.B. Agora-xml). Strukturdaten in zvdd. Zvdd entwickelt ein Format, mit dem die Strukturdaten an zentraler Stelle zusammengeführt werden können. Dabei geht es nicht um die Nachbildung der erschlossenen Strukturen selbst und auch nicht um die Zusammenführung aller Auszeichnungselemente aus digitalen Volltexten. Es handelt sich vielmehr um ein möglichst einfaches Indexierungsformat, mit dem die Suche nach typisierten Erschließungseinheiten und die punktgenaue Weiterleitung auf diese Ressourcen möglich werden. Das zvdd-Format für Strukturdaten ist deshalb auch kein Format für die Digitalisierung, sondern für die Zusammenführung von Digitalisierungsergebnissen. Dazu werden folgende Informationen übernommen bzw. hergestellt:
Diese reduzierten Strukturdaten sollen in einem vereinfachten Subset der TEI-Guidelines (TEI = Text Encoding Initiative) in Anlehnung an die Empfehlungen "TEI in Libraries" abgebildet werden. Elektronische VolltexteZu den Erschließungsinformationen in der Digitalisierung gehören auch die elektronischen Volltexte. Dabei kann es sich einerseits um das Ergebnis unbearbeiteter automatischer Zeichenerkennung (so genannte "schmutzige OCR-Volltexte") und andererseits um korrigierte (automatische oder manuelle) Transkriptionen handeln, die u.U. noch weiter ausgezeichnet sind. Perspektivisch sollen auch diese Volltexte in die Suche in zvdd integriert werden. Die technische Umsetzung ist allerdings nicht Teil der ersten Projektphase. Zusammenarbeit von zvdd mit anderen Einrichtungen und Portalenzvdd und "digitalisierende Einrichtungen"Die wichtigsten "Partner" von zvdd sind all jene Einrichtungen, bei denen durch die Digitalisierung elektronische Publikationen entstanden sind oder fortlaufend entstehen oder die Kataloge pflegen, in denen Digitalisate nachgewiesen werden. Zvdd ist auf die Mithilfe dieser Partner angewiesen, verfolgt aber das Ziel, möglichst keine Mehrarbeiten zu verursachen. Zvdd unterstützt diese Einrichtungen deshalb so weit wie möglich z.B. bei der Erstellung von Exportformaten auf Werk-/Titelebene und bei der Anlage von Sammlungsbeschreibungen. Verfügbarkeit der Metadaten in zvddAlle in zvdd gesammelten Metadaten stehen über offene Schnittstellen allgemein zur Verfügung. Sollte diese Verbreitung von einzelnen Institutionen nicht gewünscht werden, so wird um ausdrücklichen Widerspruch gebeten. Die Daten stehen zunächst über OAI-Schnittstellen beim hbz und bei der VZG zur Verfügung. Dabei werden eine ganze Reihe von Formaten angeboten:
Der Abruf von Daten über OAI kann global (alle Daten, ohne Angabe eines "sets") oder nach verschiedenen "sets" erfolgen, die wiederum (redundant!) verschiedenen Ordnungsprinzipien folgen:
Wichtig: ein einzelner Datensatz ist über die verschiedenen Kriterien in mehreren sets enthalten! Verschiedene Gruppe von "sets" (z.B. die Sammlungs-sets) können andererseits zusammen genommen insgesamt alle Datensätze enthalten. [Fehlt derzeit noch: Weitere Schnittstellen ...] zvdd und Virtuelle FachbibliothekenZvdd ist an einer intensiven Zusammenarbeit mit den Virtuellen Fachbibliotheken interessiert. Zvdd profitiert davon, wenn aus den ViFas fachspezifische Digitalisierungsprojekte gemeldet werden. Auf der anderen Seite stellt zvdd nach Fächern zusammengestellte OAI-sets mit den Metadaten zu digitalisierten Werken bereit, die direkt in den Katalogen der ViFas nachgenutzt werden können. Mittelfristig baut zvdd für die ViFas auch schreibende Zugänge zum zentralen Datenpool auf, so dass eine weitere Nacherschließung der digitalisierten Werke durch die virtuellen Fachbibliotheken erfolgen kann. zvdd und andere allgemeine PortaleDie in zvdd versammelten Metadaten stehen anderen Portalen zur Nachnutzung zur Verfügung. Die Übernahme kann durch die OAI-Schnittstellen oder andere Schnittstellen in den verschiedenen von zvdd bereit gestellten Datenformaten erfolgen. Als erstes Beispiel für die Nachnutzung von zvdd-Daten in anderen Zusammenhängen sei auf das Zentralverzeichnis elektronischer Publikationen verwiesen. Hosting verwaister oder von Verwaisung bedrohter SammlungenZvdd weist "Metadaten" nach und verweist von Suchtreffern aus auf die lokal angebotenen Digitalisate. Es besteht darüber hinaus
aber auch das grundsätzliche Angebot der Verbundzentralen VZG und hbz, digitale Publikationen komplett zu hosten, wenn die lokalen Projektträger
die dauerhafte Sicherung und Verfügbarkeit selbst nicht gewährleisten können wollen. Ein dauerhaftes Hosting, verbunden mit einer Neupräsentation
wird derzeit z.B. für die digitalen Sammlungen "Preußische Rechtsquellen" und "Musikdrucke des 19. Jh." erarbeitet. Weitere Informationen zu zvdd (Flyer, Vorträge, Publikationen etc.)
FAQWarum weist zvdd keine gedruckten Ausgaben vor 1500 nach?Die bibliografische Beschreibung von Inkunabeln unterscheidet sich stark von Büchern aus der voll entwickelten Druckkultur (nach 1500). Es ist deshalb sinnvoll, dass diese unterschiedlichen Objektbeschreibungen auch in unterschiedlichen Portalen recherchierbar gemacht werden. Für die Inkunabeln gibt es z.B. die verteilte digitale Inkunabelbibliothek Warum gibt es zwei Portaloberflächen?Die Sammlung und Homogenisierung von Daten einerseits und das Anbieten der Daten in einer Suchoberfläche sind zwei Aufgaben, die grundsätzlich getrennte von einander betrachtet werden können. Der zvdd-Datenpool steht allgemein zur Verfügung. Auf ihm kann im Grunde jeder Interessierte eine eine Nutzungsoberfläche aufbauen. VZG und HBZ setzen dazu jeweils verschiedene Software-Umgebungen ein, bieten ein unterschiedliches "look&feel" und leicht abweichende Funktionalitäten. Warum wird an den hohen bibliografischen Standards festgehalten? Wozu der ganze Aufwand?Warum macht man es nicht gleich wie google? - Gedruckte Werke werden traditionell
sehr genau erschlossen und bibliografisch beschrieben, um differenzierte
und zielgenaue Recherchen zu ermöglichen. Es gibt keinen Grund im Bereich
digitalisierter Werke hinter die gut erprobten Qualitätsstandards der Bibliotheken
zurückzufallen, zumal für den bei weitem überwiegenden Teil der Ausgaben hochwertige
bibliografische Datensätze bereits bestehen.
Eine Reduktion wertvoller Erschließungsinformationen auf eine blinde Volltextsuche
bringt zwar schnell zahlreiche Treffer, diese sind dann aber oft wenig
aussagekräftig.
Versuchen Sie einmal mit der google-Buchsuche herauszufinden,
wie viele und welche Werke eines bestimmten Autors eigentlich schon digitalisiert
sind! Wie wird sichergestellt, dass alle Digitalisate erfasst werden?Mit öffentlichen Mitteln geförderte und andere größere Projekte sind in der Regel gut bekannt und werden von zvdd angesprochen, um die Möglichkeiten zum Nachweis der Metadaten zu klären. Bei kleineren Projekten ist zvdd auf die aktive Meldung der digitalisierenden Institutionen angewiesen. Hinweise auf weitere existierende digitale Sammlungen, die noch nicht auf der Liste der Sammlungen verzeichnet sind grundsätzlich höchst willkommen. Wie kann man seine eigenen Metadaten in zvdd einbringen?Zunächst ist zu prüfen: ist zvdd für die in Frage stehenden digitalen Ressourcen zuständig? Bestehen hinreichend qualitätvolle Metadaten? Wenn beides der Fall ist, dann sollte Kontakt zu zvdd aufgenommen werden um einen geeigneten Übermittlungsmodus (Schnittstellen, Datenbankselektion, mail-Abgabe) und ggf. ein geeignetes Datenformat zu finden. Ansprechpartner sind die zvdd-Mitarbeiter bei der AG SDD, bei der VZG und beim HBZ. In welchem Rahmen erfolgt eine nachträgliche Erschließung durch zvdd?Nacherschlossen werden zunächst Digitalisierungsprojekte und digitale Sammlungen. Soweit die thematische oder Materialhomogenität dies zulässt können Erschließungsinformationen auch auf andere Ebenen (z.B. die Ausgabenebene) vererbt werden. In Zukunft soll außerdem die Möglichkeit geschaffen werden, dass auch einzelne Ausgaben nacherschlossen werden - z.B. durch die an bestimmten Themengruppen interessierten virtuellen Fachbibliotheken. Wie kann man zvdd-Daten in andere Portale einbinden? Wie kann man zvdd-Daten nachnutzen?Der einfachste Weg zur Nachnutzung ist die Verwendung der OAI-Schnittstellen. Über diese Schnittstellen können alle Metadaten in verschiedenen Formaten und verschiedenen inhaltlichen oder materialorientierten Zusammenstellungen abgerufen werden. Siehe die Erläuterungen zu den Schnittstellen (Verfügbarkeit der Metadaten). Welche Datenformate werden in zvdd benutzt?Unterschiedliche Objekte bzw. Informationsarten erfordern unterschiedliche Beschreibungsstandards. Digitalisierungsprojekte bzw. digitale Sammlungen werden in Anlehnung an " Dublin Core Collection Description" (DC CD) durch ein zvdd DC CD Anwendungsprofil beschrieben. Titeldaten einzelner Werke werden in den lokalen Projekten in den unterschiedlichsten Datenformaten verwaltet, bei zvdd in zentrale Formate zusammengeführt und in einem leicht vereinfachten MAB2-Format ausgetauscht. Nach außen stehen sie aber neben MAB auch in Dublin Core (DC) und in MARC zur Verfügung. Strukturdaten werden vor Ort ebenfalls in unterschiedlichen Formaten (eBind, METS, TEI, lokale Formate) vorgehalten und sollen zum Zweck der zentralen Indexierung bei zvdd in einem stark vereinfachten TEI-Derivat abgebildet werden. Version 0.8, Stand: 18.09.2006, Patrick Sahle (AG SDD) für zvdd |
||||||||||||||||||||||