2017-01-25 – Rechercheindizes-Workshop

Workshop: Rechercheindizes und Datenaufbereitung/-anreicherung

Zeit: 25. Januar 2017, 10-15 Uhr
Ort: Köln, hbz, Raum 107

TeilnehmerInnen

Adrian Pohl (hbz)
Hans-Georg Becker (UB Dortmund)
Holger Spörl (UB Siegen)
Andreas Lorenz (Fernuni Hagen)
Dirk Lindenau (FernUniversität Hagen)
Elmar Schackmann (hbz)
Stephani Scholz (hbz) von 10:00 - 11:00 / 12:00
Peter Kostädt (USB Köln)
Stefan Helms (TH Köln)
Vedat Recepoglu (TH Köln)
Michael Wiesen (ULB Bonn)
Annette Specht (ULB Bonn)
Sabine Althoff (UB Wuppertal)
Dominik Schmitz (UB RWTH Aachen)
René Sprotte (UB Paderborn)
Peter Manheller (Hochschulbibliothek Bonn-Rhein-Sieg)
Joachim Linden (Hochschulbibliothek Bonn-Rhein-Sieg)
Friedrich Summann (UB Bielefeld)
Fabian Steeg (hbz)
Christoph Ewertowski (hbz)
Bernd Müller (ZB MED)
Christoph Poley (ZB MED)
Michael Lackhoff (ZB MED)
Martin Scholz (HS Niederrhein)

Notizen

Vorstellung der Aktivitäten an den Bibliotheken

Siehe die Antworten auf der Unterseite.

In der Vorstellungsrunde wurde darum gebeten, Probleme mit den derzeitigen Ansätzen zu benennen:

  • Nutzer unterschiedlicher Datenquellen beklagen Unterschiede in Qualität und Umfang der Daten und damit verbundene Schwierigkeiten der einheitlichen Darstellung und Nutzung, z.B. Nutzung unterschiedlicher Normdaten für die Inhaltserschließung, konkret macht z.B. Facettierung über bestimmte Felder nur bei vernünftiger Abdeckung Sinn.
  • Summon-Nutzer beklagen nicht nachvollziehbare Suchergebnisse (Bonn, konkret: welche Felder landen im Index, nicht exakt abfragbar, intransparentes Ranking) und nicht zur Facettierung geeignete API-Antworten (Dortmund, konkret: API liefert Felder nicht so wie es für Facetten nutzber ist, mal so, mal so, kein Fortschritt in Abstimmung Summon).
  • Dublettenprobleme, da viele Ressourcen in mehreren Quellen vorhanden sind
  • Häufig fehlen deutsche Quellen

Als weitere Probleme kommerzieller Anbieter wurden langsame API-Antworten und als "Knebelverträge" empfundene stetig steigende Lizenzkosten genannt. Aus Sicht der Nutzer eines kommerziellen Indexes überwiegen derzeit jedoch die Vorteile der kommerziellen Lösungen, die sich insbesondere durch die Größe und Abdeckung der Indizes ergeben. Lediglich eine Bibliothek plant derzeit eine Kündigung ihres laufenden Vertrags.

Impulsvortrag von Hans-Georg Becker

Folien

Vorschlag zusammengefasst:

  • Der Verbund stellt eine Infrastruktur zur Verfügung, die es jeder Bibliothek ermöglicht, die benötigten Quellen in einem individuellen Index zusammenzustellen
  • Die Indexe werden vom Verbund "gebaut" und für die Bibliotheken zugreifbar gemacht
  • Die Aufbereitung der Daten geschieht kooperativ durch die Bibliotheken auf Basis einer Infrastruktur zur dezentralen Datenaufbereitung
  • Diese Infrastruktur existiert (teilweise) in finc und könnte gemeinsam genutzt und weiterentwickelt werden

Diskussion

Prinzipiell haben mehrere Bibliotheken ihr Interesse und ihre Bereitschaft erklärt, an einer kooperativen Lösung zu den verschiedenen Aufgaben bei der Erstellung eines Recherchindex mitzuwirken, insbesondere beim Sammeln von Quelldaten und der Datenaufbereitung.

Beispiele, wo eine solche Praxis sinnvoll wäre:

  • E-Medien-Pakete, die nicht über die hbz-Konsortialstelle erworben werden, weil sich keine fünf Lizenznehmer finden und die somit auch nicht im Verbundkatalog nachgewiesen werden. Da die wenigen Lizenznehmer dennoch aufbereitete Metadaten für ihren Index brauchen, könnte eine Kooperation hier Doppelarbeit vermeiden.
  • Beliebte, für alle zugängliche Datenquellen (z.B. Nationallizenzen) müssten nicht von verschiedenen Institutionen gesammelt und verarbeitet werden.

Hinsichtlich kommerzieller Discovery-Indizes waren sich alle TeilnehmerInnen einig, das sie Fachdatenbanken nicht ersetzen, sondern lediglich als zusätzliches Angebot für eine erste Recherche dienen sollten.

Was den Aufbau alternativer Lösungen angeht, war man sich einig, dass diese hinsichtlich des Umfangs der indexierten Quellen – zumindest auf längere Zeit – nicht mit den kommerziellen Angeboten würden mithalten können.

Welche Angebote sind gewünscht?

  • Bereits während des Impulsvortrags wurde klar, dass einige Bibliotheken gar kein Interesse am Angebot eines Index haben, sondern lieber an den (aufbereiteten) Daten. Der Vorschlag kam von der ZB MED und wurde aus Bielefeld, Paderborn und Köln (USB) unterstützt.
  • Friedrich Summann wünscht sich überdies Schnittstellen zur Datenanreicherung, um etwa die Anreicherungs-Expertise aus der UB Köln nachnutzen zu können. Dies sei laut Adrian Pohl in den letzten Jahren häufiger Thema bei den regionalen Linked-Open-Data-Treffen gewesen, das Thema sei aber vom LOD-Team noch nicht angegangen worden.

Eine Abfrage dazu, wer Interesse an welchem Angebot hätte, ergab folgendes Ergebnis:

  • (normierter) Datenpool und Bulk-Downloads: 6 Institutionen
  • Suchmaschinenindex: 4 Institutionen
  • Index + Frontend: 4 Institutionen
  • Konsortiallizenz Discovery-Index (EDS): 6 Institutionen

Einheitliches Zwischenformat?

Eine wiederkehrende Diskussion gab es um die Frage, ob man sich für den Datenpool auf ein einheitliches Zwischenformat einigen sollte, in das sämtliche Datenquellen aufbereit und entsprechend bereitgestellt werden sollten. Peter Kostädt und Vertreter der ZB MED favorisierten hier MARC 21, andere Teilnehmer waren skeptisch. René Sprotte beschrieb als Zielvorstellung ein Format, das näher am Index als am Katalog ist. Adrian Pohl schlug vor, zunächst die Daten so zu sammeln, wie sie von den Anbietern zur Verfügung gestellt werden und die Verarbeitungswerkzeuge und ihre Konfigurationen zur Verfügung zu stellen.

finc

Grundsätzlich waren sich alle TeilnehmerInnen einig, dass eine Kooperation mit finc sinnvoll sein könnte anstatt eigene redundante Strukturen aufzubauen (wofür überdies die Ressourcen fehlen). Das hbz wurde gebeten, mit finc Kontakt aufzunehmen, um weitere Informationen über die Gemeinschaft und die Infrastruktur zu erfahren. Zudem wurde das hbz darum gebeten, ein Konzept für eine mögliche Infrastruktur vorzulegen inklusive eines Zeitplans für die Umsetzung. Die Hochschulbibliothek der RWTH Aachen und die UB Dortmund bieten speziell Unterstützung bei den Gesprächen mit finc an.

Geben Sie Stichwörter ein, die dieser Seite hinzugefügt werden sollen:
Please wait 
Sie suchen ein Stichwort? Beginnen Sie einfach zu schreiben.