2017-01-25 – Rechercheindizes-Workshop

Schlüssel
Diese Zeile wurde entfernt.
Dieses Wort wurde entfernt. Dieses Wort wurde hinzugefügt.
Diese Zeile wurde hinzugefügt.

Änderungen (18)

Seitenhistorie anzeigen
# h1. Workshop: Rechercheindizes und Datenaufbereitung/-anreicherung

Zeit: 25. Januar 2017, 10-15 Uhr
Siehe die [Antworten|https://wiki1.hbz-nrw.de/x/eACOCw] auf der Unterseite.

Nutzer unterschiedlicher Datenquellen beklagen unterschiedliche Qualität der Daten und damit verbundene Schwierigkeiten der einheitlichen Darstellung und Nutzung, z.B. unterschiedliche Schlagwort-Systematiken, konkret macht z.B. Facettierung über bestimmte Felder nur bei vernünftiger Abdeckung Sinn.

Summon-Nutzer beklagen nicht nachvollziehbare Suchergebnisse (Bonn, konkret: welche Felder landen im Index, nicht exakt abfragbar, intransparentes Ranking) und nicht zur Facettierung geeignete API-Antworten (Dortmund, konkret: API liefert Felder nicht so wie es für Facetten nutzber ist, mal so, mal so, kein Fortschritt in Abstimmung Summon).

Als weitere Probleme kommerzieller Anbieter wurden langsame API-Antworten und als "Knebelverträge" empfunde stetig steigende Lizenzkosten genannt.

h3. Impulsvortrag von Hans-Georg Becker

[Folien|^2017-01-25_hbz_index_workshop.pdf]

h3. Diskussion
Vorschlag zusammengefasst:

Hinsichtlich kommerzieller Dicovery-Indizes waren sich alle TeilnehmerInnen einig, das sie Fachdatenbanken nicht ersetzen, sondern lediglich als zusätzliches Angebot für eine erste Recherche dienen sollten.
- Der Verbund stellt eine Infrastruktur zur Verfügung, die es jeder Bibliothek ermöglicht, die benötigten Quellen in einem individuellen Index zusammenzustellen
- Die Indexe werden vom Verbund "gebaut" und für die Bibliotheken zugreifbar gemacht
- Die Aufbereitung der Daten geschieht kooperativ durch die Bibliotheken auf Basis einer Infrastruktur zur dezentralen Datenaufbereitung
- Diese Infrastruktur existiert (teilweise) in finc und könnte gemeinsam genutzt und weiterentwickelt werden

Was den Aufbau alternativer Lösungen angeht, war man sich einig, dass diese hinsichtlich des Umfangs der indexierten Quellen – zumindest auf längere Zeit – nicht mit den kommerziellen Angeboten würden mithalten können.
h3. Diskussion

Prinzipiell haben mehrere Bibliotheken ihr Interesse und ihre Bereitschaft erklärt, an einer kooperativen Lösung zu den verschiedenen Aufgaben bei der Erstellung eines Recherchindex mitzuwirken, insbesondere beim Sammeln von Quelldaten und der Datenaufbereitung.

- E-Medien-Pakete, die nicht über die hbz-Konsortialstelle erworben werden, weil sich keine fünf Lizenznehmer finden und die somit auch nicht im Verbundkatalog nachgewiesen werden. Da die wenigen Lizenznehmer dennoch aufbereitete Metadaten für ihren Index brauchen, könnte eine Kooperation hier Doppelarbeit vermeiden.
- Beliebte, für alle zugängliche Datenquellen (z.B. Nationallizenzen) müssten nicht von verschiedenen Institutionen gesammelt und verarbeitet werden.

Hinsichtlich kommerzieller Discovery-Indizes waren sich alle TeilnehmerInnen einig, das sie Fachdatenbanken nicht ersetzen, sondern lediglich als zusätzliches Angebot für eine erste Recherche dienen sollten.

Was den Aufbau alternativer Lösungen angeht, war man sich einig, dass diese hinsichtlich des Umfangs der indexierten Quellen – zumindest auf längere Zeit – nicht mit den kommerziellen Angeboten würden mithalten können.

h4. Welche Angebote sind gewünscht?

- Bereits während des Impulsvortrags wurde klar, dass einige Bibliotheken gar kein Interesse am Angebot eines Index haben, sondern lieber an den (aufbereiteten) Daten. Der Vorschlag kam von der ZB MED und wurde aus Bielefeld, Paderborn und Köln (USB) unterstützt.
- Friedrich Summann wünscht sich überdies Schnittstellen zur Datenanreicherung, um etwa die Anreicherungs-Expertise aus der UB Köln nachnutzen zu können. Dies sei laut Adrian Pohl in den letzten Jahren häufiger Thema bei den regionalen Linked-Open-Data-Treffen gewesen, das Thema sei aber sit Jahren nicht mehr vom LOD-Team noch nicht angegangen worden.

Eine Abfrage dazu, wer Interesse an welchem Angebot hätte, ergab folgendes Ergebnis:

- (aufbereitete) Quelldaten: 6 Institutionen
- normierter Datenpool und Bulk-Downloads: 6 Institutionen
- Suchmaschinenindex: 4 Institutionen
- Index + Frontend: 4 Institutionen
- Konsortiallizenz Discovery-Index (EDS): 6 Institutionen

h4. Einheitliches Zwischenformat?

Eine wiederkehrende Diskussion gab es um die Frage, ob man sich für den Datenpool auf ein einheitliches Zwischenformat einigen sollte, in das sämtliche Datenquellen aufbereit und entsprechend bereitgestellt werden sollten. Peter Kostädt und Vertreter der ZB MED favorisierten hier MARC 21, andere Teilnehmer waren skeptisch. René Sprotte beschrieb als Zielvorstellung ein Format, das näher am Index als am Katalog ist. Adrian Pohl schlug vor, zunächst die Daten so zu sammeln, wie sie von den Anbietern zur Verfügung gestellt werden und die Verarbeitungswerkzeuge und ihre Konfigurationen zur Verfügung zu stellen.

h4. finc
h2. To Dos

hbz: Notizen ins Wiki mit Vortagsfolien (/)
hbz: mit finc reden, welche Kooperationsmöglichkeiten es gibt
hbz: Konzept für mögliche Infrastruktur vorlegen inklusive Zeitplan

RWTH und UB Dortmund bieten speziell zur Kooperation mit finc Unterstützung an.