Linked Open Data @hbz Blog von 19.09.2013

  2013/09/19
Announcing the lobid API beta
Zuletzt geändert von Adrian Pohl, 14.10.2013, 11:18
Labels: news, lobid-general, api

We are happy to announce the public beta of the lobid API. After ten months of work by the lobid team (especially Fabian and Pascal who are doing the software development) the lobid API beta was deployed at the end of August. Our technology stack consists of Metafacture for the transformation of the raw data to N-Triples, Hadoop for enrichment and conversion to JSON-LD, Elasticsearch for indexing and data delivery, and the Play framework for the HTTP API. The software is developed on GitHub. For usage instructions and API details see the API documentation on the API homepage.

The lobid API technology stack and data flow

Providing easy access to authority data

Besides the data from the whole hbz union catalog now being available through the API 1 , we think that the lobid API will be an especially useful tool for interacting with the authority data provided by lobid. Continuing the original idea of lobid, the lobid API provides access to the data from the German ISIL registry (the MARC Organization Codes Database will be added to the API index later, see below). We decided to also add functionality to search for persons from the German Integrated Authority file (GND) and will add other GND data in the future.

In effect, libraries have been creating linked data for decades now, with subject, person, and title records referencing each other. Authority data has always constituted a hub in the library data world that many local datasets point to. Library authority data is relevant for other areas besides library catalogs (e.g. open access repositories which often do not make use of authority data yet, or a website for collecting job offers by libraries) — but to be attractive linking points, authority files should be easy to use. We hope to help library authority files move into this direction by enabling easy integration of the German ISIL registry as well as GND data into web forms via the lobid API. The API homepage provides JavaScript examples of how to use the API in web forms.

Screenshot of lobid API auto suggest use case

Some historical background

There already had been numerous ways of accessing lobid data before we developed the API: You can get the data in different RDF serializations via content negotiation 2 , you have the possibility to get a full dump of the bibliographic data, you can query the SPARQL endpoint at http://lobid.org/sparql, and the HTML pages are enriched with RDFa. Why add another data access mechanism? Besides the additional possibilities an API provides (e.g. the described auto-suggest functionality) and making the data more accessible to web developers by serving JSON-LD, there also were performance-related reasons that made us switch to provide LOD via Elasticsearch. In November 2012 Pascal Christoph presented at SWIB12 (slides, video) about our plans to move to a JSON-LD- and Elasticsearch-based approach for publishing LOD, as the triple-store-based approach had performance issues. Soon after that we broadened that approach to not only provide content negotiation and RDFa but to also offer an easy-to-use LOD-based web API using JSON-LD, which we now make available to public testing.

Prospects

We're planning to replace the current lobid.org site with the new implementation (since February 2012 lobid.org has been based on the data in our triple store (4store) being rendered by Phresnel). We're also going to add more data, e.g. we want to make all GND data available (not only on persons but e.g. subjects etc.), and integrate the open data from the Cultural Heritage Organizations vocabulary (which essentially is built from the MARC organization code database). For details and more plans, see our open issues and milestones on GitHub.

Footnotes

Footnotes
Ref Notes
1 As of September 2013 the last two libraries from the hbz library network - ULB Düsseldorf and UB Paderborn - have decided to join the open data initiative that started in March 2010. Thus, after three and a half years of arguing for open data, the hbz catalogue in whole is now openly licensed with CC0.
2 e.g. curl -L -H "Accept: text/turtle" http://lobid.org/resource/HT002189125 — the same works with the API: curl -L -H "Accept: text/turtle" http://api.lobid.org/resource/HT002189125
Eingetragen bei 19 Sep @ 10:06 AM von Adrian Pohl | 0 Kommentare
OER? Wie? Was? - Bericht zur OER-Konferenz 2013
Zuletzt geändert von Adrian Pohl, 09.09.2014, 15:08
Labels: metadata, oer, konferenz

von Adrian Pohl

Letztes Wochenende war ich mit meinem Kollegen Jan Neumann auf der OER-Konferenz 2013 (#OERde13). OER steht für Open Educational Resources. Veranstaltet wurde die Konferenz von Wikimedia Deutschland unter der Schirmherrschaft der UNESCO, und das Ganze fand statt in der Kalkscheune in Berlin Mitte, die ich noch von der Open Knowledge Conference (OKCon) 2011 in bester Erinnerung hatte.

Die Konferenz war spitzenmäßig organisiert und jede Session von netten Wikimedianerinnen und Wikimedianern betreut. Zu jeder Session gab es ein Etherpad, das - mal mehr mal weniger - von den Teilnehmerinnen und Sessionleitern befüllt wurde. (Ich bin ja der Meinung, dass Etherpads eine sehr gute, weil leicht zu erlernende "Einstiegsdroge" für kollaboratives Arbeiten im Web sind.) Wunderbar war auch, dass - soweit ich das beurteilen kann - wirklich Repräsentanten aller für OER relevanten Bereiche auf der Konferenz waren. Vertreten waren: Lehrkräfte, Wissenschaft und Hochschulverwaltung, Erziehungswissenschaft, Management und Politik, Verlage, Bibliotheken, private OER-Initiativen (z. B. Leute von serlo, Lernfink), Landesbildungsserver, selbstverständlich jede Menge Leute aus dem Wikimedia-Umfeld und viele mehr. Es gab insgesamt drei verschiedene Veranstaltungsformate auf der Konferenz: traditionelle von einer Programmkommission ausgewählte Vortäge mit Diskussion, ein Speedlab und ein BarCamp.

Am Samstagvormittag ging es - nach den ersten Gesprächen beim morgendlichen Kaffee - los mit einer Keynote von Philipp Schmidt (Videoaufzeichnung). Der stellte die grundlegenden Errungenschaften des WWW heraus und die Chancen, die OER mit dem Web als Plattform uns biete, um ein offenes Bildungssystem zu gestalten, das die aktive Beteiligung der Lerner ermögliche. Dazu nannte Schmidt eine Menge Beispiele, einige aus seinen eigenen Projekten. Mir ist insbesondere die Geschichte des neunjährigen Jungens im Gedächtnis geblieben, mit der Philipp Schmidt seinen Vortrag beendete (ab 30:14). Diese Junge sich sehr für Pinguine interessiert und im Web mit anderen Interessierten in Austausch tritt, so dass er sich schließlich regelmäßig mit anderen Pinguin-Forschern an der Johns-Hopkins-Universität austauscht. (Denn: Im Internet weiß niemand, dass du ein Kind bist.)

Philipp Schmidt bei seiner Keynote (Foto: Agnieszka Krolik, CC-BY-SA )

Methodisch-Didaktisches

Es folgten drei Sessions mit jeweils fünf durch ein Programmkomitee ausgewählten Vorträgen. Ich habe mich zunächst mal auf das mir unbekannte Terrain der Didaktik begeben und den Vortrag der Professorinnen Kerstin Mayrberger und Sandra Hofhues besucht (Etherpad zur Session). Die Thematik war hier eher das Gebiet der Open Educational Practices als der Open Edication Resources. Es wurden drei Thesen zu Diskussion gestellt (siehe die Input-Folien zur Session). Ich habe aus der Diskussion mitgenommen, dass die Teilnehmer der OER-Konferenz, die sich ja mit dem Web und Computern wahrscheinlich recht gut auskennen, eher frustriert mit dem Tempo sind, in dem neue Technologien und die damit verbundenen neuen methodisch-didaktischen Möglichkeiten Einzug in den Unterricht erhalten. Bevor nicht ein Großteil der Lehrkräfte selbst die nötigen Kompetenzen besitzen, kann eben OER keinen Einzug in die Klassenzimmer erhalten...

OER-Repositories und -Suche

Die nächsten zwei Sessions habe ich auf Basis meines bibliothekarischen Hintergrunds gewählt und bin zur Session über das edu-sharing-Netzwerk, OER-metadaten und -Systematiken von Christian Lukaschik gegangen (Etherpad). Das Edu-Sharing-Netzwerk scheint mir der am besten durchdachte und am weitesten umgesetzte Ansatz für den Aufbau einer dezentralen OER-Repository- und -Discovery-Infrastruktur zu sein. edu-sharing ist ein e. V., der sich wie folgt darstellt: "Als gemeinnützige Gemeinschaft betreiben wir ein freies Netzwerk für Lern- und Wissensinhalte und bündeln Ressourcen für die Verfügbarkeit und Qualitätssicherung von Contents und freier Software." edu-sharing beauftragt die metaVentis GmnH für die Entwicklung für edu-sharing eine OER-Repository-Software (auf Basis von Alfresco), wobei edu-sharing etwa auch die Support-Anfragen der Mitglieder bündelt. Ziel ist es, ein OER-Repository-Netzwerk auf Basis der edu-sharing-Software aufzubauen. Ich frage mich, inwiefern dieses Netzwerk auf Webstandards basiert und damit auch den Beitritt anderer Repositories zum Netzwerk ermöglicht. (Idealerweise sollte ja das Web das OER-Netzwerk sein und nicht ein softwareabhängiges Netzwerk-im-Netzwerk.) Damit OER-Repositories in die Oberflächen der bereits an Schulen verwendeten E-Learning-Systeme eingebunden werden kann, entwickelt metaVentis auch Plugins für Moodle und andere E-Learning-Umgebungen. edu-sharing/metaVentis hat schon eine Menge Erfahrung im Bereich (O)ER-Metadaten gesammelt und bspw. auch NRW-Curricula so bearbeitet, dass sie für die Verschlagwortung nutzbar sind, damit Sucheinstieg und Kategorisierung nach den Kompetenzen eines Curriculums möglich werden.

Als nächstes habe ich mir die Session von Lothar Palm zu learn:line NRW angeschaut, um die bisherigen Ansaätze zur Recherche nach Bildungsmaterialien besser zu verstehen. Dafür gibt es die Landesbildungsserver, die den Lehrkräften ihres Bundeslandes Recherche nach Bildungsressourcen (OER, nicht-offen lizenzierte, exklusiv für Lehrkräfte) ermöglichen. Das Institut für Internationale Pädagogische Forschung (DIPF) bietet darüber hinaus mit dem Deutschen Bildungsserver und der Suchmaschine Elixier eine Recherche u.a. über die aggregierten Daten der Landesbildungsserver an. Für Nordrhein-Westfalen wird die Recherche in Form der learn:line NRW angeboten, die technisch auf Basis der edu-sharing-Software bzw. dessen Discovery-Modul läuft. Zwar befinden sich im index von learn:line NRW mit ca. 25.000 Lernobjekten im Vergleich zur Bibliothekswelt (noch) recht wenige Ressorucen-Metadaten, allerdings kommen diese von einer Menge verschiedener Anbieter, was den Aufbau und den Betrieb des Portals nicht gerade erleichtert. Schließlich ist das Aggregieren von Daten verschiedener Anbieter, das Normalisieren und Indexieren mit einer Menge Aufwand verbunden. Ich habe am Ende der Session mal nachgefragt, ob es bereits Überlegungen gab, die learn:line-Daten unter einer offenen Lizenz für andere zur Wiederverwendung bereitszustellen. Diese Überlegungen gab es und offensichtlich wurden auch Experten zu dem Thema befragt. Die Nutzungsbedingungen, die die verschiedenen Anbieter mit der Datenlieferung verbinden, würden aber laut Aussage von learn:line-NRW-Vertretern keine Freigabe zulassen. Für mich war diese Erfahrung der Grund, das Thema "Offene OER-Metadatenökologie" in meiner Barcamp-Session am Samstagnachmittag in den Vordergrund zu stellen (Wie mein ursprünglicher Sessionvorschlag zeigt, wollte ich eher auch auf LRMI als Standard eingehen und herausfinden, welche relevanten Systematiken es im Bildungsbereich gibt.). Denn, wenn jetzt am Anfang die Weichen richtig gestellt werden, gibt es später keine Arbeit damit, noch mehr Leute von Open Data zu überzeugen.

Es folgte ein kurzes Intermezzo in Form eines - womöglich vom Speeddating inspirierten - Speedlabs. Dabei gabe es die Möglichkeit, von anderen europäischen Ländern zu lernen und sich deren OER-Ansätze und -Plattformen anzuschauen. Ich habe mir das tolle niederländische Wikiwijs angeschaut, das u. a. auch ein integriertes Remix-Tool anbietet und ansonsten meine Barcamp-Session vorbereitet.


Warten auf die Vorstellung einer Barcamp-Session (Foto: Agnieszka Krolik, CC-BY-SA)

Auf dem Weg zu einer offenen OER-Metadatenökologie

Am Samstagnachmittag habe ich dann die Session zum "Aufbau einer offene OER-Metadatenökologie" angeboten. Teilgenommen haben etwa 12 Personen, darunter interessierte OER-Plattformenbauer sowie ein Vertreter vom Landesbildungsserver Berlin-Brandenburg, einer von edu-sharing,. Für Sessionnotizen siehe das Etherpad unter https://etherpad.wikimedia.org/p/oercamp13-1-18. Ich habe einen kleines einleitendes Referat zu den Bestandteilen und Vorteilen einer offenen Metadatenökologie gehalten, siehe die Folien. Im Anschluss ging es vor allem um Systematiken und kontrollierte Vokabulare (Schulformen und -fächer sowie Curriculum-basierte Verschlagwortung). Die Teilnehmerinnen und Teilnehmer waren so interessiert, dass es am Ende Beifall gab und eine Nachfolgesession am Sonntag gewünscht wurde. Ich wollte mich zunächst nicht drauf festelgen, weil meine Verfassung nach dem ersten Konferenztag nicht gerade die beste war. (Ich kam mir vor, als hätte ich zwei Konferenztage in einem erlebt, weil das Programm ja sehr dicht war und in der Pause jede Menge Gespräche über Dinge anstanden, mit denen ich noch nicht sonderlich vertraut war...)
Dennoch habe ich dann in der ersten sonntäglichen Sessionrunde eine Fortsetzung angeboten, die nur von fünf bis sechs Leuten besucht war. Am Ende waren sich alle Anwesenden einig, dass eine Vernetzung der im OER-Metadatenbereich Aktiven über die Konferenz hinaus sinnvoll sei. So habe ich die E-Mail-Adressen der interessierten Leute eingesammelt und werde bei der DINI-KIM AG vorschlagen, Mailingliste und Wikibereich für OER-Metadaten einzurichten. (Wer noch Interesse hat und mir noch nicht bescheid gegeben hat, hinterlasse einen Kommentar unter diesem Beitrag oder schreibe eine E-Mail an mich (pohl[at]hbz-nrw.de).

Zum Abschluss der Konferenz habe ich noch die Beiträge von Stephan Suwelack ("Autoren als Marke") und dem geschätzten Kollegen Lambert Heller besucht. Leider kann ich da jetzt nicht weiter drauf eingehen, weil ich in mein (verlängertes) Wochenende muss, diesen Beitrag aber noch diese Woche veröffentlichen möchte. Die abschließende Keynote von Neil Butcher habe ich leider nicht mehr gehört. Zum Glück gibt es eine Aufzeichnung online.

Vielen Dank an die Organisatorinnen und Organisatoren der OER-Konferenz 2013, an das Programmkomitee und an die Teilnehmerinnen und Teilnehmer für die vielen interessanten Gespräche und Diskussionen.

Eingetragen bei 19 Sep @ 1:07 PM von Adrian Pohl | 0 Kommentare