Metha ist ein Open-Source-Werkzeug für die Kommandozeile, mit dem sich Metadaten über das OAI-PMH-Protokoll herunterladen lassen. Metha ist im Rahmen des finc-Projektes an der Universitätsbibliothek Leipzig entstanden und wurde in Go implementiert. Wir haben dem Entwickler, Martin Czygan, einige Fragen dazu gestellt:
Wie ist die Idee zu metha entstanden?
Der Katalog der UB Leipzig setzt sich aus einer Vielzahl von kleineren und größeren Datenquellen zusammen: Verbünde, Bibliotheken, Verlage, Archive und Netzquellen. Ein Weg (neben vielen anderen), wie Institutionen ihre Daten anderen zur Verfügung stellen, ist das OAI-PMH-Protokoll. Die erste Version von OAI-PMH wurde bereits 2002 entwickelt. Daher gibt es heute tausende Einrichtungen, die dieses Protokoll verwenden. Mit metha kann man Metadaten über das OAI-PMH Protokoll herunterladen. Es gibt viele Werkzeuge in diesem Bereich und metha ist nur eines davon. Der Schwerpunkt von metha liegt in der einfachen Bedienung für Entwickler*innen.
Kurz: Die Idee entstand aus der Notwendigkeit heraus, Daten für den Katalog der UB Leipzig zu beziehen und dem Wunsch, dies auf eine unkomplizierte Art machen zu können.
Wer sollte metha benutzen?
Wer sich für Metadaten von Forschungspublikationen interessiert, diese indexieren oder analysieren will und sich etwas mit Linux oder der Kommandozeile auskennt, kann metha verwenden. Es gibt z. B. Forschende, die sich die Metadaten von Arxiv.org — einem großen Preprint-Publikationsserver — ansehen wollen und diese mit metha relativ unkompliziert beziehen können.
Wie funktioniert metha?
Metha ist ein spezieller Downloader und implementiert das OAI-PMH Protokoll. Statt Videos oder Musik lädt es bibliographische Metadaten herunter, die verschiedene Einrichtungen bereitstellen. Das kann eine Nationalbibliothek aber auch eine Zeitschrift eines kleinen Vereins sein, der technisch versiert ist. Die Betreiber solcher Endpunkte für Metadaten können so Interessierte über ihren aktuellen Bestand informieren. Was mit den Metadaten dann geschieht, ist nicht festgelegt: Sie können indexiert, archiviert oder auch analysiert werden.
metha in 120 Sekunden:
Welche weiteren Entwicklungen sind geplant?
Im Moment wenige. Interessanter als das Tool sind sicher die Daten, die damit heruntergeladen werden.
metha kann über das GitHub-Repository der UB Leipzig bezogen werden. In der dort hinterlegten Readme finden sich Anleitungen zu Installation und Nutzung des Werkzeuges. Und falls einem bei der Arbeit mit metha die Langeweile überkommt, findet sich in der Readme auch der Hinweis auf metha-fortune, ein Metadaten-Roulette, welches die Beschreibung eines zufällig ausgewählten Artikels anzeigt.
Autor: Martin Czygan
metha (this link opens in a new window) by ubleipzig (this link opens in a new window)
Command line OAI-PMH client and incremental harvester.