Semantic Publishing (engl. für „Semantisches Publizieren“) bezeichnet alle Aktivitäten, welche die Bedeutung oder den Sinn von veröffentlichten Inhalten (u. a. Artikel, Blogeinträge) erweitern bzw. anreichern.[1] Die Inhalte sowie die Anreicherungen werden dann meist im Web veröffentlicht.

Der Begriff des Semantic Publishing ist entstanden, um diverse Initiativen – besonders im Bereich des wissenschaftlichen Publizierens – zusammenzufassen.[2]

Die Erweiterungen beruhen auf Technologien des semantischen Webs. Dabei werden Informationen innerhalb eines Texts respektive die Metadaten des Texts in einem maschinenlesbaren Format zur Verfügung gestellt. Dem Computer ist es so möglich, die Struktur oder gar die Bedeutung der veröffentlichten Information verstehen zu können. Dies führt zu einer effizienteren Informationssuche und Informationsintegration. Des Weiteren können damit auch zusätzliche Dienste eingeführt werden, wie beispielsweise die Verknüpfung eines Artikels mit semantisch verwandten Inhalten.[3]

Beispiele für semantische Erweiterungen von Inhalten

Bearbeiten

Das Thema des Semantic Publishing ist noch nicht klar umrissen, bietet aber schon viele konkrete Anwendungsfälle. Ob alle semantischen Erweiterungen tatsächlich einen Mehrwert bieten, muss erst noch erwiesen werden.

Auszeichnung (engl. Markup) von Entitäten

Bearbeiten

Elemente, die dank standardisierten Namen oder Nomenklaturen eindeutig zu identifizieren sind, können innerhalb eines Artikels ausgezeichnet werden. Anhand dieser Markierung wird das Element, bzw. die Entität, mit anderen Informationsquellen verbunden, was das Abrufen von zusätzlichen Informationen bezüglich der Entität ermöglicht.

Der Webdienst Reflect[4] basiert auf diesem Prinzip.[5] Reflect ist ein Plug-in, welches in einem Webbrowser installiert werden kann. Es markiert Gen-, Protein- und Molekülnamen auf jeder Webseite, die von einem Benutzer besucht wird. Durch Klicken auf einen markierten Namen öffnet sich ein Popup, welches zusätzliche Informationen zum ausgewählten Element enthält, welche in der ursprünglichen Webseite nicht vorhanden sind.

Formatierung der Information in Tripeln

Bearbeiten

Die Informationen bzw. Fakten, welche in einem Artikel enthalten sind, können als Tripel (Entität – Beziehung – Entität; resp. Subjekt – Prädikat – Objekt) formatiert werden, indem die Daten in eine auf RDF basierende Sprache überführt werden. Dies ermöglicht es, Fakten und Beziehungen in einem maschinenlesbaren Format für eine weitere Nachnutzung in einem semantischen Kontext zur Verfügung zu stellen.

Die Darstellung von Informationen in Tripeln wird im FEBS Letters Experiment (FEBS = Federation of European Biochemical Societies) durch das Structured Digital Abstract umgesetzt.[6] Dieses Abstract enthält biologische Entitäten, ihre Beziehung zueinander, sowie die Methode, mit welcher die Beziehung untersucht worden ist. Dies ermöglicht es, nicht nur nach den Namen der Entitäten, sondern auch nach deren Beziehungen zueinander zu suchen.

Konkreter Anwendungsfall

Bearbeiten

David Shotton, Mitglied einer Forschungsgruppe im Departement für Zoologie an der Universität in Oxford, hat den Versuch unternommen, möglichst viele semantische Erweiterungen an einem Artikel der Plos-Zeitschrift Neglected Tropical Diseases zu unternehmen.[7] Zu den Anreicherungen gehören: herunterladbare XML-Version des Artikels, herunterladbare Datensätze, Zuweisung von DOIs, semantische Auszeichnung von Begriffen mit Links zu relevanten externen Informationsquellen, interaktive Abbildungen, Neu-Anordnung der Bibliographie, Zitatanalysen, eine Tag Cloud u.v.m. Der Artikel kann online eingesehen werden.[8]

Original-Version: doi:10.1371/journal.pntd.0000228

Version mit den semantischen Anreicherungen: doi:10.1371/journal.pntd.0000228.x001

Einzelnachweise

Bearbeiten
  1. Shotton, D.: Semantic publishing: the coming revolution in scientific journal publishing. 2009, S. 86.
  2. De Waard, A.: From Proteins to Fairytales: Directions in Semantic Publishing. 2010, S. 83
  3. Shotton, D.: Semantic publishing: the coming revolution in scientific journal publishing. 2009, S. 86.
  4. Siehe dazu: Website des Webservices Reflect
  5. Pafilis E. et al.: Reflect: augmented browsing for the life scientist. 2009
  6. Gerstein, M.: Publishing perishing? Towards tomorrow's information architecture. 2007
  7. Shotton, D. et al.: Adventures in Semantic Publishing: Exemplar Semantic Enhancements of a Research Article. 2009
  8. Reis, R.: Impact of Environment and Social Gradient on Leptospira Infection in Urban Slums. 2008

Literatur

Bearbeiten
  • Mark B. Gerstein: Publishing perishing? Towards tomorrow's information architecture. In: BioMed Central (BMC) bioinformatics. Vol. 8, No. 17, 2007, ISSN 1471-2105, S. 1471–2105. doi:10.1186/1471-2105-8-17
  • Renato B. Reis, Guilherme S. Ribeiro, Ridalva D. M. Felzemburgh, Francisco S. Santana, Sharif Mohr, Astrid X. T. O. Melendez, Adriano Queiroz, Andréia C. Santos, Romy R. Ravines, Wagner S. Tassinari, Marília S. Carvalho, Mitermayer G. Reis, Albert I. Ko: Impact of Environment and Social Gradient on Leptospira Infection in Urban Slums. In: PLoS Neglected Tropical Diseases. Vol. 2, No. 4, 2008, ISSN 1935-2735, S. 1–10 (e228). Original-Version: doi:10.1371/journal.pntd.0000228, Version mit den semantischen Anreicherungen: doi:10.1371/journal.pntd.0000228.x001
  • Evangelos Pafilis, Seán I. O'Donoghue, Lars J. Jensen, Heiko Horn, Michael Kuhn, Nigel P. Brown, Reinhard Schneider: Reflect: augmented browsing for the life scientist. In: Nature Biotechnology. Vol. 27, No. 6, 2009, ISSN 1087-0156, S. 508–510. doi:10.1038/nbt0609-508
  • David Shotton, Katie Portwin, Graham Klyne, Alistair Miles: Adventures in Semantic Publishing: Exemplar Semantic Enhancements of a Research Article. In: PLOS Computational Biology. Vol. 5, No. 4, 2009, ISSN 1553-7358, S. 1–17. doi:10.1371/journal.pcbi.1000361
  • David Shotton: Semantic publishing: the coming revolution in scientific journal publishing. In: Learned Publishing. Vol. 22, No. 2, 2009, ISSN 0953-1513, S. 85–94. doi:10.1087/2009202
  • Anita de Waard: From Proteins to Fairytales: Directions in Semantic Publishing. In: IEEE Intelligent Systems. Vol. 25, No. 2, 2010, ISSN 1541-1672, S. 83–88. doi:10.1109/MIS.2010.49