Wofür brauchen wir das Semantic Web? Eine Einführung

March 14, 2021
6 min
Semantic Web
Ein Gebäude des Cern in der Schweiz, Credits to David Mark from pixabay.com

Einleitung

Das Internet begleitet uns mittlerweile in großen Teilen unseres Lebens. Es vergeht für die meisten von uns kein Tag, an dem wir keine Web-Services nutzen und auch in diesem Moment seid ihr im Internet unterwegs, um diesen Beitrag zu lesen. Um auf diese Seite zu gelangen, habt ihr vermutlich einen Link angeklickt und seid entweder direkt auf dieser Seite gelandet oder ihr habt euch über unsere Homepage auf diese Seite navigiert. In diesem Fall habt ihr den Titel oder die Vorschau dieses Artikels gesehen und draufgeklickt. Ihr habt also verstanden, dass sich hinter dem Link mehr Informationen zum Thema „Semantic Web“ verstecken, die euch brennend interessieren. 😉 Diese Seite stellt euch die Informationen nun durch Text und Bilder zur Verfügung. Da ihr des Lesens mächtig seid und Bilder erkennen könnt, versteht ihr, worum es geht, könnt euch informieren und wisst, wie ihr euch auf dieser Seite zu anderen spannenden Themen navigieren könnt.

Nun versetzt euch in die Lage einer Maschine: Ihr könnt das Internet in den Grundzügen verstehen. Ihr versteht also, dass das hier Text ist, da oben ein Bild ist und dass man durch Links auf andere Seiten gelangt. Ihr habt aber de facto keine Ahnung, was ihr hier gerade lest, da ihr als Maschine erst mal keine Kenntnisse habt. Ihr versteht nicht, worum es in diesem Text geht, dass ihr auf einer Blogseite seid und was das Titelbild euch vermitteln soll, wisst ihr auch nicht. Ihr versteht schlichtweg nicht die Bedeutung der dargestellten Inhalte.

Dass ihr als Personen das verstehen könnt, liegt daran, dass Menschen durch ihre breitgefächerten Kenntnisse, ihre Lernfähigkeit und ihre Intelligenz verstehen können, in welcher Situation sie sind und welche Informationen und Zusammenhänge vorliegen. Das Internet bietet Menschen eine Möglichkeit, auf Informationen zuzugreifen, die erstellt wurden und dargestellt werden. Es bietet die Möglichkeit, beispielsweise durch Mails oder Online-Shops in Interaktion mit anderen Menschen zu treten. Man kann also nicht nur Informationen abrufen, sondern auch Informationen abschicken, die andere Menschen wiederum abrufen können (An dieser Stelle ein freundlicher Hinweis auf die Kommentarspalte unter unseren Artikeln).

Maschinen können das alles nicht. Sie haben (noch) keine vorgefertigte Intelligenz und kein Wissen, um Zusammenhänge und Bedeutungen zu verstehen. Wie durch das Semantic Web versucht wird, Inhalten im Internet Bedeutung – also Semantik – zu verleihen, um die Interaktion zwischen Maschinen zu ermöglichen, lest ihr in den Artikeln dieses Themenblocks.

Was kann das Web heute?

Wie eben erwähnt bietet das Internet die Möglichkeit, Informationen darzustellen und abzurufen. Dabei reicht es jedoch nicht, ein Word-Dokument abzutippen und dieses hochzuladen. Man schreibt die Informationen in der Hypertext Markup Language (HTML). Erfunden wurde diese Sprache zwischen 1989 und 1992 von Tim Berners-Lee im Rahmen des internationalen Forschungsprojekts CERN. Ihm fiel auf, dass wegen des oft wechselnden Personals an dem sich weiterentwickelnden Forschungsprojekt viele Informationen verloren gingen und viel Zeit damit verbracht wurde, Informationen zwischen den Forschern auszutauschen. Durch die Erfindung von HTML sollte der Datentransfer zwischen den Wissenschaftlern vereinfacht werden. Sie sollten die Möglichkeit bekommen, Texte, Forschungsergebnisse und organisatorische Informationen einfach austauschen zu können [1]. Tim Berners-Lee gilt durch die Erfindung von HTML als einer der wichtigsten Begründer des Internets. Mit HTML kann man die Bestandteile eines Dokuments auszeichnen. Man kann beispielsweise definieren, welcher Teil eines Dokuments die Überschrift, welcher Fließtext oder welcher Inhalt ein Bild ist. Wäre dieser Blogbeitrag vor 30 Jahren geschrieben worden, hätten wir den Text wohl von Hand mithilfe von HTML auszeichnen müssen, ungefähr so:

Euer Browser würde diesen Code mithilfe von CSS dann so darstellen:

Beide Bilder sind Screenshots vom kostenlosen HTML-Tutorial der w3schools, das wir sehr empfehlen, wenn ihr einen gut verständlichen Einstieg in die Grundlagen des Internets finden möchtet. Auch zu CSS und anderen Themen werden dort gute Tutorials angeboten.

Heutzutage gibt es übrigens für das Erstellen eines Webinhalts einfacher zu bedienende Tools und auch neue technische Möglichkeiten, um beispielsweise Animationen oder Interaktionen einzubinden – das Prinzip der Auszeichnung von Inhalten mithilfe von HTML ist jedoch geblieben.

Definieren von Semantik in Webinhalten

HTML und CSS ermöglichen es uns also, Texte, Bilder, Links, und vieles mehr darzustellen und damit Informationen auszutauschen. Wir können verstehen, was der Ersteller eines Dokuments uns mitteilen möchte. Wie eingangs erwähnt können wir das, weil wir kluge Wesen sind, die Dokumente lesen und verstehen können. Wir verstehen dabei nicht nur die Syntax eines Dokuments, sondern auch dessen Semantik. Möchten Maschinen auf Inhalte im Internet zugreifen, können sie die Bedeutung von bestimmten Informationen nicht sofort erkennen – sie verstehen nämlich nicht deren Semantik.

Ein Beispiel: Eine Maschine könnte die Bedeutung des Satzes „Otto Schweizers Mutter Teresa kommt aus Essen“, der auf einer mit HTML geschriebenen Website dargestellt ist, nicht eindeutig bestimmen. Ihr hingegen erkennt sofort, dass es hier nicht um ein Versandhaus geht, der genannte Otto ein Mann ist, der nicht (zwangsläufig) aus der Schweiz kommt, der Text nichts mit der Friedensnobelpreisträgerin Mutter Teresa zu tun hat und mit Essen eine Stadt gemeint ist und keine Nahrung. Außerdem könnt ihr durch das „s“ bei Ottos Nachname und den Ausdruck „kommt aus“ sofort die Bedeutung des Satzes begreifen. Euer Gehirn vernetzt die Informationen sofort und intuitiv.

Ihr könnt wegen der Namen sogar sofort erkennen, dass es sich bei Otto um eine männliche Person handelt und bei seiner Mutter Teresa um eine weibliche Person. Die Verbindung „Mutter von“ stellt diese Bedeutung nochmal genauer dar und liefert eine zusätzliche Information über die Beziehung der beiden genannten Personen.

Wie in der Zeichnung dargestellt, können sämtliche Informationen mithilfe von vielen kleinen Sätzen und Beziehungen beschrieben werden. Im Bereich des Semantic Web nennt man solche Beziehungen „Tripel“. Diese bestehen aus zwei Objekten und der Beziehung, in der diese Objekte zueinander stehen. Ein Beispiel: „Otto -> ist -> Mensch“ oder „Otto -> hat Beruf -> Schlosser“. Mit tausenden solcher Tripel können Webinhalte durch derartige „Zusatzinformationen“ ergänzt werden – und das maschinenlesbar. Dadurch können also auch Programme Webinhalte verstehen, wodurch weitere Services für uns Nutzer angeboten werden können. Wenn ihr beispielsweise „Café Köln“ googelt, so werden euch direkt mehrere Cafés in eurer Umgebung angezeigt – zusammen mit zusätzlichen Informationen wie dem Unternehmensnamen, der Adresse, den Öffnungszeiten oder Rezensionen des Cafés. Es wurde also neben anderen Dingen beispielsweise definiert, dass der Ausdruck „9 – 20“ die Öffnungszeiten beschreibt und nicht etwa die Preisspanne der Kuchenauswahl.

Die Entwicklungen rund um das Semantic Web beschreiben also generell das Auszeichnen von Daten im Internet mit semantischen Attributen (z.B. „Teresa -> Mutter von -> Otto“) und Metadaten (also z.B. „Schweizer = Nachname“). Dadurch werden die Informationen von Inhalten maschinenlesbar und damit maschinell verarbeitbar. Wie das funktioniert und welche Technologien dafür zentral sind, erfahrt ihr in den kommenden Artikeln.

Referenzen
Portrait of Blogger
Nicolai Maisch
<  Previous
Next  >
Wie bringt man Semantik auf eine Website? Eine Einführung in JSON-LD, RDFa und Microdata

Kommentare