26. Juni 2006

Semantic Web 2006 - Part 3

Web

RDF gibt es also seit 7 Jahren. Das ist recht viel, wenn man bedenkt, dass das World Wide Web erst 15 Jahre alt ist (das WWW ist eine Anwendung innerhalb des wesentlich älteren Internets). Wer hat in all den Jahren tatsächlich etwas sinnvolles mit RDF gemacht?

So mehren sich seit einiger Zeit Stimmen, die die Idee RDF wesentlich besser finden als die Technik RDF. RDF scheint das gleiche Problem wie SGML zu haben: es ist zu komplex (SGML wurde von viel erfolgreicherem XML abgelöst).

Einer der Gründe für die rasante Verbreitung des WWW, ist die Möglichkeit bei jeder Webseite in den Quelltext schauen und durch Nachmachen lernen zu können. RDF ist aber für Maschinen und nicht für Menschen gedacht, und daher für Ottonormalverbraucher viel unverständlicher.

Eine komplizierte Lösung, die noch nach einem Problem sucht. Clay Shirky beschreibt das Semantische Web als eine Maschine zur Herstellung von Syllogismen. Syllogismen sind logische Schlussfolgerungen - im Sinne von Sherlock Holmes. Das klassische Beispiel lautet:

  • Alle Menschen sind sterblich
  • Alle Griechen (S) sind Menschen
  • Also sind alle Griechen sterblich

Shirky argumentiert, dass im wahren Leben kaum etwas so schwarz-weiss und einfach ist.

Beim Semantischen Web geht es um das Erschaffen neuer Inhalte aus selbst angelegten Daten, oder aus Daten in Datenbanken. Das Semantische Web basiert auf Metadaten, und Metadaten können dubios oder falsch sein. Cory Doctorow nennt 7 Schwierigkeiten mit Metadaten (frei übersetzt):

  • Menschen lügen
  • Menschen sind faul
  • Menschen sind dumm
  • Menschen haben Probleme sich selbst einzuschätzen
  • Kein neutraler Weg, Ideen zu kategorisieren
  • Wissen ist subjektiv
  • Viele Wege ein und dasselbe zu beschreiben

Metadaten geben spezifische Weltbilder wieder, und können somit zueinander inkompatibel sein und Änderungen unterliegen. Was wurde aus der Kategorie Jugoslawien? Ist Scientology eine Religion (USA) oder eine Sekte (Deutschland)?

Ob sich das Semantische Web tatsächlich einmal durchsetzt, bleibt weiterhin abzuwarten. Mittlerweile entwickeln sich vielerorts kleinere, dynamischere Initiativen, wie beispielsweise Microformats, über die ich hier ein wenig geschrieben habe. Microformats werden von manchen auch ganz bescheiden lower-case semantic web genannt, was nicht darüber hinwegtäuschen soll, dass sie sich großer Beliebtheit erfeuen.

Letztendlich gilt auch im Semantischen Web der Aphorismus garbage in garbage out (GIGO).