29. Juni 2006

Blogs Go Library

Web

Die Deutsche Nationalbibliothek meldet heute, dass ihr erweiterter Sammelauftrag nun auch Internetpublikationen beinhaltet.

„Die Deutsche Nationalbibliografie wird neben gedruckten Werken auch Netzpublikationen verzeichnen und ein unverzichtbarer Nachweis der Veröffentlichungen in dieser Form für Kultur, Wissenschaft und Praxis sein. Das digitale Kulturerbe wird unsere Sammlung um eine zeitgemäße Publikationsform erweitern"

Weiter heisst es es werden Websites gesammeln, „deren Informationsgehalt über reine Öffentlichkeitsarbeit, Warenangebote, Arbeitsbeschreibungen oder Bestandsverzeichnisse / -kataloge hinausgeht. Zeitlich begrenzte Vorabveröffentlichungen und wissenschaftliche Preprints, reine Software- oder Anwendungstools und auch Fernseh- und Hörfunkproduktionen werden hingegen nicht einbezogen.“

Für eine schnelle und qualitativ hochwertige Erschließung werden Metadaten der jeweiligen Onlinepublikation herangezogen. Also ihr Blogger da draußen: wird Zeit euere Metadaten zu polieren. Vielleicht kommt die Deutsche Nationalbibliothek auch zu einem Server in euerer Nähe.

26. Juni 2006

Semantic Web 2006 - Part 3

Web

RDF gibt es also seit 7 Jahren. Das ist recht viel, wenn man bedenkt, dass das World Wide Web erst 15 Jahre alt ist (das WWW ist eine Anwendung innerhalb des wesentlich älteren Internets). Wer hat in all den Jahren tatsächlich etwas sinnvolles mit RDF gemacht?

So mehren sich seit einiger Zeit Stimmen, die die Idee RDF wesentlich besser finden als die Technik RDF. RDF scheint das gleiche Problem wie SGML zu haben: es ist zu komplex (SGML wurde von viel erfolgreicherem XML abgelöst).

Einer der Gründe für die rasante Verbreitung des WWW, ist die Möglichkeit bei jeder Webseite in den Quelltext schauen und durch Nachmachen lernen zu können. RDF ist aber für Maschinen und nicht für Menschen gedacht, und daher für Ottonormalverbraucher viel unverständlicher.

Eine komplizierte Lösung, die noch nach einem Problem sucht. Clay Shirky beschreibt das Semantische Web als eine Maschine zur Herstellung von Syllogismen. Syllogismen sind logische Schlussfolgerungen - im Sinne von Sherlock Holmes. Das klassische Beispiel lautet:

  • Alle Menschen sind sterblich
  • Alle Griechen (S) sind Menschen
  • Also sind alle Griechen sterblich

Shirky argumentiert, dass im wahren Leben kaum etwas so schwarz-weiss und einfach ist.

Beim Semantischen Web geht es um das Erschaffen neuer Inhalte aus selbst angelegten Daten, oder aus Daten in Datenbanken. Das Semantische Web basiert auf Metadaten, und Metadaten können dubios oder falsch sein. Cory Doctorow nennt 7 Schwierigkeiten mit Metadaten (frei übersetzt):

  • Menschen lügen
  • Menschen sind faul
  • Menschen sind dumm
  • Menschen haben Probleme sich selbst einzuschätzen
  • Kein neutraler Weg, Ideen zu kategorisieren
  • Wissen ist subjektiv
  • Viele Wege ein und dasselbe zu beschreiben

Metadaten geben spezifische Weltbilder wieder, und können somit zueinander inkompatibel sein und Änderungen unterliegen. Was wurde aus der Kategorie Jugoslawien? Ist Scientology eine Religion (USA) oder eine Sekte (Deutschland)?

Ob sich das Semantische Web tatsächlich einmal durchsetzt, bleibt weiterhin abzuwarten. Mittlerweile entwickeln sich vielerorts kleinere, dynamischere Initiativen, wie beispielsweise Microformats, über die ich hier ein wenig geschrieben habe. Microformats werden von manchen auch ganz bescheiden lower-case semantic web genannt, was nicht darüber hinwegtäuschen soll, dass sie sich großer Beliebtheit erfeuen.

Letztendlich gilt auch im Semantischen Web der Aphorismus garbage in garbage out (GIGO).

Simple Video Mixing and Sharing

Ajax Videobearbeitung mit eyespot:

Über einen online Videomixer werden einzelne Elemente in die Timeline gedraged. Videos können getrimmt, mit Effekten, Übergängen und Titeln versehen werden.

Eine (noch) unbegrenzte Menge an Video, Audio und Fotos kann hochgeladen und zu Videos beliebiger länge zusammengeschnitten werden (7 Elemente mit max. 50 Mb pro Upload, beliebig wiederholbar). Videos können von Telefon aud via MMS hochgeladen werden. Wer keine eigenen Videos hat, kann Footage anderer Community Teilnehmer benutzen.

Wie es sich Heutzutage gehört lassen sich Produkte taggen und mit Freunden teilen, Bloggen oder via MMS aufs Handy schicken.

Alle Inhalte unterliegen der creative commons Attributen 2.5.

25. Juni 2006

Semantic Web 2006 - Part 2

Beim Semantischen Web geht es nicht darum, Maschinen menschliche Sprache beizubringen. Vielmehr geht es um eine strukturierte Beschreibung von Aussagen im Sinne von A hat Preis B, oder C ist Mutter von D. Der Job der Maschine ist es dann, nicht explizit formulierte Beziehungen abzuleiten:

  • C ist Mutter von D
  • C ist Mutter von F

Der Computer konstruiert eine Verwandtschaft zwischen D und F obwohl diese im Dokument selbst nicht geschrieben steht. Sucht man mit einer Semantischen Suchmachine nach D, bekommt man auch F und C angezeigt.

Diese Art der Informations-Strukturierung wurde 1999, unter dem Akronym RDF (Resource Description Framework), vom W3C für das World Wide Web standardisiert. RDF könnte man holprig mit Quelle-Beschreibungs Rahmenwerk übersetzen.

Was ist damit gemeint? Eine via RDF strukturierte Aussage besteht aus drei Dingen: einer Quelle (um was gehts?), einer Eigenschaft (Was wird über die Quelle gesagt?) und einem Wert (der tatsächliche Inhalt des gesagten), auch Subjekt, Prädikat, Objekt genannt. Nehmen wir obiges Beispiel - Caroline ist die Mutter von Daniel. Was soll der Computer mit dieser Aussage anfangen? Er kennt weder Caroline noch ist ihm das Konzept Mutter-Sein bekannt.

RDF basiert auf der Idee, Quellen (Dinge) über sogenannte URIs zu identifizieren (Uniform Resource Identifiers). Eine URI kann (muss aber nicht) beispielsweise eine URL (Uniform Resource Locator) sein, schließlich sind Internet-Adressen einzigartig. Wichtig ist, dass die URI den jeweiligen RDF-Baustein identifizieren kann. Ein RDF Statement ist wie ein Satz, in dem alle Wörter aus URIs bestehen.

Beispiel: <http://www.CarolineMustermann.de> <http://www.vererbung.de/mutter_von> <http://www.Spass-Forum.de/Mitglieder/Profil/Daniel> .

Das obige Beispiel ist ein gültiges RDF Statement, geschrieben im sogenannten N-Triples Format.

Nun ist aber ein RDF-Prinzip, dass Jeder alles über alles sagen kann. Wer garantiert dem Computer, dass das obige Beispiel stimmt? Vielleicht gibt es viele URIs die Mutter-Sein definieren. Was ist in diesem Kontext richtig? Jemand bewertet Bücher auf einer Skala von 1 bis 10. Ein Anderer vergibt Noten von 1 bis 6. Maschinen können sich in diesem Chaos nur zurechtfinden, indem man ihnen Ontologien an die Hand gibt. Beispielsweise via OWL (Web Ontology Language). OWL selbst, ist eine RDF Anwednung. Die Sache wird schnell kompliziert. Ontologien sind nicht einfach zu Handhaben. Je nach Bedarf kann man sein Glück mit RDF Schema, OWL Lite oder OWL Full versuchen.

Das hört sich nicht so an, als würden viele Nutzer begeistert anfangen semantisch korrekt ausgezeichnete Daten oder Dokumente zu veröffentlichen. Tatsächlich ist das Semantic Web auch eher für maschinellen Zugriff auf Datenbanken gedacht - eine Öffnung diverser Datenbank vorausgesetzt (oder in geschlossenen Intranet-Applikationen).

23. Juni 2006

Semantic Web 2006 - Part 1

Sowohl Im Internet wie auch im World Wide Web kann man PDFs, diversen Audio- und Video-Dateien, Bildern und Artikeln begegnen. Diese können zu Webseiten verknüpft, Teil eines Portals oder der Anhang einer E-Mail sein. Im weitesten Sinn handelt es sich bei all dem um Dokumente. Das World Wide Web ist dokumentenbasiert. Informationen können nur von Menschen verstanden, interpretiert und verknüpft werden, Computer beschränken sich lediglich auf die Darstellung der Dokumente.

Suchmaschinen indexieren das Web mittels riesigem Computereinsatz. Autonome Programme, sogenannte Web Crawler (auch Robots oder Spider genannt), durchsuchen permanent das Web und analysieren Webseiten, folgen Links und senden alle gesammelten Daten zur Suchmaschine zurück. Diese hält ein Index mit gefundenen Begriffen und den entsprechenden Adressen vorrätig und reagiert auf eine Suchanfrage, vereinfacht gesagt, mit der Anzeige sämtlicher Orte (Web-Adressen) an denen der Spider beim letzten Besuch besagten Suchbegriff gefunden hat (siehe Bild).

Die Suchmaschine sucht buchstäblich nach Begriffen oder Sätzen die dem Suchbegriff gleichen (literal search). Das Problem dieses Ansatzes ist, abgesehen von sprachlichen Besonderheiten wie Homonymen und Synonymen, dass abstrakte Konzepte und Verknüpfungen nicht berücksichtigt werden.

Sucht man beispielsweise nach Kleinwagen, findet man nur Dokumente mit dem Begriff „Kleinwagen“, die ein Mensch händisch angelegt hat. Man findet aber keine VW Polo- oder Fiat Panda Dokumente, die den Suchbegriff überhaupt nicht enthalten, weil der Suchmaschine das Konzept „Kleinwagen“ nicht bekannt ist.

Wünschenswert wäre es, dass der Maschine (dem Computer) der Wissensbereich „Kleinwagen“ bekannt wäre, so dass (fast) ohne menschliches Zutun eine entsprechende Maschine-Maschine Komunikation stattfinden könnte. Das ist die Idee des Web der Daten (im Gegensatz zu obigem Web der Dokumente), besser bekannt als das Semantische Web.

Metadaten- und Wissensmodellen, so genannten Ontologien (Konzepte, die in einer Konzepthierarchie angeordnet sind), unterstützen den Nutzer bei Recherchen, Lernprozessen oder sozialen Aktivitäten.

Verschiedene Techniken erweitern das Web um eine semantische Ebene, indem sie Daten intelligent Auszeichnen, interpretieren, verknüpfen und Verborgenes ans Licht bringen.

Das soll zu einer gesteigerten Informationsqualität führen, einem wichtigen Thema der Wissensgesellschaft. Verteilte Wissenssysteme auf Basis von Subdokumenten sollen verknüpft und das Wissensmanagement revolutioniert werden.

Der Einsatz ist nicht nur im Internet, sondern auch im Intranet großer Konzerne besonders interessant und lukrativ, wo sich schnell Wissenssilos aufbauen. Das Neue am Semantischen Web ist nicht die Semantik, sondern das Web.

Das Semantische Web ist also eine Fortführung, eine Evolution, der Idee des World Wide Web und seines Erfinders Tim Berners-Lee.

22. Juni 2006

euroGel 2006

Usability

Am 1. September beginnt in Kopenhagen die erste europäische GEL-Koferenz. GEL steht für Good Experience Live und befasst sich mit Usability, im weitesten Sinne, in Technik, Wirtschaft, Kunst, Gesellschaft und diversen kreativen Ausdrucksformen.

Gel wurde im Jahr 2003 von Marc Hurst, dem Gründer von goodexperience.com und Creative Good, ins Leben gerufen. Kopenhagen ist nun das erste Mal, dass Gel ausserhalb New Yorks stattfindet. Für die europäische Usability Community eine gute Gelegenheit endlich mal vorbei zu schauen und sich einzubringen.

Die Konferenz findet im Black Diamond Theater der Dänischen Nationalbibliothek statt. Der Black Diamond getaufte Anbau ist allein schon sehr sehenswert.

16. Juni 2006

FireBug - Debugger

JavaScript

Endlich scheint es einen richtig guten, kostenlosen JavaScript Debugger zu geben: Joe Hewitts FireBug. Joe ist einer der Firefox Entwickler (war früher für die Entwicklung von Netscape 6 und 7 verantwortlich) und dürfte vielen JavaScriptern durch sein DOMInspector Plugin bekannt sein. Genau der richtige Mann also, um endlich einen vernünftigen JavaScript Debugger zu schreiben.

Was kann FireBug? Verschiedene Arten des Logging, via einem console Objekt welches FireBug mitbringt, Angabe einer Funktionsdauer in Milisekunden, Breakpoints setzen (via debugger Keyword), schrittweise durch eine Funktion durch gehen und so weiter. Genialer weise, ist der DOMInspector auch mit integriert. Die Liste ist zu lang für diesen Post, aber hier und hier könnt ihr euch mal die etwas knappe Doku anschauen. Hier ist ein gutes Video zur Einführung.

Viel Spaß beim Debuggen!

12. Juni 2006

German Food

Fußball WM 2006

Endlich wurde veröffentlicht, was genau eigentlich Deutsche Küche ist. Sogar mit aktueller Preisangabe. Hier in Mitte wimmelt es nur so von Ur-Deutschen Lokalen. War mir bislang noch garnicht aufgefallen.