Das Unvollendete

26.10.2004 04:02 Uhr Mark Frauenfelder

Die Schöpfung des World Wide Web machte Tim Berners-Lee nicht sofort reich und berühmt.

Die Schöpfung des World Wide Web machte Tim Berners-Lee nicht sofort reich und berühmt. Teils lag das daran, dass das Web eher bescheidenen Technologien entsprang: Lees Erfindung gründete auf einem Datensuchprogramm namens Enquire (nach dem viktorianischen Buch "Enquire Within upon Everything"), das er 1980 als Programmierer am CERN-Forschungszentrum in Genf geschrieben hatte. Teils lag es auch daran, dass Lee das Undenkbare tat, als er ein Jahrzehnt später die Werkzeuge fertig stellte, die die Grundstruktur des Webs definieren: Er gab sie frei weiter, mit dem Segen des CERN. Während andere mit seiner Erfindung Millionen verdienten, machte sich der stille Programmierer an die Gründung des World Wide Web Consortium (W3C) am MIT, das er noch immer leitet, um globale Standards und Projekte für das Web zu fördern.

Endlich erhält Berners-Lee seinen Lohn: Im Juni hat Königin Elizabeth II. ihn geadelt, im Monat zuvor bekam er den finnischen Millennium-Preis, dotiert mit einer Million Euro, für "hervorragende technologische Leistungen, die unmittelbar der Lebensqualität der Menschen dienen, auf humanistischen Werten gründen und das wirtschaftliche Wachstum fördern". Heute, in seinem neuen Büro im von Frank Gehry entworfenen Ray and Maria Stata Center des MIT, ist der 49-jährige gebürtige Engländer mit der Aufsicht über hunderte Projekte am W3C beschäftigt.

Zudem arbeitet er persönlich an seiner zweiten großen Idee: dem semantischen Web, das definierende Kennzeichnungen an Webseiten hängt und sie so verlinkt, dass Rechner Daten leichter finden und neue Zusammenhänge zwischen Informationsfragmenten bilden könnten - praktisch eine global verteilte Datenbank. Obwohl das semantische Web schon Teil der ursprünglichen Absicht seiner Erfindung war, ist es seit 15 Jahren in der Entwicklung und trifft auf hartnäckige Skepsis. Dennoch glaubt Berners-Lee, dass es sich demnächst durchsetzen und Computern dazu verhelfen wird, Bedeutung aus entlegener Information zu ziehen, so einfach, wie das heutige Internet einzelne Dokumente verknüpft.

Das semantische Web ist Teil von Berners-Lees großer Vision eines "einzigen Bedeutungsnetzes von allem und jedem". Aber ist es ein verworrenes Web, das wir weben? Trotz seines Zukunftseifers sorgt sich Berners-Lee darum, dass schlecht durchdachte Änderungen der Organisation und Steuerung des Webs dessen Funktionsfähigkeit und "Allgemeingültigkeit" beeinträchtigen könnten. Am Tag vor seinem Abflug nach Helsinki zur Entgegennahme des Millenniumpreises sprach der Vater des World Wide Web mit Technology Review über seine Sorgen - und seine Träume.

Das Unvollendete

Technology Review: Seit Jahren werben Sie für das, was Sie semantisches Web nennen, aber die Leute scheinen sich nicht dafür zu begeistern. Warum nicht?

Sir Tim Berners Lee: Das ist nicht mein erstes Problem mit einem Paradigmenwechsel. Am Anfang verstanden die Leute nicht wirklich, was das Web interessant macht. Sie sahen es in kleinerem Maßstab, und da ist es nicht interessant. Genauso ist es mit dem semantischen Web.

Technology Review: Wie haben Sie das überwunden?

Derzeit beginnen wir erst, Anwendungen auf das semantische Netz zu setzen und sie zu verknüpfen, wo es nützlich erscheint. Aber spannend dabei ist der Netzwerk-Effekt. Die Vision ist, dass wir eine kritische Masse erreichen, in der alles zu einem unvorstellbar großen Ganzen verknüpft wird. Der Anreiz, mehr hinzuzufügen, steigt dann exponentiell ebenso wie der Wert des bereits Vorhandenen. Weil kaum jemandem gleich dieses große "Aha!" der Verknüpfung riesiger Datenmassen im semantischen Web kommt, muss dies alles mit Leuten geschehen, die überzeugt sind - die verstehen, dass es die Mühe wert ist, das Ding auf die Beine zu stellen.

Technology Review: Dann erklären Sie bitte: Warum ist es all die Mühe wert?

Die übliche Rechtfertigung für das semantische Web ist, dass in den Datenbanken und Websites da draußen jede Menge Informationen liegen - Finanz-, Wetter- und Unternehmensdaten –, die man lesen kann, aber nicht verändern. Der Schlüsselpunkt ist, dass diese Daten existieren, aber Computer sie und ihre Zusammenhänge nicht verstehen.

Aber in einem Netz interessanter globaler Daten kann man die Daten, die man kennt, mit nicht bekannten verbinden. Diese Daten, zu denen wir vorher keinen Zugang hatten, werden unser Leben bereichern. Wir werden Programme schreiben können, die tatsächlich hilfreich sind, weil sie die Daten verstehen können, statt sie nur auf dem Bildschirm zu präsentieren.

Technology Review: Wie versteht das semantische Web Daten?

Angenommen, Sie finden im Web die Ankündigung eines Seminars und entschließen sich teilzunehmen. Nun sind allerlei Informationen auf dieser Seite, die Sie als Mensch verstehen, nicht aber Ihr Computer. Deshalb müssen Sie einen neuen Kalendereintrag anlegen und die Informationen dorthin übertragen. Dann nehmen Sie Ihr Adressbuch und fügen neue Einträge für alle Seminarteilnehmer hinzu. Und wenn Sie gründlich sind, ermitteln Sie die geografischen Koordinaten des Seminarraums und programmieren sie in Ihr Satellitennavigationsgerät.

Es ist sehr mühsam, das alles von Hand zu tun. Wie wäre es, dem Computer einfach zu sagen: "Ich gehe in dieses Seminar". Wenn es eine semantische Version der Webseite gäbe, enthielte sie markierte Informationen, die dem Computer sagen, "das ist ein Ereignis" sowie Uhrzeit und Datum. Sie würde automatisch die Anreise in Ihren Kalender eintragen, die Teilnehmer ins Adressbuch schreiben und Ihr Navigationssystem programmieren. Sie enthielte die Beziehungen zwischen der Veranstaltung und ihren diversen Leitern. Und diese Leiter hätten persönliche semantische Seiten, die ihre Kontaktdaten enthalten. Ihr Adressbuch kann von einer geschlossenen Datensammlung zu einem Fenster auf personenbezogene Daten weltweit wachsen.

Technology Review: Automatisiert das semantische Web also bloß viele Tätigkeiten eines menschlichen Assistenten?

Das Unvollendete

Nein. Ein menschlicher Assistent besitzt eine Form von Intelligenz, die wir nicht nachahmen. Er hat die Fähigkeit des menschlichen Geistes, plötzlich auf Zusammenhänge quer durch sein ganzes Erfahrungsspektrum zu kommen. "Ich habe Ihre Reise über Tiawicha gebucht, weil an diesem Wochenende dort das Blumenfest ist, und ich dachte, das gefällt Ihnen vielleicht", so läuft ein menschlicher Gedankengang. Das semantische Web ist, als gäbe man Ihnen ein Programm, das alles kann, was die IT-Abteilung Ihres Unternehmens programmieren könnte, wenn sie die Zeit hätte. Aber es ist immer noch ein Programm, wie das World Wide Web noch immer ein Dokument ist. In Zukunft wird das semantische Web ein großartiger Ort sein, um künstliche Intelligenz (KI) im engen Sinn zu entwickeln. Aber im Moment machen wir etwas ziemlich Mechanisches - selbst wenn wir Teile der Werkzeuge benutzen, die von der KI-Gemeinde entwickelt wurde.

Technology Review: Die Aufgabe scheint unlösbar groß. Wie funktioniert die Technologie?

Die Technologie des semantischen Webs geht das Problem auf zwei Stufen an. Die banalere ist ein allgemeines Datenformat. Sie können eine Datenbank, einen Kalender, ein Adressbuch, eine Bankanweisung oder eine Wetterbeobachtung nehmen - eigentlich alles mit harten Daten - und es vom Rechner in die Grundsprache des semantischen Webs übertragen lassen, statt in irgendein spezielles Format. Das löst das "syntaktische" Problem. Doch es löst nicht das "semantische". Dazu benennt das semantische Web zunächst die Grundbegriffe der Daten: Uhrzeit und Datum, ein Ereignis, ein Scheck, eine Transaktion, Temperatur und Luftdruck, Position. Sie alle sind so definiert, dass ihre Bedeutung genau ihrer Rolle im System entspricht - etwa "Transaktionsdatum, so wie es auf einer Bankanweisung steht". Die Gesamtheit dieser Begriffe nennt man eine Ontologie. Wenn Zusammenhänge zwischen Ontologien bestehen, wenn also Zeit und Datum eines Fotos begrifflich dem Zeitpunkt einer Wetterbeobachtung entsprechen, legen wir Regeln fest, die diese Zusammenhänge ausnutzen. Das ermöglicht es etwa, einen Agenten im semantischen Web nach Fotos suchen zu lassen, die an sonnigen Tagen aufgenommen wurden. Bit für Bit, Link für Link werden die Daten verwoben. Spannend dabei ist die Wiederverwendung der Daten: Jemand stellt sie für einen bestimmten Zweck ins Netz, der Nächste nutzt sie für einen anderen.

Technology Review: Sie sagten, dass "Phase eins" des semantischen Webs vollendet ist. Können Sie das erklären?

Das semantische Web funktioniert, indem es neue Sprachen definiert, in denen Computer Daten austauschen können. Phase eins war, die Syntax und Semantik der ersten dieser Sprachen so weit zu bringen, dass sie von den Mitgliedern des W3C als Standards unterstützt werden. Denn Kompatibilität ist der Schlüssel: Kein Programm kann als Anwendung des semantischen Webs gelten, wenn es nur in seinem eigenen Datenformat arbeitet, ohne Daten mit anderen Programmen austauschen zu können. Jetzt gibt es diese Grundlage. Jeder, der neue Anwendungen entwickeln oder Daten veröffentlichen will, kann es tun. Jedes andere Programm kann die Daten lesen.

Technology Review: Welche Anwendungen des semantischen Webs werden für die nächste Phase entwickelt?

Spannende Dinge geschehen in den Lebenswissenschaften. Die großen Herausforderungen wie Krebs, Aids und die Entdeckung von Wirkstoffen gegen neue Viren verlangen das Zusammenspiel riesiger Datenmengen aus überlappenden Gebieten - Genomik, Proteomik, Epidemiologie und so weiter. Einige dieser Daten sind öffentlich, einige gut gehütet von Konzernen und andere gehören zur Privatsphäre eines Patienten. Die Herausforderung des semantischen Webs, die Kompatibilität über diese Felder hinweg zu gewährleisten, ist gewaltig, aber verspricht großen Nutzen.

Technology Review: Aber geht es nicht bloß darum, Daten zwischen vielen Gebieten auszutauschen?

Nein. Es muss auch gelingen, Privatsphäre und geistiges Eigentum zu wahren und zugleich Informationen effizient zu nutzen - wenn man zum Beispiel einen neuen Wirkstoff sucht, könnte man epidemiologische Daten mit externen Faktoren wie Wetter, Reisetätigkeit oder Demografie vereinen, um herauszufinden, wie eine Krankheit übertragen wird und welche Menschen besonders anfällig sind. Dann könnte man versuchen, sie auf eine genetische Eigenschaft zurückzuführen, und fragen, welche Proteine dabei im Spiel sind und was sie in der menschlichen Zelle auslösen oder hemmen. Schließlich könnte man die an diesen Wirkwegen beteiligten Substanzen mit den Symptomen der Krankheit verknüpfen und mit Wirkstoffkandidaten. So kann man viel gewinnen, weshalb viele Leute sich dafür begeistern, in den Lebenswissenschaften mit Anwendungen des semantischen Webs zu arbeiten.

Technology Review: Existieren schon Anwendungen, die zeigen, wie das semantische Web solche Verknüpfungen bilden kann?

Das Unvollendete

Wenn Sie mit dem semantischen Web spielen wollen, können Sie eine Freund-eines-Freunds-Datei (friend of a friend, FOAF) für Ihre Homepage erstellen. In einer FOAF-Datei können Sie Dinge über sich selbst veröffentlichen, Ihre Organisation, Ihre Schriften, Wohnungen oder Bilder. Mit einem Zeiger können Sie etwa sagen, "das ist ein Foto von mir" oder wer noch darauf ist. Um eine FOAF-Datei zu erstellen, müssen Sie ein Formular wie das auf www.ldodds.com/foaf/foaf-a-matic.html ausfüllen. Aus dieser Information wird eine im semantischen Web lesbare Textdatei erzeugt, die Sie auf Ihre Website stellen können. Es gibt semantische Websites, die diese Daten auslesen und Ihnen etwa eine Liste von Fotos geben, die Sie mit anderen Leuten verbinden. Ich bin drei Fotos von Frank Sinatra entfernt, weil ich mit Bill Clinton fotografiert wurde, der mit einem der Kennedys fotografiert wurde, der mit Frank Sinatra fotografiert wurde. Eine alberne Anwendung, aber sie zeigt die Möglichkeiten der Wiederverwertung von Daten.

Technology Review: Können Sie ein ernsthafteres Beispiel beschreiben?

Es ist spannend, zu verfolgen, wie die Industrie sich auf die Umsetzung dieser Standards konzentriert. Werkzeugsammlungen von HP und IBM, Entwickleranwendungen von Adobe, intelligente Content-Management-Lösungen von Profium und Brandsoft und Suchmaschinen von Network Inference tragen alle zum semantischen Web bei. Diese und andere Technologien werden von Berufsgemeinschaften aufgegriffen und revolutionieren die Zusammenarbeit und Kommunikation dieser Gruppen. Das ist es, was wie gesagt gerade in den Lebenswissenschaften geschieht. Das Semantic Web Environmental Directory in Großbritannien ist der Prototyp einer neuen Art von Verzeichnis von Umweltorganisationen und -projekten. Statt zentraler Speicherung und Verwaltung der Information erntet das SWED einfach die Daten und erzeugt daraus das Verzeichnis. Im sozialen Bereich gibt es eine Anwendung der FoafCorp (eines Projekts im semantischen Web, welches das FOAF-Format auf Unternehmen erweitert) mit dem Spitznamen Fatcats, das zu jedem gewünschten Unternehmen zeigt, wer dort im Beirat sitzt, indem es einen Graphen mit den Verbindungen zwischen den Leuten zeichnet. So können Sie die Einflusssphären der amerikanischen Unternehmenskultur erkunden.

Technology Review: Sie sprechen oft von der Bedeutung der "Allgemeingültigkeit im Web". Was meinen Sie damit?

Eine grundlegende Eigenschaft des Webs ist, dass es ein einziger Raum ist, und zwar ein gemeinschaftlicher Raum. Es sollte unabhängig von der benutzten Hardware sein. Es sollte unabhängig sein von Software oder Betriebssystem. Es sollte auch unabhängig sein von der Kultur, in der man lebt, und davon, ob man ein wunderbares, sorgfältig bearbeitetes Dokument erstellt oder etwas auf die Rückseite des sprichwörtlichen Umschlags schmiert. Es sollte unabhängig sein von der Sprache, die man spricht, welche Buchstaben man benutzt, ob man von oben oder unten, von links oder rechts schreibt. Auch Behinderten sollte die Information zugänglich sein. Im W3C nennen wir diese Idee "ein Web - für jeden, alles und überall".

Technology Review: Und diese Allgemeingültigkeit ist bedroht?

Das Unvollendete

Es gab einen Vorschlag, eine spezielle Top-Level-Domain namens ".mobi" einzurichten. Alle Websites, die mit Mobiltelefonen funktionieren, sollten darin versammelt sein. Es wäre der Ort für Web-Inhalt für Mobilgeräte. Aber es sollte für alles nur eine einzige Web-Adresse geben. Inhalte in ein .mobi-Gehege abzuspalten ist der falsche Weg. Wir haben am W3C jede Menge Standards, die Websites bestens laufen lassen, egal ob auf einem Handy oder einem Großbildschirm. Aber wenn man ".mobi" ans Ende des Domain-Namens setzt, sagt man offensichtlich, "das ist ein spezieller Ort für Dinge, die auf Handys zu betrachten sind".

Technology Review: Es tobt ein Machtkampf zwischen den Vereinten Nationen und der Icann (Internet Corporation for Assigned Names and Numbers), welche die Vergabe von Domain-Namen und Internet-Adressen verwaltet. Was ist Ihre Meinung?

Manche Länder sind berechtigterweise besorgt, dass die Icann im Dienst des US-Handelsministeriums steht. Das Internet ist eine internationale Angelegenheit, und selbst wenn die Icann es sorgfältig im besten Interesse der ganzen Welt verwaltet, herrscht in vielen Ländern das Gefühl, dass die Icann US-kontrolliert ist, und dass dies ungerecht ist. Mein Gefühl ist, dass diese Asymmetrie sorgsam ausgeräumt werden muss. Es ist wichtig, dass die Lage als gerecht angesehen wird. Aber die Icann existiert nun einmal, und sie arbeitet. Sie sollte nicht plötzlich wieder eingestampft werden. Etwas zu schaffen, das die Beteiligten ausgeglichen vertritt, braucht viel Erfahrung und immer neue Aufmerksamkeit.

Technology Review: Glauben Sie, dass das World Wide Web Ihre größte Leistung sein wird?

Meine Rolle musste sich notwendigerweise vom einsamen Entwickler über den Anstachler zum leitenden Architekten und Konsensvermittler des W3C wandeln. Aber ich habe den Verdacht, dass das Web meine größte Leistung sein wird - obwohl ich dazu zur richtigen Zeit am richtigen Ort sein musste. Der Fehler ist aber, es für vollendet zu halten. Das semantische Web ist nur die Anwendung eines Web-ähnlichen Designs auf Daten. Es wird noch viele Jahrzehnte dauern, bis wir die Idee des Webs ganz umgesetzt haben, wenn wir es denn je schaffen.

Technology Review: Abgesehen vom semantischen Web, haben Sie weitere Träume oder Wünsche für das Web?

Ach, Unmengen! Ich habe mir das Web stets als kreativeres, flexibleres Medium gewünscht, etwa mit Anmerkungssystemen und der Möglichkeit gemeinschaftlicher Überarbeitung von Dokumenten. Spannend finde ich die Nutzung neuer tragbarer Geräte im Web, Sprachtechnologie und vieles andere. Wenn man einmal mit der Idee des Webs begonnen hat, wird so viel möglich.

(entnommen aus Technology Review Nr. 11/2004 [1]; das gesamte Heft können Sie hier [2]bestellen) (sma [3])

URL dieses Artikels:
https://www.heise.de/-277029

Links in diesem Artikel:
[1] http://www.heise.de/tr/inhalt/2004/11
[2] http://www.heise.de/abo/tr/hefte.shtml
[3] mailto:s.mattke@gmail.com