World Wide Web (WWW, W3, engl., »Weltweites Gewebe/Netz«), Subsystem des Internets, das im wesentl. auf dem Hypertext Transfer Protocol (HTTP), der Hypertext Markup Language (HTML) und verwandten Protokollen fußt. Stellte sich in den Anfängen das WWW noch primär als ein über alle angeschlossenen Rechner verteilter Hypertext dar, den Anwender mit einer speziellen Anwendungssoftware, einem sog. Webbrowser nur betrachten konnten, ist es heute durch Elemente erweitert, die eine dynamischere Benutzerinteraktion ermöglichen, insb. auch die Eingabe von Daten über den Webbrowser, die anschließend von Rechnern des WWW verarbeitet werden. Das WWW kann heute somit als die Gesamtheit der über das Internet zugängl. Anwendungssoftware definiert werden, die über einen Webbrowser bedient wird. Die Navigation (ugs. "Surfen") in und zwischen den einzelnen Elementen bzw. Angeboten des WWW erfolgt dabei weiterhin durch die Verfolgung einzelner als Hyperlink ausgezeichneter Textelemente.
Geschichte
Als Initiator des WWW gilt Tim Berners-Lee, der im März 1989 am Genfer CERN ein Papier "Information Management: A Proposal" zirkulieren ließ, nachdem er bereits in den frühen 1980er Jahren an DV-unterstützten Hypertext-Systemen gearbeitet hatte. Der Gedanke war, die bestehende, heterogene DV-Infrastruktur, in der bei CERN elektron. Dateien abgelegt waren, durch eine darüber gelagerte Hypertext-Ebene einfacher und unter einer einheitl. Oberfläche zugängl. zu machen, die einzelnen Seiten des Hypertextes aber ebenfalls über unterschiedl. Rechner zu verteilen. Das von Berners-Lee definierte HTML bediente sich dazu einer einfachen Hypertext-Struktur, die insb. auf bidirektionale Verknüpfung zwischen Texten verzichtet. Innerhalb einer Hypertextseite, die als einfach HTML-Datei konzipiert war, konnte beliebig auf URIs (bspw. der URI einer über FTP abrufbaren Datei) verwiesen werden, ohne dass der Anbieter dieser anderen Datei in irgendeiner Weise tätig werden musste. Zudem war ein Suchmechanismus vorgesehen, mit dem ein Server Auskunft über die auf ihm abgelegten HTTP-Dateien geben konnte.
Im September 1990 wurde das entspr. Projekt genehmigt (nun "World Wide Web-Projekt" genannt, verworfen wurden Bezeichnungen wie "Information Mesh, Mine of Information"). Erste Prototypimplementierungen, ein rudimentärer Webserver, eine sowohl als Browser wie WYSIWYG-Editor für HTML-Dateien einsatzbare Anwendung ("WorldWideWeb"), sowie ein textbasierter Browser, waren gegen Ende 1990 fertiggestellt; ab 13.11.1990 war unter der URL http://info.cern.ch die weltweit erste WWW-Webseite abrufbar.
Dieses zunächst für das interne Dokumentenmangement gedachte Projekt wurde bald ausgeweitet. Der Gedanke war nun, die bestehende Infrastruktur des Internets, das bezügl. der Verfügbarmachung wissenschaftl. Texte insb. mit den Protokollen FTP und Gopher operierte, durch ein solches Hypertext-System zu überlagern. Die Strategie war, einerseits mit HTML ein weltweites Hypertext-System aufbauen zu können, das gleichzeitig die vorhandenen Ressourcen integrierte. Im August 1991 wurden die Prototypen auf einem FTP-Server des CERN öffentl. zugängl gemacht, vom 6. Aug. 1991 datiert Berner-Lees Nachricht an mehrere Usenet-Gruppen, in denen er die Verfügbarkeit dieser Software bekanntgab.
Protokolle, Funktionsweise
Ressourcen (Dateien, Programme etc.) im WWW sind über sog. Uniform Resource Identifers (URI)s gekennzeichnet. Im Prinzip stellen sich URIs aus der Kombination der Identifikation eines Webservers und einer für diesen Server eindeutigen Identifikation der Ressource dar. Da die Serveridentifikationen weltweit eindeutig sind, identifiziert eine URI eine Ressource weltweit eindeutig.
Zentrales Kommunikationsprotokoll im WWW ist das der Anwendungsschicht des TCP/IP-Protokollstapels zuzuordnender Hypertext Transfer Protocol (HTTP). Dieses definiert die Kommunikation innerhalb eines Client-Server-Systems, bei der der Server als Webserver, der Client als Webbrowser bezeichnet wird. Das HTTP-Protokoll stellt zwei grundsätzliche Mechanismen bereit: Mit Hilfe sog. GET-Requests kann ein Client unter Angabe eines URIs eine Ressource in Form digitaler Daten vom entsprechenden Server abrufen, mit Hilfe eines POST-Requests kann er Daten an den Server übermitteln und von diesem eine Antwort zurück erhalten. HTTP ist ein zustandsloses Protokoll, jeder Zugriff entspricht konzeptionell einem eigenständigen, von allen anderen Zugriffen unabhängigen Vorgang.
Das wichtigste Format der so ausgetauschten Daten ist die Hypertext Markup Language (HTML). Mit dieser Seitenbeschreibungssprache werden Inhalt und Aufbau einer Bildschirmseite beschrieben; ein Webbrowser kann aus diesen Daten die grafische Darstellung auf dem Bildschirm erzeugen (bzw. äquivalente Darstellungen auf Braille-Zeilen etc.). Dazu ruft er ggf. weitere Daten vom Server Server ab (bspw. Bilddateien), deren URIs in den vom Server bereitgestellten HTML-Daten angegeben waren, und erstellt so nach ggf. mehreren Serverzugriffen die endgültige Ansicht.
Dynamische Inhalte
In den Anfängen waren die im WWW bereitgestellten Daten statisch, d. h., es wurden in einem Dateisystem abgelegte, HTML-formatierte Dateien vom Webserver »ausgeliefert«. Sehr schnell begann man jedoch, diese Daten anhand von Aufrufparametern dynam. für jeden Aufruf zu generieren, also HTML-Daten anhand der Aufrufparameter aufrufspezifisch zu erzeugen. Dies erfolgte zunächst über sog. Common Gateway Interfaces (cgi), in der Regel in einer Skriptsprache programmierte Software, die vom Webserver gestartet wurde und für diesen das auszuliefernde HTML generierte, dabei bspw. mit Datenbanken kommunizieren konnte etc. Bald entwickelten sich jedoch spezifische Serverstrukturen (sog. Stacks), bei denen Webserver und Skriptumgebung besser aufeiner abgestimmt wurden. Mit Java und .net wurden schließl. erstmals in großem Stil dezidierte Applikationsserver für Web-Anwendungen möglich. Die Programmierung der meisten Anwendungen des WWW erfolgt heute innerhalb sog. Web-Frameworks, die den Entwicklern häufig benötigte Funktionen bereitstellen und eine deutliche Trennung zwischen Inhalten und Formatierung der Inhalte forcieren.
Caveat
Die Begrifflichkeiten Internet und WWW werden häufig synonym verwendet, dies ist nicht korrekt, das WWW ist ledigl. ein Teilbereich des Internet.
Literatur
- Lee, T.-B.: Weaving the Web. The original design and ultimate destiny of the World Wide Web, by its inventor, Harper, San Franciso, 1999
- Meinel, Ch.; Sack, H.: WWW - Kommunikation, Internetworking, Web-Technologien. Springer-Verlag; Berlin, Heidelberg; New York; 2004.
Weblinks
- w3.org World Wide Web Consortium