martedì 9 aprile 2013

Com'è fatta una pagina web "vera" ?

La visualizzazione di ogni singola "pagina web" non è il risultato del prelievo di un documento HTML ed una manciata di file JPG.

E' il risultato del prelievo di molti documenti da più server, e dell'elaborazione nel browser di molti programmi Javascript prelevati da più server. In un post di un pò di tempo fa ho anche riportato statistiche molto interessanti calcolate da Google: in media, la visualizzazione di una pagina richiede il prelievo di più di 40 documenti da 7 server diversi.

Ho trovato un servizio web molto interessante per evidenziare questo fenomeno. Si tratta di urlquery.net. E' stato sviluppato per fare analisi relative al malware diffuso via web, ma è molto interessante anche per capire com'è realizzata una pagina "vera".

Gli ho chiesto di analizzare www.gazzetta.it. Dopo qualche decina di secondi ha fornito un report molto dettagliato, con alcuni aspetti di non facile interpretazione ma molto istruttivo:

  • Eseguiti 194 (centonovantaquattro) script.
  • Gli script hanno applicato 457 (quattrocentocinquantasette) modifiche al documento visualizzato dal browser.
  • Il browser ha eseguito 449 (quattrocentoquarantanove) scambi request-response HTTP.
Una "pagina web" reale è quindi qualcosa di molto, ma molto complicato.

Il report dovrebbe essere accessibile a questo link (altrimenti fatelo generare nuovamente); qui sotto una sorta di mappa dei documenti necessari.


Posta un commento