venerdì 13 aprile 2012

Su quale sito sono "collegato" ?

E' ben noto, come sottolineo spesso a "Reti di Calcolatori I", che:
  • una pagina web è composta da molti documenti;
  • questi documenti possono essere prelevati da molti host;
  • gli host spesso non hanno nulla a che vedere con il sito dal quale si sta prelevando la pagina.
L'immagine seguente mostra questo fenomeno in modo interessante. Il server DNS del nostro lab ogni tanto "perde" le richieste (ne stiamo installando uno nuovo) il che, ogni tanto, impedisce il prelievo di qualche documento web. Quando ciò succede, Chrome visualizza un avviso nello spazio in cui avrebbe dovuto visualizzare il documento (clickare per ingrandire e vedi colonna di destra): uno crede di contattare solo www.corriere.it ma in realtà contatta anche rcspfm.simply.com.


Questo meccanismo è utilizzato per molti motivi leciti, ad esempio la delega della gestione delle pubblicità, del conteggio delle visite etc. E' utilizzato anche per motivi meno leciti, quali la diffusione di malware (http://www.citeulike.org/user/bartolialberto/article/9301761). In questo caso, un attaccante potrebbe infettare browser con vulnerabilità software semplicemente alterando il contenuto di  rcspfm.simply.com, il che è presumibilmente più semplice che non alterare quello di www.corriere.it.

Statistiche sul numero di documenti contenuti in ogni pagina, numero di host diversi da contattare per ogni pagina etc sono state raccolte da Google e rese disponibili pubblicamente. A parte tanti altri numeri, è interessante notare che in media occorrono ben 43,91 documenti per ogni pagina e questi documenti sono distribuiti, in media, su ben 7,01 host.
Posta un commento