domenica 17 gennaio 2010

Visualizzazione della struttura di un sito web generata tramite i risultati di una ricerca in rete

Capita sempre piu spesso di trovare, nei risultati di una ricerca in rete , decine se non centinaia di siti che presentano incluse pagine, quasi sempre nascoste a chi visita il sito colpito, con links a pharmacy, fake scanners AV, malware ecc....

Tramite uno script scritto in Autoit che ricalca quanto proponeva in passato un addon Firefox chiamato GSI (al momento non piu' compatibile con l'attuale versione di Firefox e con alcuni limiti sul numero dei risultati proposti) possiamo ricostruire la struttura del sito , attraverso i risultati di una ricerca.

Chiaramente non si tratta della completa reale struttura del sito in quanto ci si basa solo sugli indirizzi web ottenuti interrogando il motore di ricerca, mentre si ha invece come vantaggio la visualizzazione di una struttura ad albero nella quale compaiono anche pagine che normalmente potrebbero essere nascoste ai visitatori del sito colpito.
Il linguaggio Autoit, che definire solo come linguaggio di script e' assolutamente riduttivo, possiede tra l'altro una libreria di funzioni denominata GuiTreeView che facilita la visualizzazione ad albero dei dati acquisiti, e che e' stata utilizzata nello script.

Ecco ad esempio un sito di Comune italiano, sviluppato in Plone, che , a causa dell'ambiente di sviluppo non correttamente settato, presenta la caratteristica di permettere la creazione di utenti non autorizzati e relative pagine come queste

Questa e' una normale ricerca in rete con alcuni dei molti risultati proposti

mentre ecco come appare un report generato tramite lo script Autoit

Si nota subito, come nel report sia piu' evidente la serie di pagine del MEMBER Plone OnlinePoker create nel sito.
A dimostrazione che il report ricostruisce in maniera valida la struttura del sito ecco abilitata l'opzione dello script che espande tutti i livelli generando un lungo report che evidenzia come sia stato strutturato il sito comunale.

Notare che , in riferimento al Member non autorizzato , espandendo la struttura , abbiamo evidenti decine di pagine con links, come quella vista ad inizio post.

Per avere una ulteriore capacita' di analisi, lo stesso report puo' acquisire l'indicazione del time visualizzato utilizzando una apposita opzione del motore di ricerca, generando cosi' un report che mostra da quanto tempo le pagine sono online (chiaramente si basa non sul reale momento in cui le pagine sono create ma da quando il motore di ricerca le ha indicizzate ) cosa che permette di capire se si tratta di vecchi problemi o di un sito colpito recentemente.


Lo script genera inoltre alcuni files di dati che comprendono sia la struttura del sito

che l'elenco relativo degli indirizzi web trovati nella ricerca e che hanno premesso la creazione della struttura del sito stesso.

Edgar

Nessun commento: