linux

Dando un occhiata alle statistiche di questo blog una buona parte della banda e consumata da “spam crawlers” e “cross site image stealing“.

Per lo splog mi sono già attrezzato e devo dire che non ho più avuto problemi, ma per limitare un po il consumo di banda sto valutando alcune soluzioni.

Partiamo dalle cose più semplici.

Per il “furto” della immagini da altri siti (cross site image stealing) ho seguito questo tutorial che mi ha portato a creare un file .htaccess dentro la directory delle immagini.

SetEnvIfNoCase Referer "^http://maurizio.mavida.com/" ok_img
SetEnvIfNoCase Referer "^http://maurizio.mavida.com$" ok_img
SetEnvIfNoCase Referer "^$" ok_img
< filesmatch "\.(gif|png|jpe?g)$">
  Order Allow,Deny
  Allow from env=ok_img
< /filesmatch>

In pratica grazie al modulo modsetenvif istruisco apache che per alcuni tipi di file (gif|png|jpe?g) deve verificare se il Referer ha impostato correttamente la varibile “okimg”.
Nel mio caso l’accesso alle immagini viene negato a tutti tranne che alla pagine sotto “http://maurizio.mavida.com”.

Ispirato invece da quest’altro articolo sto provando ad applicare lo stesso procedimento per crowlers e spyder troppo invasivi …

La logica in questo caso è inversa: consenti a tutti tranne che per le casistiche previste.

SetEnvIfNoCase User-Agent "^Wget" no_page
SetEnvIfNoCase Remote_Addr "195.225.176.73" no_page
SetEnvIfNoCase Remote_Addr "195.225.177.90" no_page
SetEnvIfNoCase Remote_Addr "212.252.169.99" no_page

< filesmatch "\.(htm|php)$">
        Order Allow,Deny
        Allow from all
        Deny from env=no_page
< /filesmatch>

Per popolare la mia black-list ho incominiato usando i commenti taggati come spam, ma in questo modo l’elenco degli ip potrebbe essere molto lungo ad in alcuni casi potrebbe anche dare problemi di “performace”. E’ quindi da implementare con cirterio, verificando magari chi è il proprietario.

Le direttive impostabili con il modulo mod_setenvif sono molto potenti e quanto avete letto va considerato solo come un antipasto ….

SQLite è una piccola libreria scritta in C che implementa un motore SQL in meno di 250 KB, compatibile con la maggior parte dei comandi SQL-92, funzionante senza nessuna installazione e/o configurazione.

Il suo papà, Richard Hipp, ha preparato per Google una presentazione in cui ci illustra pregi e difetti della sua creatura.

Link di riferimento:

Sito Ufficiale
Slide della presentazione

Via Digitazero