|
|
Mascherare i link esterni con RedirectMatch |
|
Qualcuno avrà notato che in questo periodo scrivo spesso - praticamente solo - articoli sul file .htaccess. Il fatto è che, adesso che ho cominciato a conoscerlo meglio, lo trovo sempre più utile e non riesco più a farne a meno. Chi come me conosce poco o nulla di php, con qualche regoletta per l'Apache risolve un sacco di problemi. Ieri mi chiedevo se ci fosse un sistema semplice per nascondere agli spider dei motori di ricerca gli outbond link (i link verso siti esterni). Per la sezione "Link" - in questo momento non ancora attiva - il cms passa gli url via parametro con il php. Invece per le altre pagine non ho a disposizione un sistema analogo. Se volevo scrivere un link esterno (a meno che non avessi inserito per ogni link il tag rel="nofollow", molto scomodo per chi come me usa un editor online che non supporta quest'attributo), il bot l'avrebbe seguito e gli avrebbe passato un pò del mio Page Rank. Questa è una cosa molto fastidiosa, soprattutto se si linka una pagina detestabile (per fare una critica, ad esempio, o per sconsigliarla). Fortunatamente mi sono ricordato del caro Apache e delle regolette del file htaccess, e sono venute fuori queste 2 righe: RedirectMatch ^/est/(http\://)?(www\..+)$ http://$2 Con queste regole ogni collegamento che parte dal sito e che inizia con:
viene indirizzato al sito esterno. Quindi se nell'html scriviamo un link di questo tipo: <a href="http://www.miosito.it/est/http://www.mare.it"> ogni user agent (tra cui i browser e gli spider) sarà mandato dal server su http://www.mare.it. Da notare è che il reindirizzamento avviene "lato server", quindi lo spider tratta quel link come un link interno. Quindi in questo modo
ApprofondimentiNon dobbiamo, come qualcuno mi ha suggerito, fondere insieme le due righe RedirectMatch ^/est/(http://www\.|www\.|http://)(.*)$ http://www.$2 perchè abbiamo la necessità di tenere distinti i casi in cui l'indirizzo di destinazione comincia con http://www. o www. (es.: http://www.casa.mia.it, www.casa.mia.it), da quelli in cui cui inizia solo con http:// ( http://casa.mia.it). Quest'ultimo tipo di url può essere infatti associato ad un dominio virtuale, che non funziona se al suo interno vengono scritte le 3w. AggiornamentoMi veniva un dubbio, ho chiesto su qualche forum, ma non ho avuto riscontri da parte di altre persone che abbiano usato tecniche simili. Così ho leggermente modificato l'articolo, aggiungendo "/est" - una "sottocartella virtuale" - alle righe del RedirectMatch, per fa si che si possa precluderne l'accesso agli spider. /est sta per Esterno.
Con questa direttiva Google e gli altri spider "non maligni" sicuramente non seguiranno il link Mi piacerebbe ricevere commenti via mail (vedi sez. Contatti). |
|
| Last Updated ( 11 Mar, 2006 at 11:53 AM ) |
Seo
Notizie, tecniche e trucchi
Mascherare i link esterni con RedirectMatch| In evidenza | ||
|---|---|---|
|
| Le più lette |
|---|
|
| Ricerca rapida |
|---|
|
|