Todos intentamos no solo aparecer en Google, sino buscamos
la manera de que aparezcamos en los primeros resultados. Tarea difícil que ha
llegado a convertirse en toda una profesión. Pero si por alguna razón nos interesa
todo lo contrario, en ese caso es muchísimo más fácil.
Los buscadores de internet y no solo Google, utilizan robots
para recorrer las webs. Almacenan e
indexas sus contenidos en sus bases de datos.
Si queremos que el contenido público de nuestra red no aparezca
en las búsquedas de Google, podemos indicárselo muy fácilmente a los robots que
recopila esa información. Tan fácil como añadir el fichero robots.txt con el siguiente contenido:
User-agent: *
Disallow: /
De esta forma indica a
todos los robots que no inspecciones la información de tu web. Si por algún motivo
no pudieras añadir este tipo de fichero en tu web, también tiene la opción de añadir
la siguiente etiqueta <META> en cada una de las páginas que no quiere que aparezca
en las búsquedas:
<META NAME="ROBOTS"
CONTENT="NOINDEX, NOFOLLOW">
Y como opción más
rebuscada, si las páginas de tu web son dinámicas puedes evaluar las peticiones
http identificar si el que hace la petición es el robot de algún buscador y
variar la información que le muestras. Por ejemplo, el HTTP_USER_AGENT del robot de
google se identifica como:
Mozilla/5.0 (compatible;
Googlebot/2.1; http://www.google.com/bot.html)
Conclusión:
El no aparecer en el buscador de
Google, como de cualquier otro, es tan fácil como esto. No entiendo el revuelo
que se forma porque aparezcan las noticias de la prensa digital en el buscador.
A no ser que el problema no sea que aparezca sino que no se cobre por ello, ¿tú
qué opinas?
No hay comentarios:
Publicar un comentario