domingo, 2 de marzo de 2014

Como NO aparecer en Google.

Todos intentamos no solo aparecer en Google, sino buscamos la manera de que aparezcamos en los primeros resultados. Tarea difícil que ha llegado a convertirse en toda una profesión. Pero si por alguna razón nos interesa todo lo contrario, en ese caso es muchísimo más fácil.
Los buscadores de internet y no solo Google, utilizan robots para recorrer las webs. Almacenan e indexas sus contenidos en sus bases de datos.

Como NO aparecer en Google

Si queremos que el contenido público de nuestra red no aparezca en las búsquedas de Google, podemos indicárselo muy fácilmente a los robots que recopila esa información. Tan fácil como añadir el fichero robots.txt con el siguiente contenido:

User-agent: *
Disallow: /


De esta forma indica a todos los robots que no inspecciones la información de tu web. Si por algún motivo no pudieras añadir este tipo de fichero en tu web, también tiene la opción de añadir la siguiente etiqueta <META> en cada una de las páginas que no quiere que aparezca en las búsquedas:

<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">


Y como opción más rebuscada, si las páginas de tu web son dinámicas puedes evaluar las peticiones http identificar si el que hace la petición es el robot de algún buscador y variar la información que le muestras. Por ejemplo, el HTTP_USER_AGENT del robot de google se identifica como:

Mozilla/5.0 (compatible; Googlebot/2.1; http://www.google.com/bot.html)

Conclusión:


               El no aparecer en el buscador de Google, como de cualquier otro, es tan fácil como esto. No entiendo el revuelo que se forma porque aparezcan las noticias de la prensa digital en el buscador. A no ser que el problema no sea que aparezca sino que no se cobre por ello, ¿tú qué opinas?

No hay comentarios:

Publicar un comentario