Indexación SEO

El objetivo de este artículo es brindarte una introducción al concepto de indexación y su rol actual en lo que respecta al posicionamiento web SEO) de un sitio web.

¿Qué es la indexación? ¿Cuál es su significado en SEO?

Cuando utilizamos el término indexación en SEO estamos haciendo referencia a las urls que los motores de búsqueda han procesado y almacenado en su Índice (Base de Datos).

Para simplificar, podríamos decir que al hablar de indexación estamos hablando de lo que los buscadores conocen sobre nuestro sitio web.

¿Cuál es su importancia?

Si tenemos en cuenta que el trabajo de optimización SEO consiste en optimizar lo que los motores de búsqueda conocen de un sitio web, llegaremos rápidamente a la conclusión de que la indexación es algo crucial al momento de posicionar un sitio web.

Desindexación de URLs

Probablemente en este punto te estarás preguntando... ¿Cómo puedo desindexar las URLs que no aportan valor?

Pues bien, existen varios métodos para desidexar una página web (url). A continuación te describiré cada uno de ellos y te explicaré cuándo y cómo es recomendable implementarlos:

NO INDEX en la meta-etiqueta "robots"

Para que los motores de búsqueda no indexen una url es suficiente con que en el encabezado de la url se haya incluido la meta-etiqueta "robots" con el atributo "noindex". Por ejemplo:

meta name="robots" content="noindex"

De esta manera, cuando los bots de los buscadores rastreen la url leerán el atributo "noindex" de la meta-etiqueta "robots" y sabrán que dicha url no debería ser incluida en su base de datos.

Si la url había sido previamente indexada, una vez que los buscadores procesen el atributo "noindex", será cuestión de tiempo hasta que la quiten de su índice (base de datos). No obstante, algunos motores de búsqueda brindan la posibilidad de acelerar este proceso. Por ejemplo, Google permite eliminar urls de su base de datos desde la herramienta Google Search Console (GSC, es Webmasters Tools).

Guía para desindexar una url de Google paso a paso con Google Search Console

1. Asegúrate de que la url a desindexar cuenta con el atributo "noindex" en la meta-etiqueta "robots".

2. Ingresa a Google Search Console (GSC).

3. Ingresa a la Propiedad para la cual deseas eliminar la url. Por ejemplo: https://tudominio.com [Previamente debes haber dado de alta la Propiedad en GSC]

4. Ingresa a la opción "Índice de Google".

5. Ingresa a la opción "Eliminación de URL".

6. Haz clic en el botón "Ocultar temporalmente".

7. Introduce la URL que quieres ocultar de tu sitio web y presiona el botón "Continuar". Por ejemplo: http://tudominio.com/url-que-no-aporta-valor.html

8. Selecciona el tipo de solicitud de eliminación y presiona el botón "Enviar solicitud". Si la URL se desea eliminar de forma permantente, se recomienda el uso de la opción "Ocultar temporalmente la página de los resultados de búsqueda y eliminarla de la caché".

Algunos aspectos a tener en consideración:

  • Una vez enviada la solicitud, esta podrá ser cancelada.
  • Si la solicitud ya fue procesada, se le podrá indicar a Google que vuelva a incluir a dicha URL en su Índice.
  • Tal como lo indica Google, será eliminada la URL indicada "así como todas las variaciones de http, https y con y sin www".
  • Este procedimiento debe realizarse URL por URL. Es decir, si se deben eliminar cientos o miles de URLs habrá que llevar a cabo este procedimiento cientos de miles de veces, una vez por cada URL.

Aquí encontrarás más detalles sobre la funcionalidad de Google Search Console para eliminar URLs

Redireccionamientos 301

Si una URL ha dejado de existir y su contenido se a trasladado a otra URL, podemos indicarle esto a Google mediante un redireccionamiento 301. Luego, con el tiempo, Google reorganizará su índice en base a este redireccionamiento y desindexará la URL que ya no existe.

Robots.txt... ¡NO DESINDEXA, SÓLO BLOQUEA EL ACCESO!

Si una URL aún no ha sido indexada por un buscador, podemos intentar evitar que esta URL sea indexada bloqueando su acceso vía robots.txt. No obstante es importante resaltar que esta acción sólo evitará que los robots (bots) lean el contenido de la URL, pero si esta tiene suficientes enlaces entrantes, puede ocurrir que igual aparecezca en sus índices, es decir, se indexe!

Si una URL ha sido indexada por un buscador, el bloquearla vía robots.txt no hará que esta URL se desindexe. Para desindexarla se deberán emplear los métodos explicados anteriormente, sin bloquearla desde el robots.txt! Luego, una vez desindexada, se podrá proceder a su bloqueo vía robots.txt si se considera necesario.

Htaccess

Podemos utilizar reglas en el archivo .htaccess para indicar que cierto tipo de archivos no deberían ser indexados. Esto es muy útil para la desindexación de archivos PDF, DOC o XLS.

¿Dónde puedo encontrar más información sobre Indexación y Desidexación de URLs?

A continuación te brindo algunos enlaces en los que encontrarás información muy útil sobre Indexación y Desindexación de URLs:

¿Cuál es la mejor manera de desindexar URLs? Lino Uruñuela