La indexación es una acción cuyo objetivo es incluir en un índice (directorio) una o más URLs o una página web completa. Esta acción no es directa, es decir, no depende de forma directa de un webmaster o un propietario de una página web, sino más bien el propietario o webmaster solicita la indexación de una web o una URL de un sitio web a Google (u otro buscador) y es este el que lleva a cabo la indexación.
También cabe decir que no es totalmente necesaria esa solicitud, ya que por defecto Google indexa todas las URLs que rastrea, a no ser que se lo impidamos o que estas URLs no cumplan con las directrices del buscador.
Dicho esto, debemos tener en cuenta muchos factores y acciones concretas que podemos llevar a cabo, así como los tipos de indexación. En este artículo veremos todo eso, así que sí estás preparad@ ¡comencemos!
Tipos de indexación
Lo primero que debemos tener en cuenta es que existen dos tipos de indexación dependiendo dependiendo de rastreo que se haya llevado a cabo por parte del bot o araña (en el caso que nos atañe, GoogleBot).
Indexación superficial
La indexación superficial es aquella en la que el buscador solo incluye en su índice parte del contenido. Este tipo de indexación se suele llevar a cabo cuando una web o una URL es nueva.
Cuando esto ocurre esa URL o web entra en «sandbox», es decir la URL o el sitio web está sometido a un «filtro» por el cuál el algoritmo aún no «tiene claro» en qué ubicación de las SERP (página de resultado de búsqueda) debe incluir a dicha URL. Dicho de otro modo, cuando una web es nueva (o una URL) Google realiza un rastreo y una indexación superficial, esta indexación evita que las posiciones en Google sean estables.
Notarás que un día estás en una posición, otro día en otra…
Esto sucede porque Google, antes de dar un puesto fijo a una nueva URL, tiene que realizar una indexación profunda.
Indexación profunda
La indexación profunda es aquella en la que el bot sí ha rastreado la totalidad del contenido de la URL y a incluido en el índice el código fuente al completo.
Una vez que se lleva a cabo este tipo de indexación, la URL o el dominio desaparece de la sandbox.
Ojo, eso no quiere decir que a partir de entonces las fluctuaciones de posiciones desaparezcan, sino que éstas serán menos acentuadas.
No te preocupes porque tu web esté en una primera etapa en la sandbox, es cuestión de tiempo que salga de ella, y no tanto como crees.
Cómo indexar una web en Google
Realmente no debemos hacer nada, nada. Google indexa por defecto y automáticamente tu web sin necesidad de que tu hagas nada. Es más, debes preocuparte mas por evitar que rastree ciertas URLs que no interesan que por que se rastree tu web.
Aún así, puede que quieras indexar tu web en google de forma manual manualmente (cuando digo indexar quiero decir pedir a Google…).
Si es el caso, lo único que tienes que hacer es lo siguiente:
- Abre la página que quieres enviar a indexar desde cualquier navegador.
- Copia la URL
- Dirígete a la propiedad de tu dominio de Search Console. Si no tienes configurada una propiedad de dominio, crea una aquí.
- Cliquea en el apartado «inspeccionar URL»
- Pega la URL en el campo (recuadro) que te aparecerá
- Pulsa la tecla enter
- Espera unos segundos a que la herramienta recopile datos de la URL
- Por último cliquea en «solicitar indexación»
Después de esto la URL se pondrá en cola, y si no hay nada que se lo impida la indexará. El tiempo transcurrido entre la petición y la indexación variará según el presupuesto de rastreo que tenga tu web.
Pero claro, como he comentado, todo esto pasa si no se lo estás impidiendo.
Cómo saber si estás impidiendo la indexación de tu web
Para saber si estás impidiendo la indexación de tu web tienes varios métodos. Yo te voy a enseñar el más sencillo de todos, al menos para mí:
- Abre en cualquier navegador la página web que quieres verificar
- Cliquea en cualquier parte de la página que no contenga un elemento
- En el menú que te aparecerá cliquea en «ver código fuente»
- Pulsa control + f (en windows) o comd + f (en mac)
- En el buscador que te aparecerá escribe «noindex»
Si te aparece «noindex» dentro de una meta etiqueta similar a esta:
<meta name=»robots» content=»noindex» />
…tienes un problema, ya que tu URL no se indexará.
Otra causa, aunque no es segura de que alguna de tus urls, o tu web al completo no esté indexando, es que estés impidiendo el rastreo por el robots.txt
Si tienes alguna ruta cerrada o la web con el siguiente comando, es complicado que indexe:
User-agent: *
Disallow: ruta
Disallow: /
Por cierto, la ruta del robots.txt es: www.midominio.com/robots.txt
Todo esto está muy bien, pero puede que estés aquí, no porque necesites indexar tu web en Google, sino por todo lo contrario.
Cómo eliminar páginas indexadas por Google
O mejor dicho, como desindexar una URL de Google Index.
Vamos con ello:
Simplemente incluimos la meta-etiqueta (en el head) <meta name=»robots» content=»noindex» /> en la página que quieres desindexar.
Y si te quieres que además esa página no sea rastreada incluyes esta <meta name=»robots» content=»noindex, nofollow» />
Con eso te aseguras de que no indexe.
¿Quieres ir más allá?
OK.
Incluye esto en tu robots.txt:
Disallow: /url-que-quieres-desindexar/
Ya con eso tienes asegurado la desindexación.
Espero que este contenido haya servicio.
Si tienes alguna duda, pregúntame en los comentarios.
Espero verte pronto por aquí de nuevo.
Y recuerda, si necesitas a un consultor SEO, no dudes en contactarme.
Saludos.