SEO: La indexación

Definición de Indexación

Indexación es la acción por la cual las páginas web son encontradas por los Motores de Búsqueda y almacenan la información en sus servidores.

Los Motores de Búsqueda rastrean e indexan las páginas web que hay en internet mediante los enlaces o links que hay entre ellas, por eso es muy popular la frase “si nadie te enlaza no existes” porque los Motores de Búsqueda no podrán encontrar tu web.

A día de hoy esta afirmación no es 100% cierta ya que existen herramientas que nos ayudan a que los Motores de Búsqueda puedan encontrar nuestra web e indexar todas las páginas que la contienen.

Ayuda a los Motores de búsqueda para que te indexen

–          Sitemap.xml: Archivo básico que deben tener todas las páginas web en su servidor. Este archivo contiene todas las URLs que queremos que los Motores de Búsqueda rastreen e indexen. Se puede personalizar indicando cada cuanto se actualiza esa URL, qué peso tiene esa URL en tu web, la fecha en la que fue creada, etc.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.misitio.es/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
 <priority>0.8</priority>
</url></urlset>

 

Si tu sitio web no es muy grande puedes hacer manualmente el archive pero deberás actualizarlo cada vez que añadas una página nueva al site.

Para sitios web de menos de 500 URLs se puede usar esta herramienta online gratuita de generador de sitemap.xml http://www.xml-sitemaps.com/ y si nuestro sitio es más grande ofrece una versión de pago.

Si tenemos un sitio web con subdominios o secciones con muchas páginas se debe hacer un sitemap.xml por cada una. No es obligatorio que el nombre del archivo sea “sitemap.xml” y podemos nombrar los archivos como: sitemap-seccion1.xml, sitemap-seccion2.xml, etc luego tenemos que acordarnos de comunicarle a los Motores de búsqueda cómo se llaman todos nuestros archivos.

En los sitios web gestionados por un CMS (Gestor de contenidos) lo ideal es que el propio gestor sea capaz de crear y actualizar automáticamente este archivo.

–          urllist.txt: Este archivo hace la misma función que el sitemap.xml pero a nivel básico. Es un listado de todas las URLs del sitio web y sólo es usado por Yahoo!. También se coloca en la raíz del dominio.

–          Robots.txt: Este es otro archivo básico que hay que tener en nuestro servidor. El robots.txt contiene los directorios de nuestra web que no queremos que los Motores de búsqueda indexen como carpetas de CSS o aquellas que sí queremos que las lean, por ejemplo le indicaremos la dirección exacta de donde hemos alojado el archivo sitemap.xml.  Por defecto el sitemap.xml se coloca en la raíz del sitio web pero no siempre tiene que ser así.

User-agent: *
Disallow: /css/
Allow: http://www.misitio.es/sitemap.xml

 

–          Archivos de verificación: Bing, Yahoo! Y Google nos ofrecen herramientas propias para comunicarles directamente que tenemos una web y queremos que la indexen. Estas herramientas han ido evolucionando y proporcionan mucha información sobre cómo el Motor de Búsqueda está indexando tu página web, por ejemplo: te indica el Nº de páginas indexadas que tiene de tu web, el Nº de enlaces que ha detectado que apuntan a tu sitio, errores que ha encontrado al rastrear tu web, etc.

Tener la verificación de los principales Motores de Búsqueda no es imprescindible pero es muy aconsejable tenerlo ya que nos aportan mucha información y todos tienen la opción de poder enviarles directamente la dirección de tu sitemap.xml para que lo vean:

Para verificar tu sitio web con estas herramientas lo único que necesitas es:

  • Crear una cuenta de cada una de estas herramientas, para eso necesitas tener una cuenta de correo de cada uno de ellos (Hotmail, Yahoo y Gmail).
  • Una vez creada la cuenta, te descargas el archivo de verificación y lo subes a la raíz del dominio.
  • Vuelves a la herramienta e indicas que te verifique tu dominio. A partir de aquí el Motor de Búsqueda empezará a darte la información que tiene sobre tu web

Una vez empecemos a tener datos podremos comprobar si los Motores de Búsqueda están indexando todas las páginas de nuestro site o si faltan algunas en cuyo caso habrá que investigar el motivo. También podemos encontrarnos con que se estén indexando partes de nuestra web que no queremos, por ejemplo Yahoo! suele indexar archivos de programación (css, js, etc) que no nos interesan y tendremos que bloquear el acceso a través del robots.txt y desde la herramienta del Buscador solicitar que eliminen esos archivos de sus servidores.

Comprueba cuantas páginas tienen los Motores de Búsqueda indexadas de tu web

Escribe en la caja de búsqueda de cada Buscador site:elnombredetuweb.es


Ahora, en función de los resultados que tengas y sabiendo el Nº de páginas que tiene tu site puedes trabajar la indexación de tu sitio web

Actualización 23 Noviembre 2011

El pasado 21 de Noviembre fué el último día de funcionamiento de la herramienta para Webmaster de Yahoo!, ahora los datos de Yahoo! se han unificado en la herramienta para webmaster de Bing. Podéis leer los comunicados oficiales aquí:

http://www.ysearchblog.com/2011/07/08/site-exploror-7-8-11/

http://www.ysearchblog.com/2011/09/14/site-explorer-transition-to-bing-webmaster-tools/

 

 

 

Beatriz Mariscal @Beamariscal

“Las conversaciones en red hacen posible el surgimiento de nuevas y poderosas formas de organización social y de intercambio de conocimientos.” Manifiesto Cluetrain

Beatriz Mariscal

Beatriz Mariscal, Diplomada en Artes visuales y comunicación por la Escuela TRACOR y eMaster en Dirección de Marketing y comunicación por la UOC. Lleva desde 2005 trabajando en internet como SEO y actualmente es Responsable de la web de  www.directseguros.es . Tiene un blog sobre SEO y Marketing Online “Nextcache.com”.


Bea Mariscal

Desde 2010 Responsable web de DirectSeguros.es. Lleva desde el 2005 trabajando en Marketing online. En Noviembre 2011 terminó el Master en Dirección de Marketing y Comunicación.
Le apasiona internet y en especial los e-commerce: “No existe producto o servicio aburrido siempre que exista libertad para aplicar estrategias de marketing nuevas”, “Escoge un trabajo que ames, y no tendrás que trabajar un único día de tu vida”.
Su especialidad son los proyectos web para aumentar los porcentajes de conversión tanto para las zonas informativas como las transaccionales. Sus inquietudes laborales son todo lo que le incite a investigar, pensar, experimentar, y por eso le gusta todo lo relacionado con el Marketing Online y el eCommerce, la investigación de mercados, el Tráfico web, la Analítica, la Optimización y la Persuabilidad….

Facebook Twitter LinkedIn 

4 Responses to SEO: La indexación

  1. Ana noviembre 22, 2011 at 9:16 pm #

    Hola beatriz.
    Cual puede ser el motivo de que el buscador tenga indexadas un numero mucho mayor que paginas tiene el site? Como podemos saber donde esta el problema?
    Tengo una mala noticia. Yahoo site explorer murio ayer 21 de noviembre
    Lo he sabido por este obituario
    http://www.seomoz.org/blog/yahoo-sunsets-site-explorer-a-eulogy
    Descanse en paz.
    Gracias Beatriz!

  2. Bea Mariscal noviembre 23, 2011 at 11:14 am #

    Hola!

    Suele ocurrir que tengas más páginas indexadas de las que tienes en tu site. Esto se debe a que los buscadores estén indexando por ejemplo:
    http://www.tusitioweb.es/seccion/ y http://www.tusitioweb.es/seccion/index.html como páginas distintas: Problema. Tienes URLs duplicadas.
    – URLs antiguas que ya no estén en la navegación del site pero que el buscador las tenga indexada o te estén enlazando desde algún sitio. Problema: tienes páginas obsoletas que pueden empezar a tener errores y que no te están aportando nada.
    – Indexación de archivos PDF, flash, css, etc

    Para solucionar estos problemas tendrás que bucear en las páginas que tiene el buscador indexadas para detectar exactamente qué está indexando. Desde la herramienta para webmaster de Bing sección “Rastrear > Detalles de rastreo” puedes descargar las URLs que tienes indexadas por Bing.

    Y sobre Yahoo! llevas razón :) actualizo el post. Gracias!

  3. Ana noviembre 24, 2011 at 7:45 am #

    Voy a investigar entonces.
    Muchas gracias a tí por tu ayuda!

Trackbacks/Pingbacks

  1. Mundo SEO Completo! | SUPERONLINE NETWORK VENEZUELA - enero 11, 2013

    […] SEO: La indexación […]

Hecho con cariño desde Madrid por las Madrid Geek Girls.