¿Te has preguntado qué pasa detras de la pantalla cuando ponemos en el Google “los patos vuelan“?.
Para entender los fundamentos del SEO, y porqué optimizamos páginas para Google, es básico conocer a fondo cómo funciona el motor de búsqueda de Google . Hoy te lo vamos a explicar, así que tómate un par de minutos, respira hondo, y cuando estés listo entramos al mundo mágico de Google.
Si ya sabes cómo funciona Google y te interesan los últimos cambios introducidos en Google con Caffeine, no te pierdas: Google siempre se adapta: Google Caffeine.
El funcionamiento es un poco complejo, y está formado por distintos componentes, de los que hablaremos primero por separado, para ver despues cómo trabajan todos juntos. El primero de estos componentes es el Crawler, también llamado GoogleBot, o Spider.
Cómo funciona Google: Googlebot, Google Spider y el “Crawler”
El Google Spider/Bot es un programa que se dedica 24h al día a recorrer la web buscando nuevas páginas y nuevo contenido para analizar y mostrar en los resultados. No los indexa todavía, porque no tiene ninguna petición. Simplemente los recoge y los envía al Crawler que los analiza y guarda en su base de datos. Marca cúando ha pasado, qué contiene, donde está hospedada, etc… El Spider recoge y el Crawler analiza la página para almacenarla.
Este proceso sucede constantemente, y Google sólo muestra resultados que YA tiene almacenados. Así que si nuestra página no ha sido previamente rastreada y analizada por el Crawler , no aparecerá jamás en los resultados de búsqueda.
¿Cómo encuentra nuevas páginas y nuevo contenido?
Para poder analizar el mayor número posible de páginas en internet, el Spider empieza por las páginas que ya tiene en el índice y sigue sus links. Llega a otras páginas, y sigue sus links. Y así hasta recorrerse toda la red. Por eso se llama “spider“, Araña.
Un error común es pensar que este proceso sucede cada vez que pulsamos el botón buscar. Pero NO es así, este proceso sucede constantemente, y Google sólo muestra resultados que YA tiene en su índice. Así que si nuestra página no ha sido previamente rastreada por el Spider, no aparecerá jamás en los resultados de búsqueda.
A veces entra en tu site, rastrea una pagina, la almacena, se marcha por un link, y vuelve al cabo de unos días. El bot es lo que tiene… va a su aire. Si no queremos que siga los links de nuestra página, o simplemente queremos que NO la añada al índice, podemos usar los metatags:
<meta name=”robots” content=”noindex, nofollow” />
Podemos controlar cómo GoogleBot rastrea nuestro site usando Google Webmaster Tools.
¿Qué pasa si mi página no está enlazada desde ningún site?
Entonces Google no sabe que tienes nuevo contenido si no se lo dices. Cuando hagas una página nueva en tu site, o crees un portal nuevo, el crawler la debe analizar para guardarla en el índice. Puedes lograrlo de varias maneras:
- Enlanzando la página desde la home de tu site, y esperar.
- Enviar la URL a Google para que la indexe.
- Usar un sitemap.xml
- Usar el RSS de tu página/blog como sitemap.
¿Qué es el Sitemap?
El sitemap es un índice de los contenidos de nuestra página que enviamos al Spider de Google con todas nuestras URL’s, para que no se deje ni una a la hora de rastrear. Como normalmente se genera de manera automática, no tenemos que preocuparnos por hacer el submit cada vez que creamos una página nueva.
Si usas WordPress te recomiendo usar este Plugin para generar el Sitemap.xml.
Indexación
Una vez una página ha sido rastreada, toca que Google la someta a la famosa “indexación”. La indexación es un proceso más complejo por el cual Google analiza la página y la ordena en el índice según su importancia respecto a una palabra clave. Para ello realiza varios pasos como la eliminación de “stopwords“, plabras que no indexa como “el, la de, los, en” etcétera. Además, utiliza un algoritmo léxico por el cual es capaz de analizar e indexar palabras con sufijos, prefijos, tiempos verbales, sinónimos, etcétera.
Recuerda siempre que la filosofía Google es muy orientada al usuario, y debes escribir tus páginas webs para usuarios, no para bots. No hace falta que escribas “comprar vuelos Mallorca encontrar ofertas”. Puedes escribir perfectamente “encuentra las mejores ofertas y vuela a Mallorca por muy poco”. De hecho, Google apreciará el uso de sinónimos.
Google Query Processor
Aquí es donde entra en juego la mágia de Google. Cuando realizamos una búsqueda en Google, el texto que buscamos “los patos vuelan?” se envía a un servidor donde se procesa (el Query processor).
Lo primero que hace el Query Processor de Google es pedirle al índice todas las páginas que ha rastreado que contienen las palabras “patos vuelan“. Así, de los millones de páginas que hay en internet, se queda sólo con las que contengan estas palabras ¿para qué perder el tiempo buscando en las otras?
Por eso Google es tan rápido, porque NO busca en internet. Busca en su índice que está constantemente actualizado por el Spider.
Aún así recibe del ínidice un montón de páginas que contienen esas palabras clave. Ahora toca aplicar la formula mágica y encontrar lo que realmente quiere el usuario. Llega la hora de Rankear, y para ello Google usa dos herramientas: el Page Rank y el Algoritmo.
El Algoritmo
¿Qué es el famoso algoritmo de Google? Es la formula por la que Google analiza en los resultados que obtiene del índice si las palabras “pato” y “vuela” aparecen en la URL, si aparecen juntas, si están en el título, si están destacadas en negrita, si son el texto de un enlace, si hay sinónimos de las mismas, si aparecen en la descripción de la imágenes… así hasta más de 200 “preguntas” que, como podeis imaginar, son la madre del cordero del SEO.
El algoritmo de Google es como la formula de la CocaCola… sólo lo conocen menos de una docena de personas, y los ingenieros de Google trabajan en una parte de él pero nunca ven la formula entera. El algoritmo de Google cambia unas 300 veces al año, así que es algo en constante evolución.
Digamos que, de los cientos de miles de páginas, el Algoritmo escoge unas 500. ¿Cómo saber cuales son las más importantes o fiables y que mejor respuesta darán al usuario? Como es imposible saber esto de manera “automática”, Google aplica su lógica y lo deja en manos de los internautas decidir qué es lo importante. Estamos hablando, del Page Rank.
El Page Rank
El Page Rank (en adelante PR) es el sistema que utiliza Google para saber si una página es relevante o no para el usuario. Es un valor de 0 a 10 que puntúa la importancia de una página.
Y para puntuar una página, Google se fundamenta en esta suposición:
“El contenido más interesante y de mejor calidad, es el que tiene más enlaces“.
Y aún más: “El contenido enlazado desde páginas más importantes, debe ser importante“.
Es decir, que si una página que contiene “Patos vuelan” tiene enlaces desde páginas como “Wikipedia” o “La vanguardia” debe ser más importante que otra que no tiene muchos enlaces, o son enlaces desde sitios “malos” o sin PR.
El Page Rank se actualiza cada 3 meses aproximadamente, aunque se dice que Google trabaja con un Page Rank interno que se actualiza con más frecuencia. Desde mi experiencia en SEO y posicionamiento, yo creo en esta teoría.
Otras opiniones MUY a tener en cuenta, ponen en duda el Papel del Page Rank, sobre todo con los cambios después de Google Mayday que trataremos en el próximo Post. Para saber más sobre el tema, es imprescindible seguir a Javier Casares, uno de los mayores expertos en SEO de España.
Si quieres saber el PR de una página puedes usar extensiones de Page Rank para Chrome y Add-On de Firefox para Page Rank.
La página de Resultados
Es el momento de ponerlo todo junto, de Indexar. En el query processor se aplica el Algoritmo y el Page Rank a los resultados obtenidos del índice por “patos vuelan”, y los ordena segun los resultados. Se envía la página al servidor, que la muestra al usuario ¡y voilà !
¡ya tenemos la lista de Resultados! Todo en menos de un segundo.
Como veis, podemos usar algunos trucos para que Google nos tenga más en cuenta. SEO es simplemente la manera de optimizar nuestras páginas para que nuestra página sea mejor considerada que el resto por Google y aparezca más arriba en los resultados.
Ah… y se me olvidaba… la respuesta es SÍ. Gracias a Google sabemos que Los patos sí vuelan.
En el próximo episodio os contaremos como Google Caffeine ha cambiado el funcionamiento interno de Google.
Si te ha gustado este artículo… espero tus enlaces y tus comentarios, y no te pierdas:
Con la Edición de Javier Casares y Adriana Freixas
Si te ha gustado este artículo… espero tus enlaces y tus comentarios. ¡A Google le encantan los comentarios!








¡Los amantes incultos de Google te lo agradecemos, Xavi! En serio, el post se sale. Si no consigues un page rank máximo le enviaré personalmente un mensaje a Google para pedirle que lo incluya en su home!
Ya verás como las clases de M.ahora tienen mucho más sentido
Sensacional explicació Xavi. Enhorabona. Ho he enviat a tots els meus coneguts.
Xavier, para los del “equipo Marca” esto va a ser muy muy útil
thanks!
Gracias, para los del equipo “marca” será muy útil
¡Qué grande es leerte! No sé como se puede mirar el Pagerank porque aunque yo lo tengo acoplado en mi barra de herramientas de Google en el 90% de los casos me dice que “Google no ha valorado esta página”…. pero bueno, ya casi me estoy acostumbrando a que google me ignore en todas las peticiones que le hago (entre ellas posicionar mi blog)….
Leerte a ti es casi compartir el posgrado de Lasalle, es genial!!!!! (sobretodo para los que no tenemos fondos suficientes juarghhhzz).
Yo te tengo indexado en mi blogroll ¿Eso será un enlace de calidad? ¿Por qué es toooodooo tan complicado en el mundo del algoritmo??
Saludos y desde hoy, soy tu gruppie oficial…
Gloria
Hola Gloria!
Gracias por tu entusiasmo!! Es lo que nos mueve en top-rankin!!
Prometemos ser siempre cercanos y no como los blogs de los gurús que son frios y asepticos!!
Y como nos mueve el entusiasmo… hemos creado la página de facebook!
http://www.facebook.com/pages/Top-Rankin/130567330298286
te esperamos!!!
Fino fino estas fino!!! Gran explicación y lo más importante la facilidad que proporcionas al
entendimiento de los contenidos. Felicidades!
En este asunto del SEO me he propuesto aprender un punto nuevo cada día. Aunque, a veces aprender y resolver no van de la mano. Hoy entendí aquí, como lo explicaría Einstein lo que hay detras del Page Rank. Gracias por estar ahí.
La verdad es que estoy muy agradecido pr la informacion que ponene a disponsicion, de una manera entendible y facil de aplicar.
la verdad es que cuando la informacion es facil de comprender, se obtienen mejores resultados de parte del que la lee. ¿esto sera parte del algoritmo de google?, por lo tanto mas amistosa y util a la vez.
Muchas gracias por publicar, espero que lo sigan haciendo ya que es bueno permanecer actualizado.
Cumple la ley de la tres Bs (bueno, bonito y barato), es broma. Muy buen post, breve, conciso y claro. Gracias por compartir tus conocimientos y sapienzia