Cómo funciona Google? Fundamentos del SEO

¿Te has preguntado qué pasa detras de la pantalla cuando ponemos en el Google “los patos vuelan“?.

como funciona google search

Para entender los fundamentos del SEO, y porqué optimizamos páginas para Google, es básico conocer a fondo cómo funciona el motor de búsqueda de Google . Hoy te lo vamos a explicar, así que tómate un par de minutos, respira hondo, y cuando estés listo entramos al mundo mágico de Google.

Si ya sabes cómo funciona Google y te interesan los últimos cambios introducidos en Google con Caffeine, no te pierdas: Google siempre se adapta: Google Caffeine.

El  funcionamiento es un poco complejo, y está formado por distintos componentes, de los que hablaremos primero por separado, para ver despues cómo trabajan todos juntos. El primero de estos componentes  es el Crawler, también llamado GoogleBot,  o Spider.

Cómo funciona Google: Googlebot, Google Spider y el “Crawler”

El Google Spider/Bot es un programa que se dedica 24h al día a recorrer la web buscando nuevas páginas y nuevo contenido para analizar y mostrar en los resultados. No los indexa todavía, porque no tiene ninguna petición. Simplemente los recoge y los envía al Crawler que los analiza y guarda en su base de datos. Marca cúando ha pasado, qué contiene, donde está hospedada, etc… El Spider recoge y el Crawler analiza la página para almacenarla.

Este proceso sucede constantemente, y Google sólo muestra resultados que YA tiene almacenados. Así que si nuestra página no ha sido previamente rastreada y analizada por el Crawler , no aparecerá jamás en los resultados de búsqueda.

¿Cómo encuentra nuevas páginas y  nuevo contenido?

Para poder analizar el mayor número posible de páginas en internet, el Spider empieza por las páginas que ya tiene en el índice y sigue sus links. Llega a otras páginas, y sigue sus links. Y así hasta recorrerse toda la red. Por eso se llama “spider“, Araña.

Un error común es pensar que este proceso sucede cada vez que pulsamos el botón buscar. Pero NO es así, este proceso sucede constantemente, y Google sólo muestra resultados que YA tiene en su índice. Así que si nuestra página no ha sido previamente rastreada por el Spider, no aparecerá jamás en los resultados de búsqueda.

como funciona el spider crawler de google

A veces entra en tu site,  rastrea una pagina, la almacena, se marcha por un link, y vuelve al cabo de unos días. El bot es lo que tiene… va a su aire. Si no queremos que siga los links de nuestra página, o simplemente queremos que NO la añada al índice, podemos usar los metatags:

<meta name=”robots” content=”noindex, nofollow” />

Podemos controlar cómo GoogleBot rastrea nuestro site usando Google Webmaster Tools.

¿Qué pasa si mi página no está enlazada desde ningún site?

Entonces Google no sabe que tienes nuevo contenido si no se lo dices. Cuando hagas una página nueva en tu site, o crees un portal nuevo, el crawler la debe analizar para guardarla en el índice. Puedes lograrlo de varias maneras:

¿Qué es el Sitemap?

El sitemap es un índice de los contenidos de nuestra página que enviamos al Spider de Google con todas nuestras URL’s, para que no se deje ni una a la hora de rastrear. Como normalmente se genera de manera automática, no tenemos que preocuparnos por hacer el submit cada vez que creamos una página nueva.
Si usas WordPress te recomiendo usar este Plugin para generar el Sitemap.xml.

Indexación

Una vez una página ha sido rastreada, toca que Google la someta a la famosa “indexación”. La indexación es un proceso más complejo por el cual Google analiza la página y la ordena en el índice según su importancia respecto a una palabra clave. Para ello realiza varios pasos como la eliminación de “stopwords“, plabras que no indexa como “el, la de, los, en” etcétera. Además, utiliza un algoritmo léxico por el cual es capaz de analizar e indexar palabras con sufijos, prefijos, tiempos verbales, sinónimos, etcétera.

Recuerda siempre que la filosofía Google es muy orientada al usuario, y debes escribir tus páginas webs para usuarios, no para bots. No hace falta que escribas “comprar vuelos Mallorca encontrar ofertas”. Puedes escribir perfectamente “encuentra las mejores ofertas y vuela a Mallorca por muy poco”. De hecho, Google apreciará el uso de sinónimos.

Google Query Processor

Aquí es donde entra en juego la mágia de Google. Cuando realizamos una búsqueda en Google, el texto que buscamos “los patos vuelan?” se envía a un servidor donde se procesa (el Query processor).

Lo primero que hace el Query Processor de Google es pedirle al índice todas las páginas que ha rastreado que contienen las palabras “patos vuelan“. Así, de los millones de páginas que hay en internet, se queda sólo con las que contengan estas palabras ¿para qué perder el tiempo buscando en las otras?

Por eso Google es tan rápido, porque NO busca en internet. Busca en su índice que está constantemente actualizado por el Spider.

Aún así recibe del ínidice un montón de páginas que contienen esas palabras clave. Ahora toca aplicar la formula mágica y encontrar lo que realmente quiere el usuario.  Llega la hora de Rankear, y para ello Google usa dos herramientas: el Page Rank y el Algoritmo.


como funciona el google query processor

El Algoritmo

¿Qué es el famoso algoritmo de Google? Es la formula por la que Google analiza en los resultados que obtiene del índice si las palabras “pato” y “vuela” aparecen en la URL, si aparecen juntas, si están en el título, si están destacadas en negrita, si son el texto de un enlace, si hay sinónimos de las mismas, si aparecen en la descripción de la imágenes… así hasta más de 200 “preguntas” que, como podeis imaginar, son la madre del cordero del SEO.

El algoritmo de Google es como la formula de la CocaCola… sólo lo conocen menos de una docena de personas, y los ingenieros de Google trabajan en una parte de él pero nunca ven la formula entera. El algoritmo de Google cambia unas 300 veces al año, así que es algo en constante evolución.

Digamos que, de los cientos de miles de páginas, el Algoritmo escoge unas 500. ¿Cómo saber cuales son las más importantes o fiables y que mejor respuesta darán al usuario? Como es imposible saber esto de manera “automática”, Google aplica su lógica y lo deja en manos de los internautas decidir qué es lo importante. Estamos hablando, del Page Rank.

Como funciona el algoritmo de google

El Page Rank

El Page Rank (en adelante PR) es el sistema que utiliza Google para saber si una página es relevante o no para el usuario. Es un valor de 0 a 10 que puntúa la importancia de una página.

Y para puntuar una página, Google se fundamenta en esta suposición:

El contenido más interesante y de mejor calidad, es el que tiene más enlaces“.

Y aún más: “El contenido enlazado desde páginas más importantes, debe ser importante“.

Es decir, que si una página que contiene “Patos vuelan” tiene enlaces desde páginas como “Wikipedia” o “La vanguardia” debe ser más importante que otra que no tiene muchos enlaces, o son enlaces desde sitios “malos” o sin PR.

como funciona el page rank de google

El Page Rank se actualiza cada 3 meses aproximadamente, aunque se dice que Google trabaja con un Page Rank interno que se actualiza con más frecuencia. Desde mi experiencia en SEO y posicionamiento, yo creo en esta teoría.

Otras opiniones MUY a tener en cuenta, ponen en duda el Papel del Page Rank, sobre todo con los cambios después de Google Mayday que trataremos en el próximo Post. Para saber más sobre el tema, es imprescindible seguir a Javier Casares, uno de los mayores expertos en SEO de España.

Si quieres saber el PR de una página puedes usar extensiones de Page Rank para Chrome y Add-On de Firefox para Page Rank.

La página de Resultados

Es el momento de ponerlo todo junto, de Indexar. En el query processor se aplica el Algoritmo y el Page Rank a los resultados obtenidos del índice por “patos vuelan”, y los ordena segun los resultados. Se envía la página al servidor, que la muestra al usuario ¡y voilà !

gráfico de como funciona google

¡ya tenemos la lista de Resultados! Todo en menos de un segundo.

Como veis, podemos usar algunos trucos para que Google nos tenga más en cuenta. SEO es simplemente la manera de optimizar nuestras páginas para que nuestra página sea mejor considerada que el resto por Google y aparezca más arriba en los resultados.

Ah… y se me olvidaba… la respuesta es SÍ. Gracias a Google sabemos que Los patos sí vuelan.

En el próximo episodio os contaremos como Google Caffeine ha cambiado el funcionamiento interno de Google.

Si te ha gustado este artículo… espero tus enlaces y tus comentarios, y no te pierdas:

Con la Edición de Javier Casares y Adriana Freixas

Si te ha gustado este artículo… espero tus enlaces y tus comentarios. ¡A Google le encantan los comentarios! 😉

, , ,

23 Responses to Cómo funciona Google? Fundamentos del SEO

  1. Adriana 14 junio, 2010 at 9:25 #

    ¡Los amantes incultos de Google te lo agradecemos, Xavi! En serio, el post se sale. Si no consigues un page rank máximo le enviaré personalmente un mensaje a Google para pedirle que lo incluya en su home! 😉

  2. Xavier Colomés 14 junio, 2010 at 9:28 #

    Ya verás como las clases de M.ahora tienen mucho más sentido 🙂

  3. Odón 14 junio, 2010 at 10:07 #

    Sensacional explicació Xavi. Enhorabona. Ho he enviat a tots els meus coneguts.

  4. Raul 14 junio, 2010 at 10:10 #

    Xavier, para los del “equipo Marca” esto va a ser muy muy útil
    thanks!

  5. Raul 14 junio, 2010 at 10:36 #

    Gracias, para los del equipo “marca” será muy útil

  6. @gloriaalgorta 18 junio, 2010 at 13:52 #

    ¡Qué grande es leerte! No sé como se puede mirar el Pagerank porque aunque yo lo tengo acoplado en mi barra de herramientas de Google en el 90% de los casos me dice que “Google no ha valorado esta página”…. pero bueno, ya casi me estoy acostumbrando a que google me ignore en todas las peticiones que le hago (entre ellas posicionar mi blog)….

    Leerte a ti es casi compartir el posgrado de Lasalle, es genial!!!!! (sobretodo para los que no tenemos fondos suficientes juarghhhzz).

    Yo te tengo indexado en mi blogroll ¿Eso será un enlace de calidad? ¿Por qué es toooodooo tan complicado en el mundo del algoritmo??

    Saludos y desde hoy, soy tu gruppie oficial…
    Gloria

    • Xavier Colomés 18 junio, 2010 at 14:09 #

      Hola Gloria!

      Gracias por tu entusiasmo!! Es lo que nos mueve en top-rankin!! 😉 Prometemos ser siempre cercanos y no como los blogs de los gurús que son frios y asepticos!!

      😉

    • Xavier Colomés 18 junio, 2010 at 14:10 #

      Y como nos mueve el entusiasmo… hemos creado la página de facebook!

      http://www.facebook.com/pages/Top-Rankin/130567330298286

      te esperamos!!!

  7. vicente 15 septiembre, 2010 at 9:32 #

    Fino fino estas fino!!! Gran explicación y lo más importante la facilidad que proporcionas al

    entendimiento de los contenidos. Felicidades!

  8. Adolfo Portiz 7 enero, 2011 at 21:05 #

    En este asunto del SEO me he propuesto aprender un punto nuevo cada día. Aunque, a veces aprender y resolver no van de la mano. Hoy entendí aquí, como lo explicaría Einstein lo que hay detras del Page Rank. Gracias por estar ahí.

  9. Cristian 16 enero, 2011 at 13:52 #

    La verdad es que estoy muy agradecido pr la informacion que ponene a disponsicion, de una manera entendible y facil de aplicar.

    la verdad es que cuando la informacion es facil de comprender, se obtienen mejores resultados de parte del que la lee. ¿esto sera parte del algoritmo de google?, por lo tanto mas amistosa y util a la vez.

    Muchas gracias por publicar, espero que lo sigan haciendo ya que es bueno permanecer actualizado.

  10. Santi 15 agosto, 2011 at 19:46 #

    Cumple la ley de la tres Bs (bueno, bonito y barato), es broma. Muy buen post, breve, conciso y claro. Gracias por compartir tus conocimientos y sapienzia

  11. jose 9 febrero, 2012 at 23:19 #

    perfecto, imformativo y confiable

Trackbacks/Pingbacks

  1. La selección de IA XXXVII | Blog de Marketing Online | Internet Advantage - 18 junio, 2010

    […] Top Rankin se han preguntado Cómo funciona Google y lo han explicado en un más que interesante artículo para todos aquellos que tengan dudas o no […]

  2. En manos de un algoritmo | No me digas que fue un sueño - 2 agosto, 2010

    […] El funcionamiento interno de un motor de búsqueda siempre me había parecido algo imposible de entender hasta que que mi compañero de postgrado en La Salle Xavier Colomés publico un artículo sensacional en su blog Top Rankin, cuya lectura os recomiendo: ¿Cómo funciona Google? […]

  3. El posicionamiento no es sólo SEO | Top-Rankin - 8 agosto, 2010

    […] una estrategia de posicionamiento completa. En Top Rankin  hemos hablado largo y tendido de cómo funciona Google. Pero Google es solo media parte del proceso de búsqueda. La otra media es el usuario, así que […]

  4. Search queries en Google Webmaster Tools | Top-Rankin - 6 octubre, 2010

    […] Lo que queremos aquí es buscar KW que pueden mejorar, y analizar porqué no están más arriba. ¿Es un problema de Page Rank? ¿Está la Palabra clave al principio del título? ¿Está penalizada por contenido duplicado? Ya […]

  5. Guía SEO SEM SMO | Joost Scharrenberg - 5 noviembre, 2010

    […] relacionados con el SEO, SEM y SMO: Fundamentos de SEO: ¿Cómo funciona Google? Adaptar el SEO a la nueva era de Social Media y Social Search 7 tareas SEO para un nuevo sitio web […]

  6. Qué es Blekko y cómo funcionan los slashtags | Top-Rankin - 9 noviembre, 2010

    […] Cómo funciona Google / Fundamentos del SEO […]

  7. El valor de la marca personal | No me digas que fue un sueño - 20 diciembre, 2010

    […] de la red y de los buscadores porque una maquina sin sentimientos considera en base a un algoritmo matemático que no somos los bastante importantes para aparecer en una […]

  8. ¿A tu edad todavía crees Page Rank? | Top-Rankin - 3 enero, 2011

    […] No sea rastreado y así no se nos pierda el spider […]

  9. De Google, Nietzsche y Javier Casares: "Dios ha muerto" | Top-Rankin - 14 febrero, 2011

    […] víctima de piratas, consultores de buena fé, spammers y otros SEO cuya premisa no siempre ha sido entender el algoritmo y centrarse en el […]

  10. Google se mueve: Larry Page, Panda Update y +1 | Top-Rankin - 18 abril, 2011

    […] su día explicamos “cómo funciona Google” para todos los públicos. Más tarde explicamos el Google Caffeine, el nuevo sistema de […]

Deja un comentario