En octubre de 2005 os hablábamos sobre BigTable, el sistema de almacenamiento de datos creado por Google para gestionar el ingente volumen de información que poseen las diferentes aplicaciones, del que se publicaron más detalles el año pasado.
Una de las utilidades de BigTable es almacenar información del rastreo de GoogleBot, y en filas de tablas multidimensionales se guardan, por ejemplo, valores de URLs de documentos web, y en las columnas diversos valores: el contenido HTML de dicha URL, el idioma del documento web o los enlaces a otros documentos. Todos estas celdas guardan, además, los datos temporales que han ido tomando.
Con ello, además de poder lanzar un servicio similar a 'archive.org' con la evolución de los contenidos de las páginas web a lo largo del tiempo, Google puede también tener en cuenta si una página web ha ido cambiando los enlaces a otras páginas. Así por ejemplo, si hemos conseguido cientos de enlaces hacia una de nuestras páginas web con una campaña de 'linkbaiting', y posteriormente desde esta página web insertamos un link hacia uno de nuestros productos, cabría pensar que Google no ofrezca el mismo peso a este nuevo enlace a la hora de calcular el PageRank de la página del producto.
Además de poder suponerlo o no, ahora tenemos la certeza (aunque Google no tiene por qué estar utilizándolo) de que están contemplando esta posibilidad. Y es que hoy mismo algunos trabajadores de la compañía (Matt Cutts, entre ellos) han patentado un sistema en el que la relevancia de una página web es función del comportamiento de los enlaces a lo largo del tiempo. Tal y como se afirma en la patente: "un sistema que determina el comportamiento a través del tiempo de los enlaces apuntando a un documento, que establece una puntuación para ese documento (basada, al menos en parte, en dicho comportamiento a través del tiempo de los enlaces que apuntan a él). Dicha puntuación se utilizará, en parte, para clasificar la relevancia del documento".
Igualmente, hoy mismo las mismas personas que han patentado este sistema han hecho lo mismo con otro (ver documento) que establece una puntuación para un documento web en función de la fecha en la que éste fue creado. Esta patente parece confirmar el conocido como 'efecto Sandbox', el filtro especial del buscador web de Google para evitar que los sitios web de nueva creación obtengan rápidamente un buen posicionamiento para sus palabras claves.
Fuente: Google.Dirson.com
Una de las utilidades de BigTable es almacenar información del rastreo de GoogleBot, y en filas de tablas multidimensionales se guardan, por ejemplo, valores de URLs de documentos web, y en las columnas diversos valores: el contenido HTML de dicha URL, el idioma del documento web o los enlaces a otros documentos. Todos estas celdas guardan, además, los datos temporales que han ido tomando.
Con ello, además de poder lanzar un servicio similar a 'archive.org' con la evolución de los contenidos de las páginas web a lo largo del tiempo, Google puede también tener en cuenta si una página web ha ido cambiando los enlaces a otras páginas. Así por ejemplo, si hemos conseguido cientos de enlaces hacia una de nuestras páginas web con una campaña de 'linkbaiting', y posteriormente desde esta página web insertamos un link hacia uno de nuestros productos, cabría pensar que Google no ofrezca el mismo peso a este nuevo enlace a la hora de calcular el PageRank de la página del producto.
Además de poder suponerlo o no, ahora tenemos la certeza (aunque Google no tiene por qué estar utilizándolo) de que están contemplando esta posibilidad. Y es que hoy mismo algunos trabajadores de la compañía (Matt Cutts, entre ellos) han patentado un sistema en el que la relevancia de una página web es función del comportamiento de los enlaces a lo largo del tiempo. Tal y como se afirma en la patente: "un sistema que determina el comportamiento a través del tiempo de los enlaces apuntando a un documento, que establece una puntuación para ese documento (basada, al menos en parte, en dicho comportamiento a través del tiempo de los enlaces que apuntan a él). Dicha puntuación se utilizará, en parte, para clasificar la relevancia del documento".
Igualmente, hoy mismo las mismas personas que han patentado este sistema han hecho lo mismo con otro (ver documento) que establece una puntuación para un documento web en función de la fecha en la que éste fue creado. Esta patente parece confirmar el conocido como 'efecto Sandbox', el filtro especial del buscador web de Google para evitar que los sitios web de nueva creación obtengan rápidamente un buen posicionamiento para sus palabras claves.
Fuente: Google.Dirson.com
Comentarios
Publicar un comentario