Tugurium/GTI  Glosario de Terminología Informática
HITS
> HITS
Algoritmo desarrollado por Jon Kleinberg en 1999 para intentar clasificar la importancia de un documento web. Este algoritmo se basa en la existencia de dos tipos importantes de sitios web, que ayudan a calcular mejor la relevancia de una página web.
El primero de ellos es el «hub», que agrupa a todos esos sitios web que, recibiendo muchos links, también enlazan a páginas web que consideran relevantes, por lo que el algoritmo confía en los «hubs» para determinar la importancia. Los grandes directorios, como DMOZ o Yahoo!, serían los grandes exponentes de este tipo de sitios.
El segundo tipo es el «authority», que agrupa a los sitios web que reciben una gran cantidad de links, porque otras páginas web estiman que son la referencia en un tema en concreto, y además disponen de muy pocos enlaces salientes. El algoritmo se basa en los «authorities» para buscar la información dentro de ellos.
A diferencia del algoritmo PageRank, que asigna una puntación a cada página web en función de los enlaces que recibe y el valor de éstos, el algoritmo HITS puntúa cada documento con dos valores: el «hub» y el «authority». El primero determina cómo de buena es una página como «recurso de enlaces» y el segundo valora a una página como «recurso de información».
Aunque el modelo de clasificación de relevancia de páginas web de Google está basado principalmente en PageRank, se sospecha que está teniendo en cuenta el enfoque de HITS para valorar en mayor o menor medida el peso de cada uno de los enlaces.
2006/04/03