Tugurium/GTI

Glosario Terminología Informática

term frequency – inverse document frequency

0 tf-idf
Medida numérica que expresa cuán relevante es una palabra para un documento en una colección. Esta medida se utiliza a menudo como un factor de ponderación en la recuperación de información y la minería de textos. El valor tf-idf aumenta proporcionalmente al número de veces que una palabra aparece en el documento, pero es compensada por la frecuencia de la palabra en la colección de documentos, lo que permite manejar el hecho de que algunas palabras son generalmente más comunes que otras. Las variaciones del esquema de ponderación son a menudo utilizadas por los motores de búsqueda como una herramienta central para puntuar y clasificar la relevancia de un documento en función de la consulta del usuario. Puede utilizarse con éxito para el filtrado de palabras clave en diversos campos temáticos, incluyendo la síntesis y clasificación de textos.
2018-12-13