Técnica del procesamiento del lenguaje natural, que consiste en analizar las relaciones entre un conjunto de documentos y los términos que contienen mediante la producción de un conjunto de conceptos relacionados con los documentos y los términos. El objetivo es encontrar un pequeño conjunto de variables latentes que representan las dependencias en una gran muestra de datos observados.