Disciplina centrada en la extracción de conocimiento a partir de datos. Precisa de la comprensión del dominio en el que se aplica. Emplea técnicas y teorías procedentes de muchos campos dentro de las matemáticas, estadística y tecnología de la información, incluyendo el procesamiento de señales, los modelos de probabilidad, aprendizaje automático, aprendizaje estadístico, programación de computadoras, ingeniería de datos, reconocimiento de patrones y aprendizaje, visualización, análisis predictivo, almacenamiento de datos y computación de alto rendimiento.