El KDD (Proceso de extracción de conocimiento) se define como:

“El descubrimiento de conocimiento en bases de datos es un campo de la inteligencia artificial de rápido crecimiento, que combina técnicas del aprendizaje de máquina, reconocimiento de patrones, estadística, bases de datos, y visualización para automáticamente extraer conocimiento (o información), de un nivel bajo de datos (bases de datos)”

El KDD es un área que está tomando importancia dado el crecimiento actual de las bases de datos (incluyendo bases de datos relacionales, bases de datos de objetos, bases de datos spatial-time y otras), y de la capacidad del hardware disponible para procesar estos datos.

Hay que tener en cuenta que el KDD no es un producto de software, sino un proceso compuesto de varias etapas. En estos tiempos están surgiendo herramientas con una gran cantidad de librerías que ayudan en cada uno de estos pasos.