KDD

KDD (Knowledge Discovery in Databases) bedeutet zu Deutsch Erkenntnisgewinnung aus Datenbeständen. Es umfasst das geläufigere Data-Mining (data mining) und vorbereitende Analysen hierzu. Ziel des KDD ist die Erkennung bislang unbekannter fachlicher Zusammenhänge aus vorhandenen, meist großen Datenbeständen.
In Abgrenzung zum Data Mining umfasst KDD als Gesamtprozess auch die Vorbereitung der Daten sowie die Bewertung der Resultate.

  1. Die Teilschritte des KDD-Prozesses sind:
  2. Bereitstellung von Hintergrundwissen für den jeweiligen Fachbereich
  3. Definition der Ziele der Wissensfindung
  4. Datenauswahl
  5. Datenbereinigung
  6. Datenreduktion (z. B. durch Transformationen)
  7. Auswahl eines Modells, in dem das gefundene Wissen repräsentiert werden soll
  8. Data-Mining, die eigentliche Datenanalyse
  9. Interpretation der gewonnenen Erkenntnisse
← Glossar