Data Mining

Unter Data Mining (englisch für „Datenschürfen“) versteht man die systematische Anwendung von Methoden, die meist statistisch-mathematisch begründet sind, auf einen Datenbestand mit dem Ziel der Mustererkennung. Hierbei geht es vor allem um das Durchsuchen sehr großer Datenbestände, weswegen vor allem solche Methoden betrachtet werden, die eine hervorragende asymptotische Laufzeit haben.
Bei Verzicht auf Modellannahmen über den Datenentstehungsprozess ergeben sich auch bei kleinen oder mittleren Datenbeständen sinnvolle Anwendungsmöglichkeiten. In der Praxis, vor allem im deutschen Sprachgebrauch, etablierte sich der angelsächsische Begriff „Data Mining“ für den gesamten Prozess der so genannten „Knowledge Discovery in Databases“.
Im Data Mining beschreibt ein Modell die Zusammenhänge zwischen Eingabedaten („explanatory variables“) und Ausgabedaten („target variables“). Modelle dienen der Vorhersage oder der Beschreibung von Phänomenen.
Predictive Data Mining wird in Unternehmen im Rahmen von Business Intelligence (BI) bzw. Business Analytics Projekten insbesondere z.B. zur Erstellung von Prognosen eingesetzt. Dabei werden Chancen, Risken oder Scorings ermittelt.

Mögliche Einsatzgebiete:

  • analytischen CRM
    • Warenkorb (Market Basket) Analyse
    • Ermittlung von Cross- und Up-Selling-Potentialen
      Churn Management
      • Kundenabwanderung
      • Kundenwertmodellierung
      • Kundensegmentierung
  • Kredit Rating
  • Missbrauchserkennung
  • Prozess Überwachung
  • Name Checking

 Im Data Mining kommen verschiedene mathematisch-statistische Verfahren zum Einsatz:

  • Klassifikation und Segmentierung
  • Assoziationsanalyse
  • Clusteranalyse
  • Verfahren zur Erkennung von Änderungen und Abweichungen
  • Zeitreihennalyse

Die Prospero Data Mining Engine basiert auf einem innovativen Meta-Modellierungs-Algorithmus. Dadurch wird eine vollautomatische Erstellung von Rating- und Scoring-Modellen ermöglicht.

← Glossar