Data Mining erfordert in jedem Fall eine vorhergehende Aufbereitung der verwendeten Daten. Liegen diese z.B. als einzelne Bestellvorgänge in einer Datenbank vor, müssen diese Einzelbestellungen zuerst auf Kundenebene verdichtet werden. Weiterhin ist es notwendig, Einzelbestellungen auf zeitlicher Ebene zu verdichten, also z.B. saisonbezogen. Auch eine Verdichtung nach verschiedenen Produktgruppen ist sinnvoll.
Unsere Analysesoftware Score™ 4.0 ermittelt völlig selbständig, welche Variablen sinnvoll für eine Data-Mining-Analyse verwendet werden können und welche nicht. D.h. man muss gar nicht genau entscheiden, welche Art von Daten man dem Tool genau zur Verfügung stellt: man übergibt der Software ganz einfach ein Überangebot an Kundeneigenschaften (verschiedene Verdichtungsebenen der Grunddaten) und lässt die Software selbständig aus diesem Angebot auswählen.
Score™ 4.0 ist so leistungsfähig, dass ein Überangebot an Daten keinerlei Hindernis darstellt. Wir verwenden zur Zeit bis zu 500 Variablen für unsere Analysen. Dies ist keine obere Grenze, eine Erweiterung auf 1000 oder 2000 Variablen wäre einfach möglich. Würde man diese Datenvielfalt von vorneherein einschränken, würde man der Analysesoftware auf jeden Fall Entscheidungsmöglichkeiten rauben. Wir raten unseren Kunden davon immer strikt ab, da die Data-Mining-Software selbst viel besser gute von schlechten Variablen trennen kann, als ein Mensch dazu jemals in der Lage wäre.
Nach Ablauf einer Analyse kann man genau ermitteln, welche Daten von der Software besonders stark berücksichtigt wurden, und welche ignoriert wurden. Dies nachträgliche Analyse der Ergebnisse hat noch nie zu Widersprüchen geführt, sondern stets zur Anerkennung durch menschliche Marketingexperten, die die Entscheidungen der Software stets bestätigten.
Das automatische Auswählen der verwendeten Variablen kann natürlich auch zu Fehlern führen, ein Computer ist immer noch ein dummer Rechenknecht und keine intelligente Maschine. Die extrem hohe Transparenz von Score™ 4.0 erlaubt aber immer ein sehr rasches Auffinden solcher Datenmängel. Per Mausklick können dann Einzelvariablen oder ganze Variablengruppen von der Analyse ausgeschlossen werden. Die sehr hohe Analysegeschwindigkeit von Score™ 4.0 erlaubt die Korrektur solcher Fehler innerhalb weniger Minuten.