Modelowanie opisowe
Kolejnym zadaniem zaliczanym do grupy "data mining tasks" jest modelowanie opisowe. Celem modelowania opisowego (ang.: "descriptive modeling") jest przedstawienie pełnego zbioru danych (lub procesu te dane generującego).
Przykłady takiego opisu danych obejmują: modelowanie rozkładu prawdopodobieństwa danych (estymacja funkcji gęstości), dzielenie n-wymiarowej przestrzeni w grupy (analiza klastrów i segmentacja) i modele opisujące związki pomiędzy zmiennymi (modelowanie zależności).
Segmentacja polega na grupowaniu podobnych do siebie rekordów. Przykładowo, dla celów marketingowych wykonuje się analizę klientów dzieląc ich na jednorodne grupy w taki sposób, by "podobne" osoby znalazły się w tej samej grupie. To pozwala na efektywne kierowanie oferty tam, gdzie może ona spotkać się z najwięk- szym odzewem. Odpowiednia ilość grup, na które dzielone są dane dobierana jest podczas przeprowadzania analizy - nie ma jednej, "prawidłowej" ich liczby. W przeciwieństwie do segmentacji, analiza klastrów polega na znajdywaniu "naturalnych" grup w danych.
Bibliografia:
- D. J. Hand, H. Mannila, P. Smyth. Principles of Data Mining (Adaptive Computation and Machine Learning). The MIT Press, 2001
