Modelowanie predykcyjne
Choć nie dysponuję żadnymi wynikami badań w tej dziedzinie, doświadczenie wskazuje, że modelowanie predykcyjne to jedno z najpopularniejszych zadań, którymi zajmuje się eskploracja danych. Pod tym terminem tak naprawdę kryją się dwa pojęcia: klasyfikacja oraz regresja.
W tłumaczeniu podanej w bibliografii książki Hand'a na język polski tłumaczka posłużyła się terminem "modelowanie przewidujące" (oryg.: "predictive modeling"), lecz pojęcie "modelowanie predykcyjne" wydaje się bardziej oddawać istotę rzeczy stąd raczej ten termin będzie stosowany przy okazji omawiania zagadnień z tego zakresu.
W przypadku modelowania predykcyjnego celem jest budowa modelu, który pozwoli dokonać prognozy pojedynczej zmiennej na podstawie znanych wartości innych zmiennych. W przypadku klasyfikacji zmienna prognozowana jest zmienną kategoryczną, podczas gdy w przypadku regresji zmienna ma wartość liczbową. Słowo "predykcja" w użytym tutaj znaczeniu niekoniecznie musi wiązać się z domeną czasu (czyli ograniczać się do prognozowania szeregów czasowych). Przykładem może być diagnoza chorego, kiedy to na podstawie objawów (wartości poszczególnych zmiennych - cech) dokonywana jest właśnie "predykcja" co do rodzaju choroby.
Bibliografia:
- D. J. Hand, H. Mannila, P. Smyth. Principles of Data Mining (Adaptive Computation and Machine Learning). The MIT Press, 2001.
