Modelowanie predykcyjne

27 styczeń 2008 | Wojciech Wilusz | Artykuł

Choć nie dysponuję żadnymi wynikami badań w tej dziedzinie, doświadczenie wskazuje, że modelowanie predykcyjne to jedno z najpopularniejszych zadań, którymi zajmuje się eskploracja danych.  Pod tym terminem tak naprawdę kryją się dwa pojęcia: klasyfikacja oraz regresja.

W tłumaczeniu podanej w bibliografii książki Hand'a na język polski tłumaczka posłużyła się terminem "modelowanie przewidujące" (oryg.: "predictive modeling"), lecz pojęcie "modelowanie predykcyjne" wydaje się bardziej oddawać istotę rzeczy stąd raczej ten termin będzie stosowany przy okazji omawiania zagadnień z tego zakresu.

W przypadku modelowania predykcyjnego celem jest budowa modelu, który pozwoli dokonać prognozy pojedynczej zmiennej na podstawie znanych wartości innych zmiennych. W przypadku klasyfikacji zmienna prognozowana jest zmienną kategoryczną, podczas gdy w przypadku regresji zmienna ma wartość liczbową. Słowo "predykcja" w użytym tutaj znaczeniu niekoniecznie musi wiązać się z domeną czasu (czyli ograniczać się do prognozowania szeregów czasowych). Przykładem może być diagnoza chorego, kiedy to na podstawie objawów (wartości poszczególnych zmiennych - cech) dokonywana jest właśnie "predykcja" co do rodzaju choroby.

 

Bibliografia:

  1. D. J. Hand, H. Mannila, P. Smyth. Principles of Data Mining (Adaptive Computation and Machine Learning). The MIT Press, 2001.

 





Komentarze




Nowy komentarz


 

 E-mail nie będzie publikowany

 Kompletny link z http://

 To robimy aby utrudnic spamowanie botami.