Knowledge Discovery in Databases

Należy dodać, że KDD jest procesem interaktywnym: udział człowieka jest tutaj niezbędny, i iteracyjnym: poszczególne etapy wykonywane są kilkukrotnie podczas całego przedsięwzięcia. Pierwszym krokiem KDD jest zapoznanie się z wiedzą dziedzinową aplikacji i zidentyfikowanie celów procesu odkrywania wiedzy. Następnie z jednego, zintegrowanego zbioru danych, który często powstaje z różnych, zazwyczaj heterogenicznych i rozproszonych źródeł, konieczne jest wyselekcjonowanie istotnych, z punktu widzenia całego procesu odkrywania wiedzy, danych, które będą podstawą przeprowadzanej analizy. Etap oznaczony na rysunku jako: „Wstępne przetwarzanie danych” ma na celu usunięcie niepełnych, niepoprawnych lub nieistotnych danych z eksplorowanego zbioru. W wyniku tego działania powstają „dane oczyszczone”, które są gotowe do „transformacji”, czyli przekształcenia ich do postaci wymaganej przez metody eksploracji danych. Etap data mining odkrywa potencjalnie użyteczne wzorce ze zbioru wyselekcjonowanych danych za pomocą wcześniej ustalonych metod i algorytmów odpowiednich do rozwiązywanego problemu. „Interpretacja, analiza i ocena wyników” powinna prowadzić do osiągania coraz lepszych wyników w kolejnych iteracjach poprzez wprowadzanie odpowiednich modyfikacji na przestrzeni całego procesu odkrywania wiedzy, a w końcu do uzyskania użytecznej „wiedzy” i wdrożenie jej w życie.
Bibliografia:
- U. Fayyad, G. Piatetsky-Shapiro, P. Smyth. From Data Mining to Knowledge Discovery in Databases. AI Magazine, 1996.
