Knowledge Discovery in Databases

12 grudzień 2007 | Wojciech Wilusz | Artykuł
Pojęcia „data mining” niejednokrotnie używa się jako określenie procesu „odkrywania wiedzy w danych”. Tymczasem nie jest to do końca prawda - należy zdać sobie sprawę, że eksploracja danych jest jedynie jednym (choć najważniejszym) z elementów procesu, którego pełna nazwa brzmi knowledge discovery in databases, co na język polski można próbować przetłumaczyć jako „odkrywanie wiedzy w bazach danych”, ale chyba trzeba przyznać, że nie brzmi to najlepiej. Poszczególne etapy „odkrywania wiedzy” zostały przedstawione na powyższym rysunku. Cały proces ma na celu transformację „surowych” danych do postaci „wiedzy” - informacji użytecznej dla użytkownika.

 

 

Należy dodać, że KDD jest procesem interaktywnym: udział człowieka jest tutaj niezbędny, i iteracyjnym: poszczególne etapy wykonywane są kilkukrotnie podczas całego przedsięwzięcia. Pierwszym krokiem KDD jest zapoznanie się z wiedzą dziedzinową aplikacji i zidentyfikowanie celów procesu odkrywania wiedzy. Następnie z jednego, zintegrowanego zbioru danych, który często powstaje z różnych, zazwyczaj heterogenicznych i rozproszonych źródeł, konieczne jest wyselekcjonowanie istotnych, z punktu widzenia całego procesu odkrywania wiedzy, danych, które będą podstawą przeprowadzanej analizy. Etap oznaczony na rysunku jako: „Wstępne przetwarzanie danych” ma na celu usunięcie niepełnych, niepoprawnych lub nieistotnych danych z eksplorowanego zbioru. W wyniku tego działania powstają „dane oczyszczone”, które są gotowe do „transformacji”, czyli przekształcenia ich do postaci wymaganej przez metody eksploracji danych. Etap data mining odkrywa potencjalnie użyteczne wzorce ze zbioru wyselekcjonowanych danych za pomocą wcześniej ustalonych metod i algorytmów odpowiednich do rozwiązywanego problemu. „Interpretacja, analiza i ocena wyników” powinna prowadzić do osiągania coraz lepszych wyników w kolejnych iteracjach poprzez wprowadzanie odpowiednich modyfikacji na przestrzeni całego procesu odkrywania wiedzy, a w końcu do uzyskania użytecznej „wiedzy” i wdrożenie jej w życie.

 

Bibliografia:

  1. U. Fayyad, G. Piatetsky-Shapiro, P. Smyth. From Data Mining to Knowledge Discovery in Databases. AI Magazine, 1996.




Komentarze




Nowy komentarz


 

 E-mail nie będzie publikowany

 Kompletny link z http://

 To robimy aby utrudnic spamowanie botami.