Wykrywanie wzorców i reguł... I nie tylko

5 luty 2008 | Wojciech Wilusz | Artykuł

Dotychczas wymienione zadania data mining wiążą się z budowaniem odpowiednich modeli. Osobnym zagadnieniem w eksploracji danych jest jest wyszukiwanie wzorców (ang.: "pattern detection"/"pattern recognition").

Odrębną kategorią jest ostatnie z zadań eksploracji danych - "Wyszukiwanie według zawartości".

Zadanie to można zilustrować na przykładzie wykrywania "podejrzanych zachowań" - chodzi o identyfikację sytuacji, kiedy dane wskazują na odchylenia od normy, co może być sygnałem np. o tym, że ktoś włamał się na konto bankowe, bądź przeprowadzana jest operacja prania brudnych pieniędzy. Trudności w tej dziedzinie zadań eksploracji danych wiążą się z koniecznością odróżnienia faktycznie nietypowego zachowania od wartości nieprawidłowych - odstających (ang.: "outliers") mających swe źródło w nieprawidłowym pomiarze, pomyłkach we wprowadzaniu informacji do bazy danych itp. Innym aspektem wykrywania wzorców jest odnajdywanie kombinacji elementów występujących w zbiorze danych. Zagadnienie to stanowi jeden z ważniejszych przedmiotów zainteresowania w data mining. Zadania tej kategorii rozwiązywane są z wykorzystaniem algorytmów opierających się na regułach asocjacyjnych.

Póki co nie wgłębiając się zanadto w temat, wspomnieć chciałem również ostatnim rodzaju zadań data mining: wyszukiwaniu według zawartości. Do tego typu zadań kwalifikuje się sytuacje, gdy znany jest pewien wzorzec, zaś celem jest odnalezienie podobnych do niego. Najczęściej tego typu eksplorację danych przeprowadza się na zbiorach tekstowych lub zbiorach obrazów.

Tym samym wprowadzenie w kategorie zadań eksploracji danych można uznać za zakończone. Oczywiście każdy z tych tematów można nie tylko rozwijać w kolejne artykuły, dysertacje i książki... Co jednak przynajmniej na razie nie nastąpi. Natomiast zamknięcie jednego tematu pozwala na rozpoczęcie następnego - o tym niebawem.

 

Bibliografia:

  1. D. J. Hand, H. Mannila, P. Smyth. Principles of Data Mining (Adaptive Computation and Machine Learning). The MIT Press, 2001




Komentarze




Nowy komentarz


 

 E-mail nie będzie publikowany

 Kompletny link z http://

 To robimy aby utrudnic spamowanie botami.