Metodyki eksploracji danych
W kolejnych notkach postaram się zaprezentować cztery metodyki wykorzystywane w ramach projektów data mining. Uchylając nieco rąbka tajemnicy mogę zdradzić, że będą to:
- Virtuous Cycle of Data Mining
- Crisp-DM
- SEMMA
- Six-Sigma
Nie wyczerpują one oczywiście zbioru możliwych do stosowania podejść, niemniej pozwalają unaocznić najważniejsze elementy całego procesu.
Nim jednak nastąpi właściwa prezentacja każdego z podejść, konieczne jest zdefiniowanie trzech pojęć (za Wikipedią):
Proces biznesowy lub metoda biznesowa jest to seria powiązanych ze sobą kroków, które rozwiązują określony problem lub prowadzą do osiągnięcia określonego efektu.
Metodologia jest to nauka o metodach badań naukowych, ich skuteczności i wartości poznawczej. Współcześnie dominuje podejście bazujące na wykorzystaniu metod statystycznych bądź matematycznych (szczególnie nauki ścisłe) do opisu różnych zjawisk będących pod obserwacją badacza. W celu uzyskania danych do obliczeń wykorzystuje się precyzyjnie opisaną w metodologiach szczegółowych nauk gamę działań. Wiele nauk posiada własne metodologie lub korzysta z dorobku innych zapożyczając ich metodologie, np. metody statystyczne w formie zmodyfikowanej i dostosowanej do szczególnych zagadnień ekonomii noszą miano ekonometrii.
Metodyka to ustandaryzowane dla wybranego obszaru podejście do rozwiązywania problemów. Metodyka abstrahuje od merytorycznego kontekstu danego obszaru, a skupia się na metodach realizacji zadań, szczególnie metodach zarządzania. Metodyka bardziej ciąży ku praktyce wykonawczej, a metodologia ku teorii zazwyczaj sprawnego działania.
Bibliografia:
1. Wikipedia
