Što je abnormalno?
Abnormalnosti se mogu identificirati grafički, vizualnim pregledom dijagrama podataka. Također se mogu identificirati numerički, izračunavanjem mjere statističkog odstupanja, kao što je z-rezultat ili standardizirani rezidual.
Prisutnost abnormalnosti u skupu podataka može utjecati na rezultate statističke analize i važno je razmotriti njihov potencijalni utjecaj prilikom provođenja analize podataka. U nekim slučajevima abnormalnosti će možda trebati ukloniti iz skupa podataka prije analize, dok se u drugim slučajevima mogu zadržati kao vrijedne informacijske točke.
Evo nekoliko uobičajenih primjera abnormalnosti:
* U skupu podataka o rezultatima ispita učenika, neuobičajeno visok rezultat može biti posljedica varanja, dok neuobičajeno nizak rezultat može ukazivati na učenika koji nije bio pripremljen za test.
* U skupu podataka o prodajnim brojkama, neuobičajeno visoka prodaja može biti posljedica posebne promocije ili jednokratne rasprodaje, dok neuobičajeno niska prodaja može ukazivati na trgovinu koja se bori.
* U skupu medicinskih podataka, neuobičajeno visoko ili nisko očitanje može ukazivati na zdravstveno stanje koje zahtijeva daljnje ispitivanje.
Važno je napomenuti da nisu sve abnormalnosti rezultat pogrešaka ili neobičnih opažanja. U nekim slučajevima abnormalnosti mogu biti uzrokovane legitimnim promjenama u osnovnoj populaciji. Na primjer, u skupu podataka o cijenama dionica, neuobičajeno visoka cijena može biti posljedica pozitivnog izvješća o zaradi, dok neuobičajeno niska cijena može biti posljedica loših vijesti.
Stoga je važno pažljivo istražiti abnormalnosti prije donošenja bilo kakvih zaključaka o njihovoj važnosti.