Stručno-analitička podloga Analiza stanja u prostoru rijetko naseljenih ruralnih prostora Bjelovarsko-bilogorske županije

19 4. Klaster analiza naselja Grada Grubišno Polje i općina Veliki Grđevac, Velika Pisanica i Šandrovac Klaster analiza predstavlja jednu od ključnih multivarijatnih statističkih metoda koja se koristi za grupiranje objekata u homogene skupine na temelju njihovih međusobnih sličnosti ili razlika. Cilj je otkriti strukturu podataka koja nije unaprijed poznata, odnosno klasificirati elemente tako da objekti unutar istog klastera budu što sličniji jedni drugima, a što različitiji od objekata u drugim klasterima. Jedna od najčešće korištenih metoda hijerarhijske klaster analize, primijenjena i u ovoj studiji, jest Wardova metoda. Wardova metoda spaja klastere na način da se u svakom koraku postiže najmanji mogući porast ukupne unutargrupne varijance. Time se dobivaju klasteri koji su kompaktni i homogeni, što ovu metodu čini izrazito prikladnom kada se želi postići visoka unutarnja kohezija skupina. Proces Wardove metode započinje tako da se svaki objekt (u ovoj studiji naselje) u početku promatra kao zaseban klaster. Zatim se u svakoj iteraciji traže dva klastera čijim bi spajanjem nastao najmanji porast kvadratne pogreške unutar klastera. Taj kriterij minimizacije razlike u varijanci ključna je karakteristika Wardove metode. Spajanje se nastavlja sve dok se svi objekti ne spoje u jedan klaster, a rezultat je hijerarhijsko stablo, odnosno dendrogram, koje vizualno prikazuje proces grupiranja. Prednost Wardove metode u odnosu na neke druge hijerarhijske pristupe (poput metode najbližeg susjeda ili metode najudaljenijeg susjeda) jest u tome što generira klastere približno iste veličine i oblika. To omogućuje jasniju interpretaciju rezultata, posebno kada se želi izbjeći formiranje vrlo velikih i heterogenih klastera ili vrlo malih i izoliranih skupina. Međutim, jedan od nedostataka jest da Wardova metoda može biti osjetljiva na odstupajuće vrijednosti (outliere), koji značajno mogu utjecati na konačan rezultat grupiranja. Stoga se preporučuje prethodno provesti analizu podataka, detektirati i po potrebi ukloniti ekstremne vrijednosti. Wardova metoda može se koristiti s različitim mjerama udaljenosti, no najčešće se primjenjuje euklidska udaljenost. Kombinacija euklidske metrike i Wardovog kriterija daje stabilne i interpretabilne klastere, pogodne za vizualizaciju i daljnju analizu. Nakon što se dendrogram dobije, istraživač mora odlučiti o optimalnom broju klastera, što se može odrediti vizualnim pregledom dendrograma ili korištenjem dodatnih statističkih kriterija.

RkJQdWJsaXNoZXIy Mjc2NzM=