KORELACIJA: KAJ NAM POVE IN KDAJ JO UPORABIMO?

Korelacija je vrsta statistične analize, ki meri stopnjo in smer odnosa med dvema spremenljivkama. Gre za kvantitativno analizo, ki pomaga razumeti, kako sprememba ene spremenljivke vpliva na drugo

Korelacija in njen osnovni koncept

Korelacija opisuje, kako tesno sta spremenljivki povezani. Korelacijski koeficient meri stopnjo te povezave in se giblje med -1 in 1, pri čemer različne vrednosti pomenijo:

  • Korelacijski koeficient 1: Popolna pozitivna korelacija. Ko se vrednost ene spremenljivke povečuje, se druga povečuje popolnoma enako.
  • Korelacijski koeficient -1: Popolna negativna korelacija. Ko se vrednost ene spremenljivke povečuje, se druga zmanjšuje popolnoma enako.
  • Korelacijski koeficient 0: Ni korelacije. Spremenljivki sta neodvisni in sprememba ene nima nobenega vpliva na drugo.

Korelacija je uporabna za preverjanje hipotez o povezavah med spremenljivkami. Na primer, če želimo ugotoviti, ali obstaja povezava med telesno aktivnostjo in zdravjem, lahko izračunamo korelacijo med številom ur telesne aktivnosti in določenimi zdravstvenimi kazalniki, kot so krvni tlak, telesna masa ali srčni utrip.

 

Korelacija

 

Vrste korelacijskih koeficientov

Glede na naravo podatkov in cilje analize lahko uporabimo različne korelacijske koeficiente:

Pearsonov korelacijski koeficient:

Ta je najpogosteje uporabljen koeficient za merjenje linearne povezave med dvema kvantitativnima spremenljivkama.

Uporablja se, kadar sta spremenljivki normalno porazdeljeni in je njuna povezava linearna. Pearsonova korelacija temelji na vrednostih podatkov in meri, kako se spremembe ene spremenljivke skladajo s spremembami druge.

Spearmanov rangovski korelacijski koeficient:

Uporablja se, kadar podatki niso normalno porazdeljeni, ko ni linearne povezave med spremenljivkama ali pa ko imamo opravka z ordinalnimi podatki. Spearmanov koeficient temelji na rangiranju podatkov namesto na dejanskih vrednostih. Osredotoča se torej na vrstni red podatkov, ne na njihove konkretne vrednosti.

Kendallov tau koeficient:

Ta je podoben kot Spearmanov rangovski koeficient, a bolj robusten za manjše vzorce podatkov in pri diskretnih podatkih. Osredotoča se na relativno uvrstitev spremenljivk in upošteva natančnejši red v podatkih.

Poznamo ga tudi pod imenom Kendallov t koeficient. Uporablja se v primerih, ko imamo opravka z rangiranimi podatki ali ko želimo preveriti monotono povezavo.

Točkovno-biserialni korelacijski koeficient:

Uporablja se, kadar primerjamo dihotomično (dvovrednostno) spremenljivko s kontinuirano spremenljivko. Na primer, lahko preučujemo, ali obstaja povezava med spolom (dihotomična spremenljivka) in rezultati na testu (kontinuirana spremenljivka).

 

Korelacija – pogoji za izračun

Da bi bila korelacija natančna in zanesljiva, morajo biti izpolnjeni določeni pogoji, zlasti pri uporabi Pearsonovega korelacijskega koeficienta:

Linearna povezava: Pearsonov korelacijski koeficient predpostavlja linearno povezavo med spremenljivkama. Če razmerje ni linearno, Pearsonova korelacija morda ne bo ustrezno odražala povezave. Za nelinearne povezave so primernejši drugi koeficienti, kot sta Spearmanov rangovski ali Kendallov tau koeficient.

Normalna porazdelitev: Za Pearsonovo korelacijo morata biti obe spremenljivki normalno porazdeljeni (»po Gaussovi krivulji«). Normalna porazdelitev pomeni, da je večina vrednosti okoli povprečja, manj vrednosti pa je na skrajnih robovih (porazdelitev zvonaste oblike). Če spremenljivke niso normalno porazdeljene, lahko to vodi do napačnih rezultatov. V takem primeru raje uporabimo drug test, denimo Spearmanovega.

Homogenost varianc (homoskedastičnost): Variabilnost v vrednostih spremenljivk mora biti konstantna vzdolž celotnega spektra podatkov. To pomeni, da morajo biti razlike v vrednostih spremenljivk enake, ne glede na to, katero vrednost opazujemo. Če so variabilnosti zelo različne, lahko Pearsonova korelacija daje netočne rezultate.

Neodvisnost vzorcev: Vzorci podatkov morajo biti neodvisni. To pomeni, da vrednosti ene meritve ne vplivajo na vrednosti druge. Na primer, če vzamemo več meritev iz istega vira ali osebe, lahko to povzroči pristranske rezultate.

 

Korelacija

 

Korelacija in pomen p-vrednosti

Poleg izračuna korelacijskega koeficienta moramo pri interpretaciji korelacije upoštevati tudi p-vrednost. P-vrednost nam pove, kako verjetno je, da bi dobili podobno korelacijo po naključju, če bi v resnici med spremenljivkama ne bilo povezave (to je ničelna hipoteza).

Nizka p-vrednost (običajno manj kot 0,05): Pomeni, da je zelo malo verjetno, da bi takšno korelacijo opazili zgolj po naključju. To kaže, da je korelacija statistično pomembna.

Visoka p-vrednost (več kot 0,05): Pomeni, da ni dovolj dokazov, da zavrnemo ničelno hipotezo, kar nakazuje, da ugotovljena korelacija morda ni statistično pomembna.

P-vrednost je pomembna, ker kljub visoki korelaciji ne moremo zagotovo vedeti, ali je korelacija pomembna, dokler ne preverimo p-vrednosti. Če je p-vrednost majhna, to pomeni, da lahko zavrnemo ničelno hipotezo in sklepamo, da je povezava med spremenljivkama verjetno resnična.

 

Korelacija v praktičnem primeru

Predstavljajmo si, da raziskujemo povezavo med številom ur učenja in ocenami študentov na izpitu. Naš cilj je ugotoviti, ali več ur učenja vodi do boljših ocen.

Podatki:

Število ur učenja (X): 2, 3, 5, 7, 8

Ocene na izpitu (Y): 50, 60, 75, 80, 85

Najprej lahko izračunamo Pearsonov korelacijski koeficient, da preverimo linearno povezavo med številom ur učenja in ocenami. Koeficient r = 0,89 bi pomenil, da obstaja močna pozitivna korelacija med številom ur učenja in ocenami. To nakazuje, da več ur učenja vodi do višjih ocen.

Poleg tega preverimo p-vrednost. Če dobimo p-vrednost 0,02,  (kar je manj od 0,05) to pomeni, da je verjetnost, da bi do takšne korelacije prišlo naključno, zelo majhna. To potrjuje, da je povezava statistično pomembna in ne zgolj naključna.

 

Korelacija in njena široka uporaba

Korelacija ima široko uporabo v različnih panogah. Spodaj je naštetih nekaj takih, kjer je prisotna.

Ekonomija: Korelacija se pogosto uporablja za analizo tržnih trendov, npr. povezanost med inflacijo in brezposelnostjo, ali povezanost med obrestnimi merami in gospodarsko rastjo.

Medicina: V medicini korelacija pomaga preučevati povezave med življenjskimi navadami in zdravjem. Na primer, korelacija med kajenjem in tveganjem za pljučnega raka.

Psihologija: V psihologiji se korelacija uporablja za preučevanje odnosov med vedenjskimi lastnostmi in rezultati, kot so povezave med stresom in uspešnostjo pri delu.

Finančni trgi: Investitorji uporabljajo korelacijo za analizo povezav med različnimi naložbami. Na primer, če dve delnici kažeta močno negativno korelacijo, to pomeni, da ko vrednost ene narašča, vrednost druge pada. Takšne informacije so uporabne pri oblikovanju portfeljev.

Izobraževanje: Korelacija se uporablja za preučevanje dejavnikov, ki vplivajo na uspešnost učencev, kot so povezanost med motivacijo za učenje in šolskim uspehom.

 

Korelacija in njene omejitve

Čeprav je korelacija močno orodje za analizo povezav med spremenljivkami, je pomembno razumeti njene omejitve:

Korelacija ne pomeni vzročnosti: Čeprav visoka korelacija kaže na močno povezavo med spremenljivkama, to še ne pomeni, da ena spremenljivka povzroča spremembe pri drugi. Morda obstaja tretja spremenljivka, ki vpliva na obe. Na primer, povezava med porabo sladoleda in kriminalom je lahko visoka, vendar oboje pojasnjuje vroče vreme, ki vpliva na oba dejavnika.

Občutljivost na izstopajoče podatke: Korelacija je občutljiva na izstopajoče vrednosti (»outlierje«). Izstopajoči podatki lahko namreč močno spremenijo izračunano vrednost korelacijskega koeficienta in vodijo do napačnih sklepov.

Samo linearnost: Pearsonov korelacijski koeficient meri le linearne povezave. Če je povezava med spremenljivkama nelinearna, bo Pearsonova korelacija podcenila moč povezave.

 

Zaključek

Korelacija je eno izmed osnovnih statističnih orodij za preučevanje povezav med spremenljivkami. Uporablja se v številnih znanstvenih disciplinah in raziskavah, od ekonomije in medicine do psihologije in financ. Pomembno je razumeti pogoje, v katerih lahko uporabimo korelacijo, ter pravilno interpretirati rezultate, vključno s p-vrednostjo in omejitvami metode. Čeprav korelacija ne pomeni vzročnosti, je lahko koristen pripomoček za odkrivanje potencialnih povezav, ki lahko vodijo do nadaljnjih raziskav in eksperimentov. Pogosto se boste z njo srečali ob pisanju diplomske ali magistrske naloge.

Potrebujete pomoč pri SPSS analizi hipotez?

Pišite nam za brezplačni posvet.

Pokličite nas na 070 612 521.


ZAHVALA SERGEJE

Sergeja_

Hvala, super ste!

Torej, hitri, učinkoviti, prijazni, dostopni. Skratka super in vredni vseh priporočil drugim ;)

Statistik.si™ v številkah:

2100

IZDELANIH ANALIZ

Izdelali smo preko 2100 raziskav in statističnih analiz za pravne in fizične osebe.

40.825 ur

PRIHRANJENEGA ČASA

Naše stranke so prihranile skupaj več kot 40.825 ur ukvarjanja z raziskavami in statističnimi analizami.

1.525.000​ €

PRIHRANJENEGA DENARJA

Naše stranke so prihranile skupaj več kot 1.525.000 € stroškov, ki bi jih sicer imele zaradi ukvarjanja z raziskavami in statističnimi analizami. Da živciranja, skrbi, slabe volje sploh ne omenjamo.