Kuidas leida korrelatsioonikoefitsienti Exceli abil

Kuidas leida korrelatsioonikoefitsienti Exceli abil

Üks lihtsamaid ja levinumaid statistilised Exceli arvutused võite teha korrelatsiooni. See on lihtne statistika, kuid see võib olla väga informatiivne, kui soovite näha, kas kaks muutujat on omavahel seotud. Kui teate õigeid käske, on Excelis korrelatsioonikordaja leidmine äärmiselt lihtne.





Vaatame, milline on korrelatsioon, et anda teile ettekujutus sellest, millist teavet see teile annab. Seejärel liigume Excelis korrelatsioonikoefitsiendi leidmiseks, kasutades kahte meetodit ja head graafikut korrelatsioonide vaatamiseks. Lõpuks annan teile väga kiire sissejuhatuse lineaarsesse regressiooni, mis on veel üks statistiline funktsioon, mis võib osutuda kasulikuks korrelatsioonide vaatamisel.





Mis on korrelatsioon?

Enne alustamist arutame korrelatsiooni määratlust. See on lihtne mõõde, kuidas asjad on omavahel seotud. Vaatame kahte muutujat, millel pole mingit seost.





Need kaks muutujat (üks joonistatud X -teljel, teine ​​Y -teljel) on täiesti juhuslikud ega ole omavahel tihedalt seotud.

Allpool toodud kaks muutujat on aga omavahel seotud:



Üldiselt tõuseb ühe muutuja tõustes ka teine. See on korrelatsioon. (Pange tähele, et see võib olla ka vastupidi; kui üks tõuseb ja teine ​​langeb, on see negatiivne korrelatsioon.)

Korrelatsioonikoefitsiendi mõistmine

Korrelatsioonikoefitsient näitab teile, kuidas kaks muutujat on omavahel seotud. Koefitsient on vahemikus -1 kuni 1. Korrelatsioonikoefitsient 0 tähendab, et kahe muutuja vahel puudub igasugune korrelatsioon. Seda peaksite saama, kui teil on kaks juhuslike numbrite komplekti.





Koefitsient -1 tähendab, et teil on täiuslik negatiivne korrelatsioon: kui üks muutuja suureneb, siis teine ​​väheneb proportsionaalselt. Koefitsient 1 on täiuslik positiivne korrelatsioon: ühe muutuja suurenedes suureneb proportsionaalselt ka teine.

Iga nende vahel olev number tähistab skaalat. Näiteks korrelatsioon, 5, on mõõdukas positiivne korrelatsioon.





Nagu allolevalt graafikult näha, otsib korrelatsioon ainult lineaarset seost. Kaks muutujat võivad olla muul viisil tugevalt seotud ja nende korrelatsioonikoefitsient on siiski null:

Pildikrediit: DenisBoigelot/ Wikimedia Commons

Kuidas leida korrelatsioonikoefitsient Excelis CORRELi abil

Exceli korrelatsiooniks on sisseehitatud funktsioon. Funktsioonil CORREL on väga lihtne süntaks:

=CORREL(array1, array2)

massiiv1 on teie esimene numbrirühm ja massiiv2 on teine ​​rühm. Excel sülitab välja arvu ja see on teie korrelatsioonikoefitsient. Vaatame näidet.

Selles tabelis on meil nimekiri autodest koos mudeli ja aastaga ning nende väärtustega. Kasutasin funktsiooni CORREL, et näha, kas mudeliaasta ja väärtus on omavahel seotud:

Positiivne korrelatsioon on väga nõrk; Aasta tõustes tõuseb ka sõiduki väärtus. Aga mitte väga palju.

Graafilised korrelatsioonid

Kui kasutate korrelatsioone, on hea mõte kasutada hajutusgraafikut, et saada visuaalne arusaam sellest, kuidas teie andmekogumid on seotud. Minema Diagrammid> Hajumine kuidas teie andmed välja näevad:

Näete, et nendel andmetel ei mõjuta auto aasta väärtust eriti. Seal on kerge positiivne trend, kuid see on nõrk. Selle leidsime oma funktsiooni CORREL abil.

Veel üks kasulik element hajumispunktis on trendijoon, mis näeb välja selline:

Trendijoon võib olla kasulik, kui soovite oma hajumisdiagrammis korrelatsiooni selgeks teha. Windowsis klõpsake nuppu Diagrammi tööriistad> Kujundus> Lisa diagrammi element ja valige trendijoon . Macis peate minema aadressile Diagrammi paigutus või Diagrammi kujundus , sõltuvalt Exceli väljaandest.

Ja ärge unustage tutvuda meiega juhend suurepäraste diagrammide koostamiseks Excelis enne kui esitate oma järeldused!

Mitme muutuja korrelatsioon andmeanalüüsi tööriistakomplektiga

Kui teil on palju erinevaid arvukomplekte ja soovite nende vahel korrelatsioone leida, peate iga kombinatsiooni korral käivitama funktsiooni CORREL. Andmeanalüüsi tööriistakomplekti abil saate aga valida hulga andmekogumeid ja vaadata, kus korrelatsioonid asuvad.

Kas pole kindel, kas teil on andmeanalüüsi tööriistakomplekt? Vaadake meie põhitõdede tutvustus alla laadida ja sellest aru saada.

kuidas Photoshopis dpi seadistada

Toolpaki käivitamiseks minge aadressile Andmed> Andmete analüüs . Näete valikute loendit.

Valige Korrelatsioon ja pihta Okei .

Valige ilmuvas aknas kõik oma andmekogumid Sisestusvahemik ja öelge Excelile, kuhu soovite oma tulemused paigutada:

Siin on see, mida saate, kui tabate Okei :

Ülaltoodud pildil oleme korrelatsioone kasutanud neljal erineval andmekogul: aasta, maailma rahvastik ja kaks juhuslike numbrite komplekti.

Iga andmekogumi korrelatsioon iseendaga on 1. Aastal ja maailma elanikkonnal on äärmiselt tugev korrelatsioon, samas kui mujal on väga nõrgad korrelatsioonid, nagu me juhuslike arvude puhul eeldame.

kuhu mu akuikoon kadus?

Korrelatsioon vs lineaarne regressioon Excelis

Korrelatsioon on lihtne näitaja: kui tihedalt on kaks muutujat omavahel seotud? Sellel mõõtmel pole aga ennustavat ega põhjuslikku väärtust. See, et kaks muutujat on korrelatsioonis, ei tähenda, et üks põhjustab muutusi teises. See on korrelatsiooni osas oluline asi.

Kui olete huvitatud põhjuslikkuse seostamisest, peate kasutama lineaarset regressiooni. Sellele pääsete juurde ka andmeanalüüsi tööriistakomplekti kaudu. (See artikkel ei hõlma lineaarse regressiooni toimimise üksikasju, kuid on palju tasuta statistikaressursse, mis aitavad teil põhitõdesid läbi viia.)

Avage andmeanalüüsi tööriistapakk, valige Taandareng ja klõpsake nuppu Okei .

Täitke vahemikud X ja Y (X väärtus on selgitav muutuja ja Y väärtus on väärtus, mida proovite ennustada). Seejärel valige, kuhu soovite väljundi suunata, ja klõpsake nuppu Okei uuesti.

Arv, millele soovite siin keskenduda, on teie selgitava muutuja p-väärtus:

Kui see on väiksem kui 0,05, on teil tugev argument, et muutuja X muutuja põhjustab muutusi teie Y -muutuja. Ülaltoodud pildil oleme näidanud, et aasta on maailma rahvastiku oluline ennustaja.

Lineaarne regressioon on kasulik ka selle poolest, et see võib vaadelda mitut väärtust. Siin oleme kasutanud regressiooni, et näha, kas aasta ja elanikkond on toornafta hinna olulised ennustajad:

Mõlemad p-väärtused on alla 0,05, seega võime järeldada, et nii aasta kui ka maailma elanikkond on toornafta hinna olulised ennustajad. (Kuigi tugevad korrelatsioonid X muutujate vahel võivad põhjustada oma probleeme.)

Jällegi on see lineaarse regressiooni väga lihtsustatud selgitus ja kui olete põhjuslikust huvist huvitatud, peaksite lugema mõningaid statistikaõpetusi.

Kuid nüüd on teil idee, kuidas lihtsast korrelatsioonist kaugemale jõuda, kui otsite rohkem statistilist teavet!

Saate Excelist paremaid andmeid

Exceli põhiliste statistiliste funktsioonide mõistmine aitab teil oma andmetest palju rohkem kasulikku teavet saada. Korrelatsioon on lihtne meede, kuid see võib olla suureks abiks, kui proovite oma arvutustabelis olevate numbrite kohta väiteid esitada.

Loomulikult võite kasutada palju muid keerukamaid meetmeid. Aga kui te pole statistikaga rahul, soovite seda teha alustage põhitõdedest .

Kas kasutate regulaarselt Exceli korrelatsioonifunktsioone? Milliste muude statistiliste funktsioonide kohta soovite teada saada?

Jaga Jaga Piiksuma E -post Siin on põhjus, miks FBI andis hoiatuse taru lunavara eest

FBI andis hoiatuse eriti vastiku lunavara tüve eest. Siin on põhjus, miks peate Hive lunavara suhtes eriti ettevaatlik olema.

Loe edasi
Seotud teemad
  • Tootlikkus
  • Microsoft Excel
Autori kohta Siis Albright(Avaldatud 506 artiklit)

Dann on sisustrateegia ja turunduskonsultant, kes aitab ettevõtetel nõudlust ja müügivihjeid luua. Samuti peab ta blogi strateegiast ja sisuturundusest saidil dannalbright.com.

Veel Dann Albrightilt

Telli meie uudiskiri

Liituge meie uudiskirjaga, et saada tehnilisi näpunäiteid, ülevaateid, tasuta e -raamatuid ja eksklusiivseid pakkumisi!

Tellimiseks klõpsake siin