Kuinka löytää korrelaatiokerroin Excelin avulla

Kuinka löytää korrelaatiokerroin Excelin avulla

Yksi yksinkertaisimmista ja yleisimmistä tilastolliset Excel -laskelmat tekemäsi korrelaatio. Se on yksinkertainen tilasto, mutta se voi olla erittäin informatiivinen, kun haluat nähdä, liittyvätkö kaksi muuttujaa toisiinsa. Jos tiedät oikeat komennot, korrelaatiokerroimen löytäminen Excelissä on erittäin helppoa.





Katsomme, mikä korrelaatio on antaaksemme sinulle käsityksen sen antamista tiedoista. Sitten siirrytään etsimään korrelaatiokerroin Excelistä käyttämällä kahta menetelmää ja hyvää kaaviota korrelaatioiden tarkasteluun. Lopuksi annan sinulle erittäin nopean johdannon lineaariseen regressioon, joka on toinen tilastollinen funktio, joka voi osoittautua hyödylliseksi, kun tarkastellaan korrelaatioita.





Mikä on korrelaatio?

Ennen kuin aloitamme, keskustelemme korrelaation määritelmästä. Se on yksinkertainen mittari siitä, miten asiat liittyvät toisiinsa. Katsotaanpa kahta muuttujaa, joilla ei ole mitään korrelaatiota.





Nämä kaksi muuttujaa (yksi piirretty X -akselille, toinen Y: lle) ovat täysin satunnaisia ​​eivätkä ole läheisessä yhteydessä toisiinsa.

Alla olevat kaksi muuttujaa liittyvät kuitenkin toisiinsa:



Yleensä yhden muuttujan noustessa nousee toinen. Se on korrelaatio. (Huomaa, että se voi olla myös toisinpäin; jos toinen nousee ja toinen laskee, se on negatiivinen korrelaatio.)

Korrelaatiokertoimen ymmärtäminen

Korrelaatiokerroin kertoo, kuinka kaksi muuttujaa liittyvät toisiinsa. Kerroin on välillä -1 ja 1. Korrelaatiokerroin 0 tarkoittaa, että kahden muuttujan välillä ei ole mitään korrelaatiota. Tämä on mitä sinun pitäisi saada, kun sinulla on kaksi satunnaislukua.





Kerroin -1 tarkoittaa, että sinulla on täydellinen negatiivinen korrelaatio: kun yksi muuttuja kasvaa, toinen pienenee suhteellisesti. Kerroin 1 on täydellinen positiivinen korrelaatio: kun yksi muuttuja kasvaa, toinen kasvaa myös suhteellisesti.

Mikä tahansa numero näiden välillä edustaa asteikkoa. Esimerkiksi korrelaatio 0,5 on kohtalainen positiivinen korrelaatio.





Kuten alla olevasta kuvasta näkyy, korrelaatio etsii vain lineaarista suhdetta. Kaksi muuttujaa voivat liittyä vahvasti toisella tavalla, ja niiden korrelaatiokerroin on edelleen nolla:

Kuva: DenisBoigelot/ Wikimedia Commons

Korrelaatiokerroimen löytäminen Excelistä CORRELin avulla

Excelissä on sisäänrakennettu korrelaatiotoiminto. CORREL -funktiolla on hyvin yksinkertainen syntaksi:

=CORREL(array1, array2)

array1 on ensimmäinen numeroryhmäsi ja array2 on toinen ryhmä. Excel sylkee numeron, ja se on korrelaatiokerroin. Katsotaanpa esimerkkiä.

Tässä laskentataulukossa on luettelo autoista, malli ja vuosi sekä niiden arvot. Käytin CORREL -funktiota nähdäkseni, liittyikö mallivuosi ja arvo toisiinsa:

Positiivinen korrelaatio on erittäin heikko; niin vuosi kasvaa, niin myös auton arvo. Mutta ei kovin paljon.

Graafiset korrelaatiot

Kun käytät korrelaatioita, on hyvä käyttää hajakaaviota saadaksesi visuaalisen käsityksen siitä, miten tietojoukot liittyvät toisiinsa. Mene Kaaviot> Hajota nähdäksesi miltä tietosi näyttävät:

Näet, että näistä tiedoista auton vuosi ei vaikuta arvoon kovinkaan paljon. Siellä lievä positiivinen suuntaus, mutta heikko. Tämän löysimme CORREL -toiminnolla.

Toinen hyödyllinen elementti scatterplotissa on trendiviiva, joka näyttää tältä:

Trendiviiva voi olla hyödyllinen, kun haluat tehdä korrelaation selväksi hajontakaaviossa. Napsauta Windowsissa Kaavion työkalut> Suunnittelu> Lisää kaavion elementti ja valitse trendiviiva . Macissa sinun on siirryttävä osoitteeseen Kaavion asettelu tai Kaavion suunnittelu , riippuen Excel -versiosta.

Ja älä unohda tarkistaa meidän opas loistavien kaavioiden tekemiseen Excelissä ennen kuin esität havaintoja!

Useiden muuttujien korrelaatio Data Analysis Toolpakin kanssa

Jos sinulla on monia erilaisia ​​numerosarjoja ja haluat löytää niiden välillä korrelaatioita, sinun on suoritettava CORREL -toiminto jokaisella yhdistelmällä. Data Analysis Toolpakin avulla voit kuitenkin valita useita tietojoukkoja ja nähdä, missä korrelaatiot ovat.

Etkö ole varma, onko sinulla Data Analysis Toolpak? Tutustu meidän perusteiden läpikäynti ladataksesi ja saadaksesi selville.

windows stop code irrotettava käynnistysvolyymi

Voit käynnistää Toolpakin siirtymällä osoitteeseen Tiedot> Tietojen analyysi . Näet luettelon vaihtoehdoista:

Valitse Korrelaatio ja lyödä OK .

Valitse avautuvassa ikkunassa kaikki tietojoukot Syöttöalue ruutuun ja kerro Excelille, mihin haluat sijoittaa tulokset:

Tässä on mitä saat, kun osut OK :

Yllä olevassa kuvassa olemme suorittaneet korrelaatioita neljällä eri aineistolla: vuosi, maailman väestö ja kaksi satunnaislukua.

Jokaisen tietojoukon korrelaatio itsensä kanssa on 1. Vuosi ja maailman väestö ovat erittäin vahvassa korrelaatiossa, kun taas muualla on erittäin heikkoja korrelaatioita, kuten odottaisimme satunnaisluvuilla.

miten löytää kuvan dpi

Korrelaatio vs. lineaarinen regressio Excelissä

Korrelaatio on yksinkertainen mitta: kuinka läheisesti kaksi muuttujaa liittyvät toisiinsa? Tällä mittarilla ei kuitenkaan ole ennustavaa tai syy -arvoa. Se, että kaksi muuttujaa korreloi, ei tarkoita, että toinen aiheuttaa muutoksia toisessa. Se on tärkeä asia ymmärtää korrelaatio.

Jos haluat esittää väitteen syy -yhteydestä, sinun on käytettävä lineaarista regressiota. Voit käyttää tätä myös Data Analysis Toolpakin kautta. (Tämä artikkeli ei kata yksityiskohtia lineaarisen regression toiminnasta, mutta on runsaasti ilmaisia ​​tilastoresursseja, jotka voivat opastaa sinut perusasioissa.)

Avaa Data Analysis Toolpak, valitse Regressio ja napsauta OK .

Täytä X- ja Y -alueet (X -arvo on selittävä muuttuja ja Y -arvo on arvo, jota yrität ennustaa). Valitse sitten minne haluat tulostesi menevän ja napsauta OK uudelleen.

Luku, johon haluat keskittyä, on selittävän muuttujasi p-arvo:

Jos se on alle 0,05, sinulla on vahva argumentti siitä, että muutokset X -muuttujassasi aiheuttavat muutoksia Y -muuttujaasi. Yllä olevassa kuvassa olemme osoittaneet, että vuosi on merkittävä ennustaja maailman väestöstä.

Lineaarinen regressio on myös hyödyllinen, koska se voi tarkastella useita arvoja. Tässä olemme käyttäneet regressiota nähdäksemme, ovatko vuosi ja väestö merkittävät raakaöljyn hinnan ennustajat:

Molemmat p-arvot ovat alle 0,05, joten voimme päätellä, että sekä vuosi että maailman väestö ovat merkittäviä raakaöljyn hinnan ennustajia. (Vaikka vahvat korrelaatiot X -muuttujien välillä voivat aiheuttaa omia ongelmia.)

Jälleen tämä on hyvin yksinkertainen selitys lineaariselle regressiolle, ja jos olet kiinnostunut syy -yhteydestä, sinun kannattaa lukea joitain tilastojen opetusohjelmia.

Mutta nyt sinulla on käsitys siitä, miten voit mennä yksinkertaisen korrelaation ulkopuolelle, jos etsit lisää tilastotietoja!

Paranna tietoja Excelistä

Excelin tilastojen perustoimintojen ymmärtäminen voi auttaa sinua saamaan paljon enemmän hyödyllistä tietoa tiedoistasi. Korrelaatio on yksinkertainen mitta, mutta siitä voi olla suurta apua, kun yrität väittää laskentataulukon numeroita.

Voit tietysti suorittaa monia muita monimutkaisempia toimenpiteitä. Mutta jos et ole tyytyväinen tilastoihin, haluat aloita perusasioista .

Käytätkö Excelin korrelaatiotoimintoa säännöllisesti? Mistä muista tilastollisista toiminnoista haluaisit oppia?

Jaa Jaa Tweet Sähköposti Tästä syystä FBI antoi varoituksen Hive Ransomware -ohjelmasta

FBI antoi varoituksen erityisen ikävästä ransomware -kannasta. Tästä syystä sinun on oltava erityisen varovainen Hive -lunnasohjelmista.

Lue seuraava
Liittyvät aiheet
  • Tuottavuus
  • Microsoft Excel
Kirjailijasta Sitten Albright(506 artikkelia julkaistu)

Dann on sisältöstrategia- ja markkinointikonsultti, joka auttaa yrityksiä luomaan kysyntää ja liidejä. Hän kirjoittaa myös blogia strategiasta ja sisältömarkkinoinnista osoitteessa dannalbright.com.

Lisää Dann Albrightilta

tilaa uutiskirjeemme

Liity uutiskirjeeseemme saadaksesi teknisiä vinkkejä, arvosteluja, ilmaisia ​​e -kirjoja ja ainutlaatuisia tarjouksia!

Klikkaa tästä tilataksesi